楼主: 可人4
1604 35

[量化金融] 响应面排序的深度学习及其在优化中的应用 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

76%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
48.9243
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24465 点
帖子
4070
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-6-11 09:41:49 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Deep Learning for Ranking Response Surfaces with Applications to Optimal
  Stopping Problems》
---
作者:
Ruimeng Hu
---
最新提交年份:
2020
---
英文摘要:
  In this paper, we propose deep learning algorithms for ranking response surfaces, with applications to optimal stopping problems in financial mathematics. The problem of ranking response surfaces is motivated by estimating optimal feedback policy maps in stochastic control problems, aiming to efficiently find the index associated to the minimal response across the entire continuous input space $\\mathcal{X} \\subseteq \\mathbb{R}^d$. By considering points in $\\mathcal{X}$ as pixels and indices of the minimal surfaces as labels, we recast the problem as an image segmentation problem, which assigns a label to every pixel in an image such that pixels with the same label share certain characteristics. This provides an alternative method for efficiently solving the problem instead of using sequential design in our previous work [R. Hu and M. Ludkovski, SIAM/ASA Journal on Uncertainty Quantification, 5 (2017), 212--239].   Deep learning algorithms are scalable, parallel and model-free, i.e., no parametric assumptions needed on the response surfaces. Considering ranking response surfaces as image segmentation allows one to use a broad class of deep neural networks, e.g., UNet, SegNet, DeconvNet, which have been widely applied and numerically proved to possess high accuracy in the field. We also systematically study the dependence of deep learning algorithms on the input data generated on uniform grids or by sequential design sampling, and observe that the performance of deep learning is {\\it not} sensitive to the noise and locations (close to/away from boundaries) of training data. We present a few examples including synthetic ones and the Bermudan option pricing problem to show the efficiency and accuracy of this method.
---
中文摘要:
在本文中,我们提出了响应曲面排序的深度学习算法,并将其应用于金融数学中的最优停止问题。响应面排序问题的动机是在随机控制问题中估计最优反馈策略图,目的是在整个连续输入空间$\\数学{X}\\子类Q \\数学{R}^d$中有效地找到与最小响应相关的索引。通过将$\\数学{X}$中的点作为像素,将最小曲面的索引作为标签,我们将该问题重新描述为一个图像分割问题,该问题为图像中的每个像素指定一个标签,使得具有相同标签的像素共享某些特征。这为有效解决问题提供了一种替代方法,而不是在我们之前的工作中使用顺序设计【R.Hu和M.Ludkovski,SIAM/ASA不确定性量化杂志,5(2017),212-239】。深度学习算法具有可扩展性、并行性和无模型性,即响应面无需参数假设。将响应面排序作为图像分割,可以使用一类广泛的深层神经网络,如UNet、SegNet、DECOVNET,这些网络在该领域已得到广泛应用,并经数值证明具有较高的精度。我们还系统地研究了深度学习算法对均匀网格或顺序设计抽样生成的输入数据的依赖性,并观察到深度学习的性能对噪声和训练数据的位置(接近/远离边界)不敏感。我们给出了几个例子,包括合成的例子和百慕大期权定价问题,以证明该方法的有效性和准确性。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
PDF下载:
--> Deep_Learning_for_Ranking_Response_Surfaces_with_Applications_to_Optimal_Stoppin.pdf (1.36 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:深度学习 响应面 Applications Segmentation Quantitative

沙发
mingdashike22 在职认证  发表于 2022-6-11 09:41:55
响应面排序的深度学习及其在最优停止问题中的应用*2020年3月12日摘要在本文中,我们提出了用于排列响应曲面的深度学习算法,并将其应用于金融数学中的最优停止问题。rankingresponse surfaces问题的动机是估计随机控制问题中的最优反馈策略图,目的是高效地找到与整个连续输入空间X中的最小响应相关的指数 Rd.通过将X中的点视为像素,将最小曲面的索引视为标签,我们将该问题重新描述为图像分割问题,即为图像中的每个像素指定一个标签,使具有相同标签的像素共享某些特征。这为有效解决问题提供了一种替代方法,而不是在我们之前的工作中使用顺序设计【R.Hu和M.Ludkovski,SIAM/ASA Journalon Uncertability Quantification,5(2017),212–239】。深度学习算法具有可扩展性、并行性和无模型性,即响应面无需参数假设。将响应面作为图像分割进行排序,可以使用一类广泛的深层神经网络(NNs),例如前馈NNs、UNet、SegNet、DECOVNET,这些网络在该领域已得到广泛应用,并通过数值证明具有良好的拓扑性能。我们还系统地研究了深度学习算法对均匀网格或顺序设计抽样生成的输入数据的依赖性,并观察到深度学习的性能对噪声和训练数据的位置(靠近/远离边界)不敏感。我们给出了几个例子,包括合成的例子和百慕大期权定价问题,以说明该方法的有效性和准确性。

藤椅
能者818 在职认证  发表于 2022-6-11 09:41:58
我们还模拟了一个十维的例子来说明其鲁棒性,而非学习算法通常在如此高的维上有困难。关键词:响应面排序、深度学习、UNet、最优停止、百慕大选择1简介我们首先介绍排序面响应问题的一般设置,然后描述与随机控制问题和相关文献的联系。为了一致性的目的,我们将使用与之前工作中相同的概念,并请感兴趣的读者参考,以了解问题背景的更多细节。表示u`:Rd 十、→ R、 `∈ L≡ {1,2,…,L}作为Rd子集X上的光滑函数。曲面排序问题在于将最小曲面的索引分配给整个(通常是连续的)空间X中的每个输入X,即,在查找分类c(X):=arg min `{u`(X)}∈ Lx个∈ 十、 Rd.(1.1)函数u`是先验未知的,但可以进行噪声采样,即对于任何x∈ X,`∈ 五十、 你可以通过随机取样器Y`(x):Y`(x)=u`(x)+访问u`(x)`(x) ,`∈ 五十、 (1.2)*纽约哥伦比亚大学统计系,邮编:10027-4690,rh2937@columbia.edu.where `’s是均值为零、方差σ`(x)的独立随机变量。换句话说,可以用蒙特卡罗方法对X上的L光滑超曲面进行采样。我们对使用深度学习算法精确估计C(x)感兴趣。假设Cdl(x)是深度学习算法产生的分类器,为了研究不同网络架构和实验设计的性能,我们通过以下损失度量来评估差异:L(C,Cdl)=ZX{C(x)6=Cdl(x)}λ(dx),(1.3)其中λ(dx)∈ P(X)是X上的一个概率度量,指定了不同区域的相对重要性。注意,当λ(dx)=U(X)是统一度量时,L给出了错误标记百分比。

板凳
能者818 在职认证  发表于 2022-6-11 09:42:01
这本质上是深度学习中的准确度指标,通常是用来判断神经网络模型/架构性能的第一个指标。为了在动态规划的背景下解释(1.2),可以将x视为系统状态,`作为控制器可用的各种动作的指数,u`(·)作为预期成本,以及`(·)由于对基础随机系统和相应成本进行路径评估而产生的模拟噪声。在下文中,我们将澄清这种关系。动机我们考虑以下随机控制问题,并设X(·)≡ Xu(·)是一个受马尔可夫策略控制的离散时间随机状态过程u0:T-1.∈ LT,以下xut+1=F(Xt,ut,εt+1),t∈ {0,1,···,T- 1} ,对于某些贴图F:X×L×R→ X和一些中心独立噪声源εt+1。注意,我们使用一个下标t来表示时间t的过程值,并使用t:t来强调从t到t的整个{Ft}适应过程,Ft=σ(ε,…εt)。一般来说,要最小化的成本的形式为c(0,u0:T)=TXt=0g(T,Xut,ut),(1.4),其中g(T,·,ut)表示使用策略ut的T阶段的运行成本。通过定义valuefunctionV(t,x):=输入:t∈书信电报-t+1Et,x[c(t,ut:t)],其中Et,x[·]=E[·| Xt=x]表示期望给定条件x,最小成本由V(0,x)表示,相应的最优策略由最小u*0:T。使用动态规划(例如[8]),V(T,x)满意度:V(T,x)=infu∈L{g(t,x,u)+Et,x[V(t+1,Xut+1)]}。通过引入术语uu(t,x),在【33】中称为Q值:uu(t,x)=g(t,x,u)+Et,x【V(t+1,Xut+1)】,u∈ 五十、 (1.5)与问题(1.1)–(1.2)的联系现在变得清晰。对于每个u∈ 五十、 Q值uu(t,x)表示对应于动作u的预期成本,是(1.2)中的响应面。

报纸
大多数88 在职认证  发表于 2022-6-11 09:42:05
对于固定t,找到最佳策略图x 7→ u*(t,x)相当于将(1.1)中的分类识别为V(t,x)=infu∈L{uu(t,x)}。然后,这个随机控制问题V(0,x)可以通过向后识别u来解决*(s,·),即通过求解从T阶段到1阶段的形式(1.1)的T排序问题。更准确地说,假设时间t后的策略图,表示为{u(s,·)}Ts=t+1,区域已经生成,那么{u(t,·)是通过在不同的u上排名(1.5)来确定的,其中Et,x[V(t+1,Xut+1)]是通过沿轨迹x(t+1)平均成本(1.4):t遵循策略{u(s,·)}Ts=t+1来估计的。原则上,这种方法适用于任何随机控制问题,包括具有连续策略的连续时间框架,因为时间和策略空间都可以通过离散化来近似。然而,当动作数量有限且很小时,它尤其具有吸引力。例如,在最优停止问题[24]中,动作空间只有两个元素L={stop,continue},并且通常免费获得即时奖励ustop,从而导致仅模拟连续值ucont.(t,x)。这种情况下的一个典型例子是百慕大型期权的定价【43】。需要评估多个表面u`的应用来自定价摇摆期权【47】、能源市场决策【1,38】(即决定是否扩大生产力、开发新能源或什么都不做)、流行病管理【41,44,45,48】,等等。主要方法和贡献。我们的主要贡献是提出了一种通过深度学习算法求解(1.1)的替代策略。其关键思想是建立一个神经网络(NN),让它通过模拟数据学习自己解决感兴趣的问题。这种学习过程称为神经网络的训练,可能很耗时。

地板
mingdashike22 在职认证  发表于 2022-6-11 09:42:19
然而,一旦准确地完成了这项工作,就可以在计算上有效地解决相同类型的问题。在我们的例子中,这就是说,一旦我们使用某些模拟数据Y`(x)及其标签来训练神经网络并获得所需的精度,新位置x的预测分类器CDLO将是瞬时的,并且主要通过矩阵向量乘法运算来准确。因此,NN是求解(1.1)的理想方法。排序响应曲面的问题相当于将整个输入空间xin划分为通过标签(最小曲面的索引)区分的部分。我们观察到,如果将x视为一个图像,那么标记函数C本质上将图像划分为不相交的部分。这意味着人们可以将这个问题表述为图像分割,深度学习已经取得了成功,并成为现代机器学习社区中一个主要而强大的工具【39,54,52】。同时,通过分析相应的平均场最优控制问题,也发展了关于深度神经网络(NNs)的数学理论,例如,当神经元/层的数量趋于一致时,NN产生的结果是否会收敛到基本真理【17】。与我们之前的工作【33】相比,响应面由高斯过程建模,深度学习算法的优势在于它是无模型的,也就是说,它们使predictedlabels^C不再依赖于u′的特定参数化。此外,通过数值研究,我们发现神经网络算法还具有以下优点:o对采样位置不敏感。当Cdlare在X×L上产生均匀样本与顺序设计样本时,损失L是可比较的。那么,就实现复杂性和并行能力而言,均匀样本更可取它可以自动检测错误的输入。

7
nandehutu2022 在职认证  发表于 2022-6-11 09:42:22
由于u`只能由其随机采样器Y `访问,因此训练输入标签为arg min`∈LY `,其中肯定包含错误的标签,尤其是在边界周围。NN将尝试不正确学习这些标签,并且可以自动忽略这些输入。相关文献。从数学上讲,可以将(1.1)视为输入X上的分区=∪Li=1Ci:Ci:={x∈ X,C(X)=i},i∈ 五十、 该问题与Ci,已通过多种顺序方法进行了广泛研究[24、49、50]。对于每一个x,确定最小响应的目标对应于多武装匪徒(MAB)问题。将曲面u`(x)视为强盗的L arms奖励,那么(1.1)相当于探索极端强盗[11、12、18、28]。统计上,对于u′的易于处理的近似值,提出了各种模型,包括高斯过程(GP)[33]、BART[14]、动态树[27]、树状GPs[26]、局部GPs[23]、基于粒子的高斯过程[25]、带Student-t噪声的GPs和t过程[46]。让我们提及与我们的论文相关的两项最新工作。在我们之前的工作【33】中,问题(1.1)是在u`的GP建模下解决的,具有不同的损失度量:L(^C,C):=ZXn^C(x)(x)- uC(x)(x)oλ(dx)。这是u`的边际估计和分类之间的混合标准。损失与真实最小曲面和估计最小曲面之间的差异成正比,只要最小响应不变,估计误差就为u。而在本文中,我们没有对u`进行模型假设,并将(1.1)视为纯粹的分类/细分问题。在[4]中,Becker、Cheridito和Jentzen使用深度学习直接解决了最优停止问题。

8
kedemingshi 在职认证  发表于 2022-6-11 09:42:30
他们通过三个完全连接层的前馈神经网络最大化停止的payoffalongeach蒙特卡罗路径,学习最优停止规则。与[4]中的结果相比,我们的工作有两个不同之处。一方面,我们的问题设置(1.1)更一般,最优停止问题只是排序响应曲面的应用;另一方面,我们工作的重点是神经网络的体系结构,即通过将最佳停止作为图像分割问题,允许使用计算机科学文献中设计用于图像分割的具有精细体系结构的更广泛的网络(例如卷积神经网络[54]、UNet[52,29]、SegNet[3]),从中可以根据经验选择最佳性能。请注意,据我们所知,文献中没有严格讨论哪种体系结构可以产生最佳的图像分割性能的现有结果。论文的组织结构。论文的其余部分组织如下:第二节介绍了网络模型和深度学习算法的设计。在第3节中,我们通过排名响应曲面的一维、二维和十维示例测试了深度学习的性能,并系统地研究了深度学习算法对均匀或顺序设计采样生成的输入数据质量的依赖性。我们在第4节中将深度学习算法应用于百慕大期权定价,并在第5.2节中做出结论性评论神经网络和深度学习算法由人脑中的神经元激发,神经网络(NNs)是为计算机设计的,用于从观测数据中学习。深度学习算法是在神经网络中实现精确高效学习的技术。

9
mingdashike22 在职认证  发表于 2022-6-11 09:42:34
对于图像识别、自然语言处理、边界检测、图像分类和分割等有趣的问题,神经网络和深度学习目前提供了最好的解决方案。接下来,我们将简要介绍神经网络中的基本概念及其工作原理。第2.2节专门讨论排名问题(1.1)的算法。2.1深入学习的准备工作我们从一些术语开始。基本上,NNs是由层组成的。每一层包含一个神经元的数量。具有不同功能或神经元结构的层被称为不同的层,包括完全连接层、组成层、池层、复发层等。下面的图1是一个简单的前馈神经网络,具有三个完全连接层,其中节点表示神经元,箭头表示信息流。如图所示,信息不断地从一层“前馈”到下一层。第一层(最左边的列)称为输入层,最后一层(最右边的列)称为输出层。中间的层称为隐藏层,因为它们与外部世界没有联系。在这种情况下,只有一个隐藏层有四个神经元。图1:一个简单的前馈神经网络的图示。现在,我们解释NN如何从数据中学习。对于完全连接的层,每个神经元都有两种参数,权重w和偏差b。输入x通过神经元输出sf(w·x+b),其中f是激活函数。在上图中,NN、x、x和x表示神经网络的输入。隐藏层中的节点将x=(x,x,x)作为输入,输出j=f(wj·x+bj),j=1,···,4,wj=(wj,1,wj,2,wj,3)。然后将其视为输出层的输入,z=f(wz·y+bz)。

10
能者818 在职认证  发表于 2022-6-11 09:42:37
基于训练数据集,即已知的输入和期望输出对z(x),神经网络的学习是为了找到最佳权重和偏差,以便网络的输出很好地近似于所有训练输入x的z。从数学上讲,这是通过最小化一些损失函数来实现的,例如,均方损失:c(w,b)=2nXxkz(x)- zk,(2.1),其中(w,b)表示网络中所有权重和偏差的集合,n是训练输入的总数。根据神经网络的深度和大小,训练可能需要数小时。然而,当这样做时,即获得最佳或接近最佳的参数,从新输入轴进行预测是有效的,因为它主要是矩阵向量乘法。激活功能。常用的类型有sigmoid、Tanh、ReLU、Leaky ReLU、softmax等。层与层之间的激活功能不一定相同,而对于输出层,一些类型通常比其他类型工作得更好。例如,在二进制分类问题中,常见的选择是sigmoid函数f(x)=1+e-x、 因为它将实值输入映射到[0,1]。对于多类分类,通常首选将RDA映射到概率单纯形的softmax函数。在这两种情况下,输出都被解释为属于其中一个类别的可能性。损失函数。根据不同的目标,损失函数的形式可能有所不同,包括均方误差(MSE)、平均绝对误差、Kullback-Leibler(KL)散度、`范数、`范数、交叉熵、铰链到平方铰链。MSE损失通常更适合于回归问题,而交叉熵和铰链通常用于分类问题。此外,Lor调节有时会添加到损失函数中,以帮助减少过盈。优化器。在(2.1)中找到最佳权重和偏差通常是一个高维优化问题。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-26 12:31