楼主: nandehutu2022
434 19

[量化金融] 生成多变量财务数据的虚拟场景 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

75%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
66.6166
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24498 点
帖子
4088
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Generating virtual scenarios of multivariate financial data for
  quantitative trading applications》
---
作者:
Javier Franco-Pedroso and Joaquin Gonzalez-Rodriguez and Jorge Cubero
  and Maria Planas and Rafael Cobo and Fernando Pablos
---
最新提交年份:
2018
---
英文摘要:
  In this paper, we present a novel approach to the generation of virtual scenarios of multivariate financial data of arbitrary length and composition of assets. With this approach, decades of realistic time-synchronized data can be simulated for a large number of assets, producing diverse scenarios to test and improve quantitative investment strategies. Our approach is based on the analysis and synthesis of the time-dependent individual and joint characteristics of real financial time series, using stochastic sequences of market trends to draw multivariate returns from time-dependent probability functions preserving both distributional properties of asset returns and time-dependent correlation among time series. Moreover, new time-synchronized assets can be arbitrarily generated through a PCA-based procedure to obtain any number of assets in the final virtual scenario. For the validation of such simulated data, they are tested with an extensive set of measurements showing a significant degree of agreement with the reference performance of real financial series, better than that obtained with other classical and state-of-the-art approaches.
---
中文摘要:
在本文中,我们提出了一种新的方法来生成任意长度和资产组合的多元金融数据的虚拟场景。通过这种方法,可以为大量资产模拟数十年的实际时间同步数据,生成各种场景,以测试和改进量化投资策略。我们的方法基于对真实金融时间序列的时间相关个体和联合特征的分析和综合,使用市场趋势的随机序列从时间相关概率函数中提取多元收益,同时保留资产收益的分布特性和时间序列之间的时间相关。此外,可以通过基于PCA的过程任意生成新的时间同步资产,以获得最终虚拟场景中的任意数量的资产。为了验证此类模拟数据,使用一组广泛的测量数据对其进行测试,显示出与真实金融系列的参考绩效有很大程度的一致性,优于使用其他经典和最先进的方法获得的一致性。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--
一级分类:Computer Science        计算机科学
二级分类:Computational Engineering, Finance, and Science        计算工程、金融和科学
分类描述:Covers applications of computer science to the mathematical modeling of complex systems in the fields of science, engineering, and finance. Papers here are interdisciplinary and applications-oriented, focusing on techniques and tools that enable challenging computational simulations to be performed, for which the use of supercomputers or distributed computing platforms is often required. Includes material in ACM Subject Classes J.2, J.3, and J.4 (economics).
涵盖了计算机科学在科学、工程和金融领域复杂系统的数学建模中的应用。这里的论文是跨学科和面向应用的,集中在技术和工具,使挑战性的计算模拟能够执行,其中往往需要使用超级计算机或分布式计算平台。包括ACM学科课程J.2、J.3和J.4(经济学)中的材料。
--
一级分类:Electrical Engineering and Systems Science        电气工程与系统科学
二级分类:Signal Processing        信号处理
分类描述:Theory, algorithms, performance analysis and applications of signal and data analysis, including physical modeling, processing, detection and parameter estimation, learning, mining, retrieval, and information extraction. The term \"signal\" includes speech, audio, sonar, radar, geophysical, physiological, (bio-) medical, image, video, and multimodal natural and man-made signals, including communication signals and data. Topics of interest include: statistical signal processing, spectral estimation and system identification; filter design, adaptive filtering / stochastic learning; (compressive) sampling, sensing, and transform-domain methods including fast algorithms; signal processing for machine learning and machine learning for signal processing applications; in-network and graph signal processing; convex and nonconvex optimization methods for signal processing applications; radar, sonar, and sensor array beamforming and direction finding; communications signal processing; low power, multi-core and system-on-chip signal processing; sensing, communication, analysis and optimization for cyber-physical systems such as power grids and the Internet of Things.
信号和数据分析的理论、算法、性能分析和应用,包括物理建模、处理、检测和参数估计、学习、挖掘、检索和信息提取。“信号”一词包括语音、音频、声纳、雷达、地球物理、生理、(生物)医学、图像、视频和多模态自然和人为信号,包括通信信号和数据。感兴趣的主题包括:统计信号处理、谱估计和系统辨识;滤波器设计;自适应滤波/随机学习;(压缩)采样、传感和变换域方法,包括快速算法;用于机器学习的信号处理和用于信号处理应用的机器学习;网络与图形信号处理;信号处理中的凸和非凸优化方法;雷达、声纳和传感器阵列波束形成和测向;通信信号处理;低功耗、多核、片上系统信号处理;信息物理系统的传感、通信、分析和优化,如电网和物联网。
--

---
PDF下载:
--> Generating_virtual_scenarios_of_multivariate_financial_data_for_quantitative_tra.pdf (2.19 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:财务数据 多变量 Applications Quantitative Multivariate

沙发
大多数88 在职认证  发表于 2022-6-6 20:17:16 |只看作者 |坛友微信交流群
O R I G I N A L A R T I C L e生成用于定量交易应用的多元金融数据的虚拟场景Javier Franco Pedroso | Joaquin Gonzalez Rodriguez | Jorge Cubero | Maria Planas | Rafael Cobo | Fernando PablosAudias Research Group,EscuelaPolitécnica Superior,Universidaudaotóde Madrid,28049,SpainETS Asset Management Factory,Pozuelode AlarcóN,Madrid,28223,SpainCorrespondenceJavier Franco Pedroso,Despacho C-215,Escuela Politécnica Superior,Universidauto de Madrid,马德里,28049,SpainEmail:javier。franco@uam.esFundinginformationETS资产管理工厂,项目名称:“Tecnologías de tratamiento de se~nalpara mercados fifinanciaros”和资产构成。通过这种方法,可以为大量资产模拟数十年的realistictime同步数据,生成各种场景,以测试和改进与时间相关的个人和联合特征的定量合成回报以及时间序列之间的时间相关。此外,通过基于PCA的程序,在最终虚拟场景中获取任意数量的资产。为了验证这些模拟数据,使用一组广泛的测量数据对其进行测试,这些测量结果显示与真实金融序列的参考绩效有很大程度的一致性,优于使用其他经典和最先进的方法获得的一致性。K E Y W O R D符号特性;多元时间序列;财务工程;资产模拟缩写:PCA,概率成分分析。arXiv:1802.01861v1【q-fin.CP】2018年2月6日JAVIER FRANCO-PEDROSO ET AL.1 |简介目前,定量分析和基于算法的投资在股票市场上有着相关的存在,其中高比例的交易订单目前由计算金融驱动。

使用道具

藤椅
大多数88 在职认证  发表于 2022-6-6 20:17:19 |只看作者 |坛友微信交流群
这些系统利用了不足之处,通过动态调整投资组合权重,检测和利用时间和资产本地化的机会,或在不确定的情况下管理风险。显然,给定市场的财务数据只有一个历史记录。该记录是已经开发和测试的唯一策略,我们知道它在历史记录的某些特定时期的表现,但无法知道算法策略在未知场景中的表现,不同于金融时间序列的合理实现,为了测试当前量化金融市场的稳健性和表现,涉及数百或数千项资产,时间段为任意长度,可用于上述目的。自相关等。因此,我们在第2节中首先介绍了一组指标,这些指标试图捕获并验证根据这些健全性检查“约束”生成的艺术系列,无论其生成过程如何。将为我们的基准数据集报告这些测量结果,该数据集包括16年期的dailystock回报,以便与使用不同方法获得的模拟情景进行比较。为了生成高维多元金融数据集的虚拟场景,根据第2节之前描述的一组分析,将重点介绍未能再现其某些弱点的情况。具有此类时间相关参数的概率密度函数。这样,资产收益率的分布特性和时间序列之间的时间相关性都在很大程度上得到了正确的再现。JAVIER FRANCO-PEDROSO等人。

使用道具

板凳
大多数88 在职认证  发表于 2022-6-6 20:17:22 |只看作者 |坛友微信交流群
3(a)(b)本工作中解决的F I G U R E 1挑战(R表示来自S资产的T返回值矩阵):(a)从给定数据集R(S×T)获得长期虚拟场景R’(S×T’),(b)从agiven数据集R(S×T)获得更大的数据集R’(S’×T)。之前发表的任何研究中均未提及。这项工作的贡献。2 |模拟金融时间序列的评估不同的模拟方法再现其特性。4 JAVIER FRANCO-PEDROSO ET AL.2.1 |数据集描述和2016年4月29日,一组330只股票在给定时期内的某个时间已成为标准普尔500指数的一部分。p(t=0)=1本文将使用代表性来说明真实和模拟的金融时间序列。(a) 330股票数据集。(b) 等权重市场指数。图中显示了我们330个资产数据集(a)的F I G U R E 2时间序列,其中包括作为标准普尔500指数at(上面板)和收益(下面板)序列一部分的股票。我们特定数据集的等权重市场指数。2.2 |金融时间序列的经验特性2.2.1 |分布特性随机变量。在这项工作中,我们将在可以获得数据的不同统计数据中考虑简单回报率Rt。这种行为通常通过测量Rt分布的峰度来量化,这反映了偏差Javier FRANCO-PEDROSO等人5,这是单变量正态分布的峰度值。图3(a)显示了数据集(Adobe Systems Inc.)中特定股票的收益序列,而图3(b)显示了较大的峰度值。如图4(a)所示,这是我们数据集中的一个总体趋势,其中绘制了所有330只股票的峰度值分布图。(a) 返回时间序列。(b) 收益分配。为了便于比较,还绘制了F I G U R E 3分布图。

使用道具

报纸
nandehutu2022 在职认证  发表于 2022-6-6 20:17:25 |只看作者 |坛友微信交流群
该特定时间序列的峰度值为12.84,倾斜度值为0.04。负值表示左尾巴更长或更胖。对于一元正态分布,偏度值为0。资产回报率的偏态是正是负似乎取决于所分析的金融系列的类型(Albuquerque(2012)):虽然市场指数的偏态值为负,但仍会向正值转变(但也会呈现负值)。随时间的变化取决于不同时期的波动情况,因此本研究还将使用滚动指标,以说明资产回报分布形状的时变动态。2.2.2 |相关性属性另一个众所周知的事实是,资产收益率不存在显著的线性自相关,除了非常短的6 JAVIER FRANCO-PEDROSO等人(a)峰度。(b) 偏斜度。F I G U R E我们的标准普尔500 330股票数据集中峰度(a)和偏度(b)值的4个方框图。一些收益的非线性函数,如绝对或平方收益,确实存在显著的自相关,通常与众所周知的波动率聚集现象有关。这一特性可以概括为“价格变动幅度较大的情况下,价格变动幅度较大的情况更容易发生”。股票如图所示,资产收益的自相关迅速衰减为零(图5(a)),而平方收益为收益,绝对收益为100滞后),并绘制结果值的分布图(见图6)。如上所述,之前对特定股票的观察对整个数据集都适用。2.2.3 |路径属性Bakhach等人(2016)定义的两个连续方向变化(DC)点。

使用道具

地板
大多数88 在职认证  发表于 2022-6-6 20:17:28 |只看作者 |坛友微信交流群
然而,在这项工作中,目标如下:o在第4.1节所述方法的分析阶段分割历史数据集。JAVIER FRANCO-PEDROSO等人,7(a)ACF收益。(b) 绝对回报的ACF。Adobe Systems股份有限公司股票收益率(a)和绝对收益率(b)的5样本自相关函数(ACF)。还显示了置信限(±0.0312)。(a) 返回。(b) 绝对回报。F I G U R E 6返回数据集中每个股票的(b)。对于回报,考虑了前20个滞后,而绝对回报平均为100个滞后比较在真实数据集和模拟数据集中观察到的趋势数量以及从中得出的指标。图7(a)显示了Adobe Systems股份有限公司股票在1500天内检测到的趋势示例。而平静期(3000天至3500天)呈现的趋势数量要少得多。8 JAVIER FRANCO-PEDROSO等人(a)价格系列和检测趋势。(b) 趋势比率的分布。F I G U R E 7检测到Adobe Systems股份有限公司股票(a)在1500天内的趋势,以及相应趋势比率的方框图(b)。时间段。然后可以绘制给定时间序列的趋势比值分布图,显示图7(a)所示的高产量3000和3500天。2.2.4 |跨资产关系虽然个人艺术资产必须具有与真实资产相似的单变量特征,但这并不充分,因为投资策略通常涉及大量资产。因此,也有必要从真实市场进行整体设置。量化这些交叉资产关系最直接的方法是计算通常称为相关图的系数。

使用道具

7
kedemingshi 在职认证  发表于 2022-6-6 20:17:32 |只看作者 |坛友微信交流群
对于我们的标准普尔500 330股票数据集,可以在图8中看到这种表示。尽管给定市场可能呈现平均持有资产之间的相关性(例如,属于同一行业的公司),但这些相关性通常随时间动态变化。例如,beenJAVIER FRANCO-PEDROSO ET AL.9F I G U R E 8我们的标普500 330股票数据集之间的相关性图。波动期。(a) 低波动期。(b) 高波动期。F I G U R E 9(a)介于1000天和1500天之间(参见图2中的时间序列),高波动期(b)介于2000天和2500天之间。为了量化这种跨资产关系的动态行为,将使用给定资产集的同等加权市场指数来确定以下指标,因为该时间序列取决于不同资产之间的关系:o聚合将导致呈现更少趋势的平滑路径。10 JAVIER FRANCO-PEDROSO ET AL.o与同等加权市场指数的方向相同(向上或向下),从而反映了不同金融系列之间的时间相关性。一天的阶梯式五天滑动窗口用于获得市场指数的移动平均价格,对于每个窗口,价格在给定市场中占资产百分比的资产百分比在几个时间段内变得相关,这是艺术资产的预期行为。(a) 时间演化。

使用道具

8
何人来此 在职认证  发表于 2022-6-6 20:17:36 |只看作者 |坛友微信交流群
(b) 箱线图分布。F I G U R E 1 0我们的等权重330股票市场的方向相似值的时间演化(a)和方框图(b)。3 |随机模型作为模拟方法的评估3.1 |经典随机模型我们定义了金融时间序列的一些特性,我们可以继续测试一些模拟方法(GBM),因为它是著名的Black-Scholes模型的核心(Black and Scholes(1973);默顿(1973))。该方法将股票价格的演化描述为一个基于维纳过程(或布朗运动)、百分比漂移和百分比波动率的随机微分方程(SDE),其分别被视为常数并等于历史平均收益率和标准差。JAVIER FRANCO-PEDROSO等人(The MathWorks(2016))实施GBM。图11(a)显示了模拟路径的返回时间序列。如图11(b)所示,GBM显然无法再现股票收益的超额峰度,因为所有收益时间都再现了波动性聚类特征,这是由观察具有时变方差的样本集产生的。这可以通过图11(a)的简单目视检查看出,但在评估绝对收益的自相关函数时也会反映出来(见图12(b)),其中即使是很小的时滞值,也会观察到缺乏自相关。当使用基于SDE的其他变量时,也会得到类似的结果。(a) 返回时间序列。(b) 收益分配。通过GBM的模拟路径的模拟回波时间序列(a)及其分布(b)。该特定时间序列的峰度值为2.98,偏度值为-0.03.3.2 |波动率模型技术(例如。

使用道具

9
nandehutu2022 在职认证  发表于 2022-6-6 20:17:39 |只看作者 |坛友微信交流群
马尔可夫链蒙特卡罗方法)来计算参数的似然函数。虽然这两种类型的模型都可以用来模拟资产回报或价格,但很少有公开的实现(基于GBM模拟路径的期权价格)。其中大多数都基于广义ARCH(GARCH)模型,其中方差还取决于方差本身的前一个值。在下一个示例中,p=112 JAVIER FRANCO-PEDROSO ET AL.(a)收益的ACF。(b) 绝对回报的ACF。F I G U R E 1 2返回(a)的样本自相关函数(ACF)和通过GBM的模拟路径的绝对返回(b)的示例。显示了20个滞后。(a) 返回时间序列。(b) 收益分配。F I G U R E 1 3特定时间序列的峰度值为4.44,偏度值为-0.06。q=1由图14(b)中所示的绝对收益的自相关确定,而收益仍然不相关(图1)针对这种时变波动性。JAVIER FRANCO-PEDROSO ET AL.13(a)收益的ACF。(b) 绝对回报的ACF。F I G U R E 1 4通过GARCH(1,1)的模拟路径的收益(a)和绝对收益(b)的样本自相关函数(ACF)示例。显示了20个滞后。(a) 峰度值的分布。(b) 偏度值的分布。F I G U R E 1 5通过180天的滑动窗口执行,连续窗口之间有175天的重叠。速度低于实际股票,或者需要不同的收益分配创新。更好地复制,如图16(b)所示。然而,对于时间相关分析,滚动峰度的方差14 JAVIER FRANCO-PEDROSO ET AL.(a)返回时间序列。(b) 收益分配。F I G U R E 16学生的创新。该特定时间序列的峰度值为9.21,偏度值为-0.06。(a) 峰度值的分布。

使用道具

10
可人4 在职认证  发表于 2022-6-6 20:17:42 |只看作者 |坛友微信交流群
(b) 偏度值的分布。F I G U R E 1 7通过带Student变换的GARCH(1,1)的模拟路径的峰度(a)和偏度(b)的滚动。时间分析通过180天的滑动窗口进行,相邻窗口之间有175天的重叠。库存(图17(b))。此外,由于GARCH型模型只考虑统计特性,因此趋势比值非常罕见,如图18(b)所示。JAVIER FRANCO-PEDROSO等人15(a)发现了价格序列(上面板)和收益序列(下面板)的趋势。(b) 趋势比率箱线图。F I G U R E 1 8通过GARCH(1,1)和学生t创新(a)以及相应趋势比率(b)的分布,在模拟路径上检测趋势。3.3 |多元波动率模型(2006年))在试图将模型参数拟合到高维数据时存在实际困难。一些VariantsPQ高度参数化模型,因此在实践中使用受限版本,以缓解过度拟合问题并降低计算成本。在以下示例中,MFE工具箱(Sheppard(2013))中实现的BEKK模型已与参数sp=1和q=1一起使用,以模拟多元数据中的资产回报。由于我们的标准普尔500 330股票数据集的计算成本很高。这类模型的维数灾难最具说明性的例子是(图19(a))、5(图19(b))和10只股票(图19(c))。样本绝对自相关系数增加的股票,波动率聚类的重现性较差,这反映在绝对收益率的自相关系数较低。4 |多元数据虚拟场景的生成如前几节所示,艺术金融系列必须遵守许多约束,而不是JAVIER FRANCO-PEDROSO等人(a)2资产模型中股票的ACF。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-9-17 14:40