楼主: 能者818
1103 20

[量化金融] 揭示非平稳随机变量的演化 [推广有奖]

  • 0关注
  • 6粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
39.5640
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24699 点
帖子
4115
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2024-12-24

楼主
能者818 在职认证  发表于 2022-5-9 09:28:01 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Uncovering the evolution of non-stationary stochastic variables: the
  example of asset volume-price fluctuations》
---
作者:
Paulo Rocha, Frank Raischel, Jo\\~ao P. Boto, Pedro G. Lind
---
最新提交年份:
2015
---
英文摘要:
  We present a framework for describing the evolution of stochastic observables having a non-stationary distribution of values. The framework is applied to empirical volume-prices from assets traded at the New York stock exchange. Using Kullback-Leibler divergence we evaluate the best model out from four biparametric models standardly used in the context of financial data analysis. In our present data sets we conclude that the inverse $\\Gamma$-distribution is a good model, particularly for the distribution tail of the largest volume-price fluctuations. Extracting the time-series of the corresponding parameter values we show that they evolve in time as stochastic variables themselves. For the particular case of the parameter controlling the volume-price distribution tail we are able to extract an Ornstein-Uhlenbeck equation which describes the fluctuations of the largest volume-prices observed in the data. Finally, we discuss how to bridge from the stochastic evolution of the distribution parameters to the stochastic evolution of the (non-stationary) observable and put our conclusions into perspective for other applications in geophysics and biology.
---
中文摘要:
我们提出了一个框架来描述具有非平稳分布的随机观测值的演化。该框架适用于纽约证券交易所交易资产的经验成交量价格。利用库尔贝克-莱布勒散度,我们从金融数据分析中标准使用的四个双参数模型中评估出最佳模型。在我们目前的数据集中,我们得出结论,逆$\\Gamma$分布是一个很好的模型,尤其是对于最大量价波动的分布尾部。通过提取相应参数值的时间序列,我们证明了它们本身是随时间演化的随机变量。对于控制成交量价格分布尾部的参数的特殊情况,我们可以提取一个描述数据中观察到的最大成交量价格波动的Ornstein-Uhlenbeck方程。最后,我们讨论了如何从分布参数的随机演化过渡到(非平稳)可观测的随机演化,并展望了我们的结论在地球物理和生物学中的其他应用。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Physics        物理学
二级分类:Data Analysis, Statistics and Probability        数据分析、统计与概率
分类描述:Methods, software and hardware for physics data analysis: data processing and storage; measurement methodology; statistical and mathematical aspects such as parametrization and uncertainties.
物理数据分析的方法、软硬件:数据处理与存储;测量方法;统计和数学方面,如参数化和不确定性。
--

---
PDF下载:
--> Uncovering_the_evolution_of_non-stationary_stochastic_variables:_the_example_of_.pdf (650.68 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:随机变量 非平稳 distribution Fluctuations Applications

沙发
nandehutu2022 在职认证  发表于 2022-5-9 09:28:06
揭示非平稳随机变量的演变:资产量-价格波动的例子保罗·罗查,1,2兰克·莱舍尔,乔!,葡萄牙里斯本大学地球物理中心里斯本2号,1749-016葡萄牙里斯本1749-016葡萄牙里斯本风能研究中心,物理研究所,卡尔·冯·奥塞茨基奥尔登堡大学,德26111奥尔登堡,德国奥斯纳布大学物理研究所,德国(日期:2018年10月2日)我们提出了一个框架,用于描述具有非平稳值分布的随机观测值的演化。该框架适用于纽约证券交易所交易资产的经验成交量价格。利用库尔贝克-莱布勒散度,我们从金融数据分析中标准使用的四个双参数模型中评估出最佳模型。在我们目前的数据集中,我们得出结论,逆Γ分布是一个很好的模型,尤其是对于最大量价波动的分布尾部。通过提取相应参数值的时间序列,我们证明了它们本身是作为随机变量随时间演化的。对于控制批量价格分布的参数的特殊情况,我们能够提取一个Ornstein-Uhlenbeck方程,该方程描述了数据中最大批量价格的变化。

藤椅
可人4 在职认证  发表于 2022-5-9 09:28:10
最后,我们讨论了如何从分布参数的随机演化过渡到(非平稳)可观测的随机演化,并展望了我们的结论在地球物理学和生物学中的其他应用。PACS编号:89.65。Gh,02.50。Fz,05.45。Tp,05.10。关键词:非平稳系统,朗之万方程,随机演化,纽约股市。介绍和激励当评估一个复杂系统的行为时,例如随机时间序列描述的系统,通常试图通过从数据中提取演化方程[1]来揭示非线性相互作用和摩擦力的强度。当观测值的基本值分布是平稳的时,这种方法原则上是可能的[2]。然而,在实际系统中,分布通常是非平稳的,或者至少不可能确定平稳性假设的合理性。在本文中,我们讨论了随机观测值的非平稳值分布的演化,并描述了一个框架,使我们能够直接从经验数据记录的测量中得出它们的演化。我们将您的框架应用于金融资产数量价格,尽管框架对于我们最后讨论的许多其他系统来说已经足够通用。特别是,我们证明了体积冰分布以非平稳的方式演化,但遵循一个典型的函数形状,并进行了适当的参数化。通过跟踪每个时间步的一系列参数值,我们表明它们遵循一个定义良好的随机演化方程,这有助于建立非平稳分布的演化。众所周知,即使幂律也可以从高斯噪声驱动的随机方程中推导出来[3]。以数量价格分布为例的选择并不是任意的。

板凳
可人4 在职认证  发表于 2022-5-9 09:28:14
华尔街有句古老的格言说,“要想改变价格,需要成交量”[4]。这句格言至今仍然适用。事实上,如果将交易量或价格彼此分开考虑,就无法理解结合了这两个变量的交换资本的行为。因此,我们在这里考虑这两个变量的组合,即交易量价格,它衡量交换的总资本,提供有关市场上交易的全部资本的信息。有几篇文章是关于随机波动模型[5–7]的,目的是试图描述股票价格收益的动态特征。此类模型的出现得益于金融时间序列的非高斯特性[8]。例如,与幂律衰减一致的渐近行为不仅可以在价格波动中找到,也可以在交易量中找到[4,9]。在这里,我们发现高斯模型(对数正态)和重尾(逆Γ)之间存在天文竞争或共存。通过关注大的波动,人们可以提取有关复杂系统(如金融市场)动态的有价值信息。我们发现,在价值最高的区域,量价分布具有重尾。对于这个分布区域,我们将讨论如何使用这些发现来推导非平稳变量的可能风险度量。我们从秒开始。II通过引入四种不同的双参数模型,这些模型通常用于金融,以验证经验数据。以秒计。III我们研究了哪种模型最适合解释经验分布,引入了库尔贝克-莱布勒散度的一种变体。以秒计。我们在一个框架中揭示了非平稳的量价分布的时间演化,该框架使我们能够提取分布参数的随机运动方程。

报纸
kedemingshi 在职认证  发表于 2022-5-9 09:28:23
最近,在金融领域[10]访问股票市场的聚集状态[11]时,使用了这种方法。以秒计。我们使用我们的结果来推导原始非平稳变量的演化方程。最后,在第六章中,在总结本文的主要结论之前,我们对我们的方法进行了展望,并讨论了在其他情况下可能的应用。二、随机变量的非平稳模型一些不同领域中最典型的随机变量统计模型,从物理学[12,13]和生物学[14,15]到金融[16],医学[17,18],甚至社会学等领域[19],都是双参数的。此外,它们还说明了一个范围,其中一个多项式占主导地位,另一个多项式则呈指数变化。四种最常用的双参数分布是Γ-分布,pΓ(s)=sΓ-1θφΓΓ[φΓ]经验-sθΓ, (1) 逆Γ分布,p1/Γ(s)=θφ1/Γ1/ΓΓ[φ1/Γ]s-φ1/Γ-1exp-θ1/Γs, (2) 对数正态分布,pln(s)=√2πθlnsexp“-(日志s)- φln)2θln#,(3)和威布尔分布pw(s)=φWθφWWsφW-1exp“-sθWφW#。(4) 1e-0600001 0011100S1E-101e-081e-06000010110011100 10000s1e-141e-121e-101e-081e-060000101100001 0,01 1 100S0050,10150,21e-0600001 0,01 100s1e-101e-081e-06000010011(a)(b)(c)(d)Γ-1-φ1/Γ-1θθ1/φW-1θWeφlneθlnFIG。1:(彩色在线)四个双参数分布INEQ。(1) -(4):(a)Γ分布,(b)逆Γ分布,(c)对数正态分布和(d)威布尔分布。对于每个模型,绘制了其参数的图解。8500095010001050110115010012501300T(x10min)1e+061e+071e+08<s>24小时关闭双馈发电机。2:(彩色在线)纽约证券交易所一家上市公司在大约三天时间内的平均成交量价格恒指时间序列图。

地板
nandehutu2022 在职认证  发表于 2022-5-9 09:28:27
这里,(I)强调了正常交易的八小时周期,(II)盘后交易周期(收盘后),我们的分析中忽略了这一点。在夜间(非交易时段),我们将s=0。接下来,我们将这四个分布作为数据的候选模型。在每种情况下,一个有两个参数,这里用φ和θ表示,具有特定的含义。在Γ-分布中,φΓ表示左侧的功率尾,θΓ表示右侧的衰减时间,如图1a所示。在逆Γ分布中,φ1/Γ表示右幂尾,θ1/Γ表示分布左侧的衰减时间,如图1b所示。在对数正态分布中,φln代表变量对数的平均值,θln代表变量对数的标准偏差,如图1c所示。在威布尔分布中,当指数项变为1时,φw代表左幂尾,θw代表分布右侧的衰减,如图1d所示。在下文中,我们将分析大约2000家在纽约证券交易所(NYSE)上市的公司的成交量价格系列,采样频率为10分钟,总共976天,在删除所有盘后交易并丢弃所有记录错误的天数[20]后,包含约1.8×10个数据点。参见图2中的图示。所有数据都是从网站上收集的http://finance.yahoo.com/and关于其预处理的更多细节可参见参考文献。[20, 21]. 还请注意,在图2中,可以观察到“U”型,通常出现在日内交易量时间序列中[22]。为了拟合成交量价格的经验分布,我们使用最小二乘法。

7
何人来此 在职认证  发表于 2022-5-9 09:28:30
我们定义了上述四个模型中每一个的经验累积密度函数(CDF)。使用累积分布是因为拟合分布尾部时存在较小的误差。图3a和3b分别显示了每个模型(线)的概率和累积密度函数,这些模型(线)在一个特定的十分钟快照中符合经验分布(子弹)。在这种情况下,我们考虑等式中的分布。(1) 为了(4)是平稳的,每个分布的参数都是常数。在下文中,我们引入了一个不同的假设:虽然我们采用了一个恒定的函数形状,即上述特定形式之一,但在两个连续的分钟快照之间,相应的参数允许在时间上发生变化。换句话说,我们假设对于10000 1e+06 1e+08s1e-101e-091e-081e-07Γ-分布反转Γ-分布对数正态分布威布尔分布经验分布(a)PDF10000 1e+06 1e+08s1e-011e+00Γ-分布反转Γ-分布对数正态分布威布尔分布经验分布(b)CDFFIG。3:(彩色在线)在一个特定的十分钟快照上的成交量价格分布图:(a)概率密度函数(PDF)和(b)累积密度函数(CDF)。不同的颜色对应于用于拟合经验数据(圆圈)的不同模型。在非平稳分布或密度函数的一般情况下,上述四个模型的参数φ和θ是分布本身的实际变量,包括所有时间依赖性。在图4中,我们得到了每个参数φ和θ的时间序列的表示,表征了四个模型(1-4)。三、 寻找一个最优的量价分布模型在本节中,我们将确定前面描述的模型对于经验量价集是最好的。

8
大多数88 在职认证  发表于 2022-5-9 09:28:34
为此,我们使用经验分布和模型分布之间的“距离”来评估每个模型的精确度,我们将其定义为:D(F)(P | | Q)=Xi自然对数P(i)Q(i)F(i)si,(5)其中Q(i)是经验分布,P(i)是模型化PDF,F(i)是加权函数。对于F(i)=P(i),我们得到了标准的库尔贝克-莱布尔散度[23]。图5a显示了所有四个模型的排名,根据库尔贝克-莱布勒散度进行评估。正如我们所见,最好的结果是对数正态分布,但并不总是如此。在相当长的10分钟时间跨度内,威布尔分布会检索到最佳t,因为选择了加权函数F(i)=P(i),Kullback-Leibler散度解释了一个良好的40400 40600 40800t(x10min)2,12,4φΓ02e+064e+066e+06θΓ(a)0960981φ1/915e+064e+066e+068e+06θ1/Γ(b)2e+012e+01φln1,21,51,8θln(c)0,60,81φW404004060040800t(x10min)1e+07θW(d)图4:(颜色在线)表征CDF体积密度演化的两个时间序列:(b)价格指数)Γ分布(b)逆Γ分布,(c)对数正态分布和(d)威布尔分布。这些时间序列中的每个点对应于10分钟的间隔。没有活动的时期对应于市场关闭的时期,因此在我们的方法中不考虑。在所有的图中,不同的颜色对应不同的分布。1 2 3秩Γ-分布逆Γ-分布对数正态分布威布尔分布1 2 3秩(a)(b)图5:(在线彩色)最佳模型是什么?四种分布在等式中的排名。(1-4)用于在两种情况下拟合经验数据:(a)使用库贝克-莱布勒散度D(p),即方程式(5)中的F(i)=p(i)和(b)加权极端事件更强,具有不同的距离D(1/p)和F(i)=1/p(i)。

9
kedemingshi 在职认证  发表于 2022-5-9 09:28:43
在第一种情况下,采用全范围的观察值,在第二种情况下,只考虑大于中值的成交量价格。排名1表示最佳模型。Fit位于中部地区,其重量比尾巴重。然而,在一些情况下,尾巴起着基础作用。在股票市场成交量价格的情况下,大价值范围的尾部与最大波动相关,即最大收益和损失。因此,只有这一范围的值才是重要的。为了计算出最大的值范围,需要一个合适的加权函数,在下面,我们选择了(P)D(1/P)平均标准偏差平均标准偏差Γ-分布0.55 0.09 18 10逆Γ-分布0.36 0.07 0.9 0.6对数-正态0.20.4 1威布尔0.23 0.08 3表I:库尔贝克-莱布勒散度D(P)和尾距D(1/P)的平均和标准偏差(见正文)。11500 11600 11700 11800t(x100min)09209611,04φ11500 11600 11800t(x100min)17000+061160107θ11800t(x100min)-0,06-00300,03φ*11500 116011700 11800吨(x100min)-2e+0602e+06θ*(a) (b)(c)(d)一个交易日一个交易日图。6:(在线彩色)对(a)φ(红色)和(b)θ(蓝色)时间序列的说明,这两个参数都是等式(2)中逆Γ分布的参数。在(c)和(d)中,对应的去趋势时间序列φ*θ*,已打印(见正文)。在这个图表中,大约有13个交易日。F(i)=1/P(i)。图5b显示了该尾Kullback-Leiblerdivergence D1/p的排名。结果现在显著不同:最佳模型是对数正态分布和逆Γ分布。

10
大多数88 在职认证  发表于 2022-5-9 09:28:46
因此,在考虑尾部时,存在对数正态和逆Γ。表一显示了所有10分钟时间跨度内Kullback-Leibler散度D(p)和尾距D(1/p)值分布的平均值和标准偏差。对于尾部,尽管秩1主要由对数正态分布控制,逆Γ分布显示较小的平均距离hD(1/p)i~ 0.86。此外,逆Γ分布的参数化方式是,一个参数φ1/Γ控制最大值的尾部。检查等式(2)和图1b。出于这些原因,我们今后选择逆Γ分布作为我们的量价分布尾部演化模型。四、 分布尾的随机演化在本节中,我们选择逆Γ分布作为模型,提取分布尾的随机演化。为了简单起见,我们只为参数φ1/Γ和θ1/Γ写φ和θ。在分析中,我们将首先研究平均时间0 10 20 30td(x10min)0970975098050,99φ0 10 20 30td(x10min)01e+062e+063e+064e+065e+066e+06θ(a)(b)φ(td)=aφtd3+bφtd2+cφtd+dφθ(td)=aθtd2+bθtd+dθ图7:(彩色在线)参数φ和θ的所有交易日平均值。这里我们看到,\'φ似乎遵循三次曲线,\'θ似乎遵循二次定律。在拟合函数φ(td)中,系数的值为:aφ=1.55×10-6,bφ=-7.97 × 10-5,cφ=1.33×10-3和dφ=9.72×10-1.在拟合函数θ(td)中,系数的值为:aθ=6.97×10,bθ=-2.77×10和cθ=4.45×10(见正文)。每个参数在一天内的变化。事实上,正如我们从图6a和6b中所看到的,显然存在一种“φ”和“θ”的日常模式,在从原始序列中移除后,会产生去趋势的数据序列,即φ*θ*, 展示无花果。分别为6c和6d。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-20 13:59