楼主: 何人来此
1139 34

[量化金融] 金融市场临界性的统计物理学视角 [推广有奖]

11
可人4 在职认证  发表于 2022-5-5 02:06:19
对于DowJones(每日和每分钟抽样),每个点都是通过平均100多组随机选择的股票来计算的。是非零。人们预计H[s]显著低于理论上限N和H[K] H[s]因为几乎没有观察到不同的配置。另一方面,几乎独立的实体不支持任何m(t)值。配置分布P[s]应近似均匀,对于大型系统,H[s]应接近min(N,logM),而H[K]应较小,因为每个配置的观察次数大致相同。从成对最大熵(maxent)模型[30]中,我们知道临界性是一个没有观察到净方向,但波动最大的系统。我们认为,对一个真正关键的制度进行抽样时,应该返回到前两种极端情况之间的中间位置,如S K模型的图2所示。在建立成对maxent模型后,我们记录了道琼斯指数的艺术数据,其随机性比实际值小或大三分之一。结果如图3所示。看来道琼斯指数(分钟抽样)相当混乱,我们将在下文详细检查这一点。4结果在以下情况下,我们检查所考虑的数据集中是否观察到临界性特征。对数似然的方差如图4所示。我们可以观察到,峰值位置随系统大小而变化,从左向右移动5/0 2 4 6 8 10 12 14 16 18 20小时[s]艺术。道琼斯(M=5×10)高随机性中性随机性低随机性图3:道琼斯数据集在不同随机性水平下的统计意义。整行代表理论关系,H[K]是H[s]的函数。

12
能者818 在职认证  发表于 2022-5-5 02:06:22
这些圆点代表的是根据道琼斯数据的成对模型生成的艺术数据,其随机性比实际数据大三分之一。正方形显示的艺术数据的随机性水平与实际数据相同,五边形显示的数据的随机性水平比实际数据低三分之一。0.5 1 1.5 20.20.40.60.8标准箱。指标0.5 1 1.5 20.20.40.60.8t道琼斯指数图4:欧洲指数集(左)和道琼斯指数在每分钟采样时(右)的对数可能性与重标度参数的方差。当我们考虑更大的集合时,峰值从左向右移动。对于欧式集合,我们绘制了大小N=2、4、5、8的变量。灰化曲线是N=8的蒙特卡罗模拟(seeD)。对于道琼斯指数,我们认为n=2,4,6,8,10,12,最后两个v值在统计上并不显著。这些曲线是通过概率(和熵)的直接抽样和使用关系T得到的S/T、 详见第2节。在工作点T=1时,当实体数量增加时,方差的最大值变得更大。对于给定且固定的大小,人们期望集合(N个随机选择的实体)的临界缩放参数的v值更大,平均相关系数更大[30,26]。我们考虑了100组N=6随机选择的N个实体,用于Dow-Jones(每日和每分钟采样)和S&P100。图5所示的结果表明,临界标度参数Tmax和平均相关系数之间大致呈线性关系。因此,任何进一步的结果都将针对每个6/考虑的尺寸进行几组比较。0.15 0.2 0.25 0.3 0.350.30.40.5DJ(最小),N=60.15 0.2 0.25 0.3 0.350.30.40.5DJ(每日),N=60.15 0.2 0.25 0.3 0.350.30.40.5平均校正。

13
何人来此 在职认证  发表于 2022-5-5 02:06:25
系数和P100(每日),N=6图5:临界标度参数(响应函数RU(T)最大值的x轴坐标)与所考虑的N=6个随机Hosen实体组的平均相关系数。道琼斯指数分钟(正方形,左面板)和每日抽样(三角形,中面板)以及S&P100指数(圆形,右面板)的结果如图所示。sizeN=6与后一种统计意义分析一致。为了将关系Tmax=Tmax(N)形式化,我们计算了缩放参数的值,在该参数下,响应函数Ru对于N个随机选择的实体的不同集合达到其最大值。图6显示了欧洲指数集的结果,图7显示了DowJones(每日和分钟采样)的结果。2 4 6 80.60.8实体数图6:响应函数Ru达到其最大值时的标度参数值与实体数N的关系。平均值T和误差条(T上的1个标准偏差)是针对欧洲指数集的(N)个样本计算的。实线代表幂函数,虚线代表前七个值的指数函数。使用关系式(1)计算响应函数。幂函数和指数函数返回的渐近临界标度参数分别等于1.38和0.92。当DJ(min)的指数函数的大小达到N=8时,返回的渐近临界参数等于0.70,如果我们达到N=12,则返回的渐近临界参数等于0.74(但后一个值是不可信的,因为系统在N>8时采样不足)。DJ(每日)的指数fit(大小为N=6)返回的渐近临界参数等于0.71,如果N=10,则等于0.72(但后一个值不可信,因为系统在N>6时采样不足)。

14
nandehutu2022 在职认证  发表于 2022-5-5 02:06:29
此外,即使在取样不足的情况下,我们也观察到临界标度参数的增加。由于7/2 4 6 8 10 120.20.40.6实体数量,当规模(N)增加时测得的更大相关性可能是一种虚假效应。图7:响应函数Ru达到其最大值时的标度参数值与实体数量N的关系。在每日(三角形)和分钟(正方形)取样时,计算道琼斯指数100组N随机Hosen股票的平均值。对特定时间间隔的考虑。通过同时改变大小和缩放样本长度,并考虑不同的时间窗口,可以进行相同的研究。对于欧洲指数集,我们选择了样本长度L(N)=2N+3,例如L(8) Lmax=2300,我们对5个不同时间窗口的结果进行平均。结果如图8所示。除最后一个(N=6)外,每个点(平方)都属于恒定大小结果的置信区间。因此,增大尺寸的相关性更大是一个真正的特征。2.4.6 80.50.60.70.80.9实体数量图8:响应函数Ru达到其最大值时的缩放参数值与实体数量N的关系。针对欧洲指数集(圆圈)的(N)个样本计算平均值和误差条(1个标准偏差)。正方形显示了相同集合的结果,其标度样本长度L(N)=2N+3,并在5个不同时间窗口上求平均值。由于没有使用任何推断方法,我们预计临界分布PT=Tmax(使得在Tmax达到的RUI最大值)和经验分布Pemp(s)之间的库尔贝克-莱布勒散度(KLD)DKL(Pcrit | | Pemp)应该与在Tcrit+下运行的真正临界系统具有相同的量级T.相对偏差T/Tcritand(顶部)- Tmax)/Tmax相等(定义顶部=1)。

15
kedemingshi 在职认证  发表于 2022-5-5 02:06:32
在[25]之后,一个合理的基准是具有大小为N=9的周期边界的二维方形晶格最近邻Ising模型。在Tcrit=2.40时,响应函数Ru达到最大值8/23。我们使用比例分布PScaled=P1/(1+x)准则计算精确分布Pcrit和KLD,其中x=(Tcrit- T) /Tcrit。我们发现,对于经验数据(欧洲指数),Tmax=0.88,DKL(Pcrit | | Pemp)=0.070。伊辛模型的结果如图9所示。-2.-1.-4.-3.-2.-1.图9:二维方格最近邻伊辛模型N=9(浅灰色圆圈)和一组8个欧洲指数(正方形)的临界分布和标度分布f之间的库尔贝克-莱布尔散度。对于这两种系统,结果是相似的。此外,我们使用蒙特卡罗马尔可夫链(1×10平衡步骤和2.3×10记录配置,N=8)模拟(种子)人工二元回报,使用数据上的成对最大熵模型。我们获得了绝对净方向^m |=0.812±0.010(1个标准偏差)。经验左值为h | m | i=0.726,不包括在置信区间内,但接近临界状态,推断参数的微小变化可能会导致通过模拟估算的可观测值发生显著变化[31]。为了量化小重建误差对估计可观测值的影响,我们使用正则化pse udo最大似然(见C)推断了拉格朗日p参数,并稍微改变了参数,以便 = 0.015,与[32]一致。这是一个错误 =√新罕布什尔州(Jij)- Jtrueij)i1/2,并量化重新构造的根测量平方误差与标准偏差之间的比率。我们得到了| m |这两个估计值之间10%的相对偏差。

16
nandehutu2022 在职认证  发表于 2022-5-5 02:06:35
因此| m |的经验值和临界值是相似的。欧洲市场似乎在对应于对数可能性方差最大值的点附近运行,而对于道琼斯指数,在考虑的规模范围内,临界标度参数似乎远离运行点Top=1。在18中,我们通过模拟艺术数据(见下文)将此图扩展到更大的尺寸。这可能是由于股票交易所之间的相关性系数大于道琼斯股票之间的相关性系数,如图10所示,以及Epps效应(相关性大小随时间尺度的减小而减小)[28]。另一个观察结果是,对于图4左面板所示的每条曲线,所谓的临界方差指数等于零,与临界温度下伊辛模型的平均场值一致。临界指数可以通过取极限lim得到→0+log RU()/log其中=(T)- Tmax)/Tmax和Tmax,使得RU(T)在此时达到最大值[33]。我们还研究了配置等级的分布。为了知道我们是否应该拒绝Zipf定律,我们对[34]中描述的统计测试进行了修改(离散幂律,由于配置的数量有限,因此找到了一个自然上限),详情见b。如果p值小于0.05,则排除幂律假设,对于接近1的p值,我们可以将其视为一个良好的分布候选者(不保证9/0.5 0.6 0.70.1 0.2 0.3相关系数图10:欧洲证券交易所(左)和道琼斯指数(右)股票之间的相关系数频率)。这是正确的分布)。

17
何人来此 在职认证  发表于 2022-5-5 02:06:39
经验秩分布如图11所示。-2.-1银行=7-2.-1银行(职级)~ R-0.63-4.-3.-2rankN=12图11:从左到右:一组7只随机选择的道琼斯股票(分钟)的配置经验相对频率与观测时间序列的配置排名,真实幂律的艺术排名分布,以及一组12只随机选择的道琼斯股票的经验相对频率。fit(虚线)由最大似然估计得到。表1中报告了不同组的试验结果。考虑的大小不应超过n=8,以便通过直接抽样对经验数据的分布P[s]进行良好的估计。正如预期的那样,幂律测试结果取决于系统大小。对于道琼斯指数而言,当系统被正确采样时,幂律被拒绝,而在欠采样情况下,幂律不会被拒绝。如[29]所述,当分布P[s]样本不足时,幂律是最具信息性的分布。指数的最大似然估计(MLE)由对数似然Ln(α)=-αN∑i=1ln xi- N lnxmax∑x=1x-α!(4) 其中xmaxis是上限。这种最大似然估计的标准偏差是通过将似然展开到二阶(高斯近似)得到的。它的读数为σαMLE=sNζ′′(xmax,αMLE)ζ(xmax,αMLE)-ζ′(xmax,αMLE)ζ(xmax,αMLE)(5) 式中ζ(xmax,α)=∑xmaxx=1x-α和素数代表关于α的导数。10/表1:道琼斯随机选择的N组股票的幂律假设的统计检验(每分钟采样3×10点)。我们报道了幂律指数α及其标准偏差σα的最大似然估计、Kolmogorov-Smirnov统计量(D)和p值。

18
可人4 在职认证  发表于 2022-5-5 02:06:43
如果p-V值大于0.05,人们不会拒绝幂律假设股票的ασαD p-val6 0.0119 0.007 0.0117 0.008 0.0194 0.009 0.6654 0.0038 0.0147 0.1010.6584 0.0035 0.0164 0.3611 0.7192 0.0027 0.0210 0.8712 0.7441 0.0025 0.0292 0.9613 0.7699 0.0024 0.0290 0.98n=13和1077高斯测试的该估值器的经验概率密度函数(pdf)及其近似值如图12.0.0.0.78所示-2.-1^α图12:尺寸N=13和10测试(圆圈)的最大似然估计的经验pdf。高斯近似用整条线表示。作为对后面a分析的补充,我们研究了作为效用函数表示的熵的线性。齐普夫定律在熵和对数似然之间建立了线性关系[24]。严格的线性度可以在效用的单个值(如2D最近邻伊辛模型)或熵的任何值(如果兰基分布为幂律)下实现[24]。熵在平均效用U周围的展开式被写成(其中U是hUi的符号)S(U) S(U)-T(U)-U) +2TRU(U)-U) (6)对于服从幂律分布的秩,二次项和高阶项是次密集项;熵应该是效用的线性函数[25]。我们为道琼斯指数的几组随机选择的股票检查这个属性。我们计算了平均熵效用关系(-U) 对于100组7个随机c软管,结果如图13所示。我们测量了相对非线性[35],典型值为0.053(如果函数完全线性,则等于零)。坡度的典型值为0.71。

19
何人来此 在职认证  发表于 2022-5-5 02:06:46
我们还使用多变量GARCH(2,2)和成对最大化过程,在11/0.2 0.4 0.60.20.4上模拟了5×10的人工回报-U/N0.20.40.60.10.20.3-U/N图13:左图:Shannon e ntropy与道琼斯指数(min)的几组7只股票(随机选择)的对数可能性的相反。右图:平均熵效用关系(-U) 随机抽取7只股票,每组100只。虚线是最佳线性拟合,斜率分别为0.71和0.68。数据熵对对数似然的依赖性如图14所示。相对非线性度分别为0.032和0.035,斜率分别为0.77和0.59。对于较大的样本,熵不是线性的,但是在有限的效用范围内(例如[0.3,0.4],效用可能值的10%),熵几乎是线性的(通过相对非线性测量)。0.2 0.40.20.4-图14:香农熵与随机选择的9只股票的100组负对数似然比。采用多元GARCH(2,2)过程(浅线)和apairwise maxent模型(粗线)模拟人工收益。虚线是限制范围内的线性曲线。正如Zip定律所指出的,熵不是对数似然的线性函数。然而,对于二维最近邻伊辛模型,我们不能拒绝在有限范围内线性或在单个点上零曲率的可能性。最后,由于收益率被认为是波动率聚类的非平稳(通常由GARCH过程建模),我们研究了临界重标度参数Tmax的演化(在该参数下,对数似然的方差达到其最大值)。

20
能者818 在职认证  发表于 2022-5-5 02:06:49
正如预期的那样,对于FixedSize,Tmaxin在生长期间增加,并在皮疹开始附近(当波动最大时)达到其最大值,如图15所示,并接近顶部。12/6/026/036/046/056/066/076/086/090.70.750.80.85200030040005000year图15:6个欧洲指数(黑色曲线,左纵坐标)和指数的标准化总和(浅蓝色曲线,右纵坐标)的临界重标度参数Tmax。根据经验,在2N+2trading days的滑动窗口上估计临界重定标度参数,并将其转换为每一步的1trading days。5链接到最大熵模型在下面,我们使用推理程序来检查临界状态的存在是否得到支持。当目标是研究集体行为而不是给出精确的市场模型时,可以证明成对最大熵模型(maxent)是一个一致的统计模型[26,4]。与其对潜在的动态做出特定的假设,不如建立一个与记录的数据和观察到的结构一致的模型。这个maxent模型与前面的讨论直接相关,因为自旋眼镜和神经网络也由成对的maxent模型表示,它们实际上表现出临界状态。在此框架中,配置分布P[s]被改写为吉布斯分布P(s)=Z-1扩展∑i、 jJijsisj+N∑i=1hisi!≡eU(s)Z(7),其中Jijand hiare Lagrange乘数(用于检索第一个和第二个经验时刻)。它们不能被认为是衡量成对的相互影响和个人影响。成对maxent模型的另一个著名应用是神经网络结构的分形[8],其中操作点似乎是一个关键点[24,10]。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 04:59