楼主: nandehutu2022
1210 36

[量化金融] 多元时间序列随机化的最大熵方法 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-24 08:24:16
在这种情况下,上述四个约束分别对应于:给定金融股票的正回报和负回报数量、股票的总正回报和负回报、给定交易日正回报或负回报的股票数量、给定交易日所有股票的总正回报和负回报。这些制约因素构成了与财务回报相关的一些最基本的“可观察”因素。正如我们将在下文中详细介绍的那样,强迫集合平均保留它们也会导致收益分布的恶化,以及一组金融股票的一些相关特性(这是金融投资组合分析和选择的核心)上面的列表相当于8个(N+T)约束,哈密顿量依赖于相同数量的参数:H(W)=N∑i=1吨∑t=1αNi+αTtA+it+βNi+βTtA.-it部门+γNi+γTtw+it+σNi+σTtw-它, (7) 其中,我们引入了与所有约束相关的拉格朗日乘子。哈密顿量的这种选择自然地概括了中介绍的框架。让我们注意到,上述约束均未明确说明变量之间的交叉相关性或时间相关性。考虑这些因素将相当于限制该类型的产品∑Tt=1witwjt(如果∑Ni=1witwitofW,导致进近分析可跟踪性方面的巨大损失。

12
能者818 在职认证  发表于 2022-6-24 08:24:19
然而,正如我们稍后将看到的,上述约束的组合足以间接捕获感兴趣的数据中的一些相关特性。为了计算配分函数z=∑我们-H(W),我们首先需要正确指定相空间上的和。考虑到我们为系统选择的矩阵表示,以及w±it=witA±it这一事实,其内容如下:∑W∈W≡N∏i=1吨∏t=1Z+∞-∞dwit=N∏i=1吨∏t=1∑(0,1)(A+it,A-it)=(1,0)(0,0)Z+∞dw+itZ+∞数据仓库-其中,(8)总和规定了入口a是否分别存储正值、负值或缺失值。这意味着负面和正面事件(这通常适用于W分录分布的任何离散化),即价值5/20图2。经验PDF(如直方图所示)、CDF和生存函数(CCDF)与用我们的系综方法从等式(3)中的哈密顿量重建的经验对应项之间的比较,分别以黄色(H)和红色(H)显示。a) 通过在40个数据点上校准模型获得的PDF结果。b) 通过在4000个数据点上校准模型获得的PDF结果。c) CDF(和相关生存函数)的结果,模型在40个数据点上校准。d) 在4000个数据点上校准模型的CDF(和相关生存函数)结果。在所有图中,标记为“真”的黑色虚线对应于合成数据生成过程的分析PDF、CDF和生存函数(取决于面板)(由集合给出。6/20返回显著无效假设中间值)。

13
mingdashike22 在职认证  发表于 2022-6-24 08:24:22
犯错误统计样本0.01-0.99 0.05-0.95 0.1-0.9Varstock 0.95 0.76 0.59 0.2day 0.88 0.78 0.69 0.14Skewstock 1 0.98 0.95 0.13day 0.78 0.58 0.49 0.46Kurtstock 0.78 0.61 0.51 0.60 Day 0.85 0.68 0.55 0.1表1。在分位数规定的不同显著水平上,与相应的整体分布相匹配的经验矩分数(例如,0.01-0.99表示整体分布的第1和99个百分位数用作边界,以确定是否可以拒绝与整体分布相匹配的经验矩的无效假设)。请注意,用于获得这些结果的置信区间尚未针对多重假设测试进行调整。这样做(例如,通过假覆盖率)将进一步抑制真阳性的数量,从而导致更大比例的矩与集合分布兼容。计算每个股票和每个交易日的力矩。在最后一列中,我们还报告了每个时刻经验值与其总体平均值之间的中间相对误差。未被K-S测试拒绝的经验聚集PDF比率聚集级别K-S测试重要性0.01 0.05库存0.92 0.68天0.82 0.75表2。基于不同显著水平的Kolmogorov-Smirnov检验。在每个变量的经验平均值之上和之下,显然不能在一个入口中共存,入口一旦被占据,就不会发生任何其他事件。在这方面,我们可以预期,消极事件和积极事件将被有效地视为填充物理系统能级的不同终结物种。按照这条推理路线,w±的作用是两个费米子物种的一般坐标。

14
mingdashike22 在职认证  发表于 2022-6-24 08:24:25
原则上,式(8)中的积分可以有一些量U±It作为上限,以包含有关感兴趣变量边界的任何可能的先验知识。上述表达式得出以下配分函数(在附录A中完全推导得出):Z=∑W∈我们-H(W)=N∏i=1吨∏t=1Zit=N∏i=1吨∏t=1“1+e-(αNi+αTt)γNi+γTt+e-(βNi+βTt)σNi+σTt#=N∏i=1吨∏t=11+euit-εItItit+euit-εItIt!,(9) 其中,数量u1,2it、εit和tit是拉格朗日乘数的函数(见附录A)。关于等式(9)的一些考虑现在已经就绪。首先,配分函数分解为独立因子zit的乘积,从而分解为n×t统计独立子系统的集合。然而,关键是要注意,它们的参数(即拉格朗日乘数)通过指定约束(hO`(W)i= ln Z/ β`,`). 正如我们稍后将演示的那样,这确保了原始系统的相关结构的一部分保留在集合中。此外,通过上述位置,上述物理类比变得清晰:等式(9)所描述的系统可以被解释为具有能量εItan和局部温度it的n×Torbitals系统,该系统可以由属于两个不同物种的费米子填充,这两个物种分别具有局部化学势uItan和uit。根据等式中的配分函数。

15
kedemingshi 在职认证  发表于 2022-6-24 08:24:28
(9) 我们最终可以计算概率分布P(W):P(W)=N∏i=1吨∏t=1P+itA+itP-它A.-它1.-P+it-P-它1.-A+it-A.-它Q+it(w+it)A+itQ-it(w-it)A.-it,(10)其中p±itandQ±it(w±it)是拉格朗日乘数的函数(见附录A),分别对应于在时间t为第i个变量绘制正值(负值)的可能性及其概率分布。作为上述集合的一个示例应用,让我们考虑一下当时的日回报率=100个最具资本化的股票公开=560个交易日(2016年10月至2018年11月)。在本例中,上述约束迫使集合平均保留正收益和负收益的数量以及总体正收益7/20图3。经验统计特性与系综平均值之间的比较。在这些图中,我们展示了该模型部分再现未显式编码为集合约束的原始时间序列集的非平凡统计特性的能力。a) 每只股票(红点)和每天(蓝点)计算的回报率方差的经验与整体平均值。b) 回报偏态的相同曲线图。c) 比较随机选择的两支股票(微软和百事可乐公司)的整体和经验累积分布(以及相关生存函数)。点对应于从经验数据中获得的累积分布和生存函数。虚线对应于通过将集合中独立生成的时间序列汇集在一起而获得的等效函数。不同的颜色表示图例中报告的不同股票。

16
能者818 在职认证  发表于 2022-6-24 08:24:32
值得注意的是,Kolmogorov-Smirnov检验(0.01显著性)表明,92%的股票收益率经验分布在这种情况下,82%的日收益率经验分布与其整体对应分布相一致(K-S检验在0.01显著性)。8/20图4。系综理论在股票系统中的应用。a) 在随机选择的股票(谷歌)的每个交易日执行异常检测。如果某一特定股票在特定日期测得的回报率超过该特定回报率的相关95%置信区间(通过虚假覆盖率b进行多重假设修正)(橙色线)和马尔琴科-帕斯图尔法(蓝色线)规定的相关95%置信区间,则该回报率被标记为异常。插图显示了其相对于系综分布的经验最大特征值(dahsedline)。每个时间序列和每个交易日的负回报,导致6个(N×T)约束。当实施这些约束时,可以获得边际分布的显式表达式(见附录A):P(Wit=x)=(1-P+it)λ-iteλ-itxΘ(-x) +P+itλ+ite-λ+itxΘ(x),(11),其中λ±Ita也是拉格朗日乘数的函数(见附录A)。上述分布使双方都能够认识到,从混合物样密度(如等式(11)中的密度)中进行采样可能会导致重尾分布,这在处理财务数据时至关重要。图3和表1和表2说明了上述一阶矩约束如何转化为高阶天的解释力,其高阶矩(方差、偏度和峰度)在统计上与相应的装配分布兼容,即:。,这些量的分布是在大量(在所有显示的情况下)独立于集合生成的时间序列上计算的。

17
mingdashike22 在职认证  发表于 2022-6-24 08:24:35
值得注意的是,这是一种没有明确针对反假设测试的约束的情况,通过抽样随机场景进行测试,然而这些场景是紧密基于经验可用数据的。本着这种精神,在图4中,我们展示了事后异常检测的示例,其中股票的原始时间序列验证了相对于市场整体异质性而言异常的事件。按照上述推理,在图4中,我们比较了数据的经验相关矩阵的特征值谱和集合的平均特征值谱。众所周知,随机矩阵理论的Marchenko Pastur(MP)分布的相关矩阵(即具有有限二阶矩的不相关变量大系统的相关矩阵的平均特征值谱)15、34、35,再加上一些包含系统相关相关结构信息的大型孤立特征值(例如,它们可以与强相关变量集群相关联)。从图中可以看出,集合的平均特征值谱定性地捕捉到了经验谱体积的相同范围(作为参考,我们还绘制了MP分布),最大特征值的集合分布与经验观察到的分布非常接近,表明集合很好地捕捉到了市场中相关性的主要来源。相反,经验观察到的最大特征值与其集合分布之间的平均距离可以解释为市场集体运动的一部分,而这部分运动不能由施加在集合上的约束来解释。9/20在附录B中,我们还将上述集合方法应用于北美城市记录的每周和每小时温度时间序列数据集。

18
kedemingshi 在职认证  发表于 2022-6-24 08:24:38
我们这样做是为了展示该方法捕获上述固有时间周期的能力。金融风险管理的应用在本节中,我们将前一节中的示例推向现实世界的应用,在前一节中,我们展示了集成能够部分捕获多元系统中的集体性质。也就是说,我们将介绍一个专门用于金融投资组合选择的案例研究。金融投资组合选择是一个优化问题,需要在金融股票上分配固定数量的资本。通常,投资者的目标是分配资本,以最大限度地提高投资组合的预期回报,同时降低投资组合的预期风险。当后者根据投资组合方差进行量化时,优化问题的解决方案相当于计算投资组合权重πi(i=1,…,N),其中πi是要投资的资本量iπi相关矩阵,这反映了一个直观的概念,即一个平衡良好的投资组合应该具有良好的多样性,避免在密切相关的股票中进行类似的资本配置。附录C提供了问题的数学细节和投资组合权重的明确表达式。投资组合优化带来的根本挑战是,必须首先在一定时期内观察到的股票之间“抽样”计算投资组合权重,然后根据这些权重观察投资组合的已实现风险。这就产生了一个问题,因为金融相关性是有噪音的34、35和严重的非平稳性,所以不能保证样本中最优的投资组合权重在样本外风险方面表现良好。文献中提出了许多解决方案来缓解上述问题。

19
nandehutu2022 在职认证  发表于 2022-6-24 08:24:41
其中大多数是“清理”投资组合相关性矩阵的数量方法,即旨在减去噪音和挖掘股票之间“真实”相关性的程序(至少在可以合理假设为常数的时间窗口内)。这里是它们的相关结构。使用与前一节相同的符号,我们假设wit表示stocki的timetreturn(i=1,…,N;t=1,…,t)。然后,让我们定义去趋势回报Wit=Wit-hWiti,其中hWiti表示根据公式(11)计算的返回值的集合平均值。这样做的理由是为了减轻可能异常大的回报的影响(如图4所示)。将其与未破坏的结果进行比较。也就是说,我们形成了四个投资组合(两个sizeN=20,两个sizeN=50),在2014年9月至2018年10月期间,随机选择标准普尔500指数股票的回报率,T=N/qq∈ (0,1)是投资组合的“矩形比率”,它为投资组合的相关性Q的噪音提供了合理的代理→ 样本外投资组合风险的190%区间——按方差量化——在上述期间内的若干非重叠时间窗内计算(更多详情请参见标题),前两行对应于原始回报,下两行对应于去趋势回报(请注意,在这两种情况下,样本外风险仍然根据原始回报计算,即,去趋势仅在样本中执行,以计算权重)。

20
可人4 在职认证  发表于 2022-6-24 08:24:45
正如所见,通过从每个回报中局部移除集合平均值来消除趋势,可以显著降低样本外风险,尽管这里所考虑的示例受到许多众所周知的潜在不利因素的困扰,如投资组合规模小、时间窗口小、,以及异常值敞口(此处使用的收益率符合幂律分布,使用methodin,所有股票的尾部指数中值为α=3.9)。在附录D中,我们报告了与表3相当的投资组合夏普比率(即,在一个时间窗口内投资组合收益与投资组合方差之间的比率),定性结果非常相似。在附录E中,我们提供了我们的集成方法在财务风险管理中的其他应用的详细信息,我们计算并测试了风险价值(VaR)估计的样本外绩效,这是使用最广泛的财务方法19,20即使在大幅增加拉格朗日乘数的数量时,也可以进行改进。原因在于10/20PPPPq=2/30.041(0.027,0.091)0.955(0.026,0.815)0.1029(0.011,0.287)0.1553(0.015,0.461)q=1/40.8488(0.031,2.867)1.001(0.022,3.011)0.7846(0.009,0.933)0.0938(0.009,0.136)q=2/30.0093(0.0053,0 0.0155)0.0081(0.0046,0.0124)0.0034(0.0021,0.0056)0.0033(0.0023,0.0053)q=1/40.0113(0.0055,0.0158)0.0081(0.0053,0.0111)0.0041(0.0022-0.0056)0.0033(0.0021,0.0054)表3。样本外投资组合风险——按方差进行量化——通过减去收益率平均值来降低收益率和不降低收益率。PN1,2(N=20,50)是指由随机选择的标准普尔股票组成的两个不同的投资组合,其中sq=N/t表示投资组合的“矩形比率”(即股票数量与用于计算相关性和投资组合权重的样本时间窗口长度之间的比率)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-7 17:37