楼主: nandehutu2022
1099 42

[量化金融] 一种基于内存的方法,用于选择 [推广有奖]

31
mingdashike22 在职认证  发表于 2022-6-14 11:52:01
还可以与[15]中提出的聚类驱动方法进行比较,或者将该方法扩展到非线性PCA[69]。附录A.经验数据我们将使用的经验数据集包括2000年1月1日至2017年5月12日期间纽约证券交易所(NYSE)、美国证券交易协会自动报价系统(NASDAQ)和美国证券交易所(AMEX)1270只股票的每日收盘价,每个价格时间序列总计4635个条目。我们确保库存通过此处描述的数据清理过程“对齐”。偏差的一个典型来源是,一些股票在特定日期没有交易。为了确保我们保留尽可能多的条目,我们将最后一个可用价格拖到前面,并假设价格时间序列中的缺口对应于零对数回报。同时,我们不希望降低太多的价格,因为这样做会损害时间序列的统计意义。具体步骤如下:(i)从dat aset中删除长度小于p乘以最长时间序列的价格时间序列;(ii)在剩余时间序列中找到共同的最早日期;(iii)创建一个参考时间序列,其中至少有一个股票从上一步中发现的最早的共同日期开始交易;(iv)将参考日期时间序列与每个股票的日期时间序列进行比较,并将g aps拖到最后一个可用价格之前。在本文中,我们选择p=0.90,以确保时间序列a不受影响。例如,我们的数据集通常最早的一天是2000年1月3日。在此期间,美国银行股份有限公司(ABCB)未在35天内进行交易,因此使用最后可用价格来填充这些特定日期。

32
大多数88 在职认证  发表于 2022-6-14 11:52:05
另一个例子是库存联合医疗保健产品(AHPI),在我们研究的时间段内,该产品在508天内没有进行ttraded,并且由于其长度小于最长时间序列的p倍而被删除。然而,如果我们选择一个更高的p值,结果不会改变。应用此过程,我们的数据集将保留N=1202只股票。因此,X和X(市场)是4364×1202矩阵。附录B.CONTENTS 24特征向量和投资组合优化的财务解释将主成分分析应用于财务相关矩阵的另一个动机是我们在这里解释的第一个主要成分的财务解释。首先,我们回顾,标准对数波动率之间的经验相关矩阵E定义为ij=TTXt=1ln | ri(t)| ln | rj(t)|。(B.1)我们称wme为具有λmits相关特征值的E的特征向量。我们将WM的权重解释为投资组合的权重,wim>0表示我们买入股票的多头头寸,预期其价值将上升,而wim<0表示我们预期股票价值将下降并出售的空头头寸[70]。m和m′的对数波动率之间的协方差为:TTXt=1NXi=1wimln | ri(t)|!NXj=1wjm′ln | rj(t)|=Xm′λmδm,m′,(B.2),其中wim和wjm′分别是特征向量wm和wm′的条目。因此,投资组合wm定义的收益与另一个特征向量wm′不相关。等式B.2的另一个结果是,用于衡量投资组合风险的收益方差是特征值λm。因此,wm定义的投资组合的特征值越大,风险越高。

33
kedemingshi 在职认证  发表于 2022-6-14 11:52:09
因此,了解这些关于投资价值及其相应特征向量的信息,可以帮助投资经理决定如何单独选择投资组合,以及如何使用wm定义的正交投资组合来降低一组投资组合的总体风险。对于给定级别 对于可容忍的风险,我们还可以通过解决最小化问题minwwtew(B.3),使Xw= . (B.4)这被称为马科维茨港口对开优化理论[71],可以通过拉格朗日乘数来求解,得出wopt=E-1RR+E-1R,(B.5),表示最佳投资组合权重。我们可以看到,IGENVALUES的分布通过逆矩阵E进入por tfolio优化-1在公式(B.5)中。通常,公式(B.5)通过简单使用样本估计量E直接应用。然而,由于E是经验的,它受到数据中固有噪声的影响,这意味着它容易受到特征值噪声分布的影响,从而导致WoptFound低估风险【7】。我们还注意到,根据【51】,附录A中的经验数据,与G的MP体积以外的特征值相对应的特征向量可以是第251、2、3、0.10.20.30.40.50.60.70.80.9图B1:绘制附录B中定义的gde是ICB超部门组的特征向量投影,对于附录A中详述的数据,G的第一个主要成分的特征向量。图例对应于每个ICB超部门组。被确定为属于19个经济产业分类基准(ICB)超级部门的特定或混合部门【72】。我们可以量化G givenin方程的特征向量。

34
可人4 在职认证  发表于 2022-6-14 11:52:12
(15) ,vi,通过定义19维向量i、 带条目g、 i,g=1。。。,19、具体地说,我们定义了一个投影矩阵P,其中entriesPig=(1/Ngif i在supersector g0 else中,其中ngi是属于supersector g的股票数量。由此我们可以定义国际会计准则i=γiP vi,(B.6),其中γiis归一化常数pg=1g、 一、各g、 给出了第g个ICB超反射体对第i个特征向量的贡献。我们策划G图B1中的前三个特征向量。我们可以看到,对于第一、第二和第三个主成分,每个特征向量分别由房地产(颜色14)、il和Ga s(颜色1)和金融服务(颜色6)主导。附录C.CONTENTS 26套索回归套索回归用于通过等式(17)确定系数βIp的值。本附录提供了使用该方法的更多详细信息。套索回归[73]提供了一种处理过度拟合解释变量(在我们的例子中为Ik(t))的方法,以及进行特征选择的方法,该方法考虑到股票i的对数波动率不受Ik(t)变化的影响。套索回归解决了受约束的最小问题minβiTTXt=1ci(t)- I(t)+βI+ ΥPa(βi),(C.1),其中βiis是由(βi1,βi2,…,βimmax)+给出的荷载向量,i(t)是矩阵,其中列为(i(t),i(t),Immax(t))和Υ是一个高阶参数。Pa(βi)定义为asPa(βi)=mmaxXj=1 |βij |。(C.2)式(C.2)中的总和是套索回归的Lpenalty。Υ控制正则化的数量:它越高,零载荷越多。为了找到Υ,我们根据【74】设置其规模,并使用10个交叉验证的Υ【73】,选择给出最小预测误差的Υ。我们还研究了结果的稳定性,以及对Υ变化的响应,并将(C.2)中的惩罚改为L2惩罚。

35
大多数88 在职认证  发表于 2022-6-14 11:52:15
在任何一种情况下,与计算的m价值观附录D.θ的拟合程序我们可以通过评估ζ(m)的哪个区域在对数-对数标度中是最线性的来估计θ,这是通过评估每个区间m=°θ。。。,mmax,其中|θ=2。。。,mmax,该区间的对数-对数标度ζ(m)中线性t的质量。θ,^θ的估计值是给出最佳质量线性函数的^θ值。为了评估函数的质量,我们使用调整后的Radjvalue【59】:Radj=1- (1 - R) n个- 1n- 2,(D.1),其中Ris为正常测定系数[75],n为区间大小。注:我们已经为解释变量数为1的特定情况编写了公式。如果Radjis较高,则间隔m=°θ。。。,Mmax最好用线性趋势来描述。Radjan和Ris之间的差异,前者可以通过减少通过Rf获得的值或较小的n.θ值来考虑不同大小间隔引起的不同样本大小,然后由|θ=max|θRadj(|θ)给出,(D.2)这是使Radjand最大化的|θ的值,给出了最佳质量线性函数的区域。内容270 0.5 1 1.5 2.5 3 3.5-5.5-5-4.5-4-3.5-3-2.5-2中等最佳拟合(a)均匀0.5 1 1.5 2 2.5 3 3.5-7.5-6-6-5.5-5-4.5-4-3.5-3 ln的图E1:(左上)非均匀图ζ(m))vs ln(m),用于原稿中描述的同一同质合成系统但是使用AR(1)作为Ik(i)(t)的生成过程。蓝线是所有资产的ζ(m)值,红色虚线表示^θ=8,即凹度变化的点。

36
何人来此 在职认证  发表于 2022-6-14 11:52:18
(右上)原始手稿中描述的相同异构模拟系统的相同绘图,其中^θ=6。附录E.指数衰减自相关1阶自回归过程(AR(1))由[4 0]X(t)=(t)+ψX(t)给出- 1) ,(E.1)其中(t),(t- 1), ... 均为白噪声项,ψ为自回归参数。为了加强平稳性和正自相关,请注意,我们必须使0<ψ<1[40]。等式(E.1)中第二项的存在为过程引入了记忆。已知X(t)的自相关函数是指数函数[40],随ψ的增加,记忆强度增加,这与我们在第6.1节中使用的FBM不同。通过使用AR(1)生成参数为ψ和ψk的i k(i)(t)集,我们可以研究当自相关指数衰减时,本文提出的方法是否仍然有效。对于I(t),我们fixψ=0.95。每个Ik(i)(t)都是使用ψkset的0.65到0.95的等距向量生成的,类似于第6.1节所述,以反映[67]的经验结果。然后,我们对第6.1节中描述的相同均质和非均质合成系统重复第5.4节中给出的步骤。ζ(m)vs m的对数-对数plo t s如图所示。E1、我们看到,虽然我们确实看到了两种系统的下降,但与图相比,在这种情况下,对数刻度中的直线并不能准确描述。4(a)和4(b)。因此,我们可以得出结论,虽然我们的方法也可以应用于快速、指数衰减自相关的情况,但其精度较低。内容28致谢我们感谢彭博社提供本文使用的数据。我们还要感谢ESRC Network Plus项目“重建宏观经济学”。

37
nandehutu2022 在职认证  发表于 2022-6-14 11:52:21
我们感谢经济和政治科学研究委员会(EPSRC)对EP/P031730/1的支持。我们非常感谢NVIDIA公司捐赠GPU支持我们在这一领域的研究。---[1] Ian Jolli Off e.主成分分析。威利在线图书馆,2002年。[2] 唐纳德·杰克逊。主成分分析中的停止规则:启发式统计方法的比较。生态学,74(8):2204–22141993年。[3] 米兰桑卡、瓦茨拉夫·赫拉瓦克和罗杰·博伊尔。图像处理、分析和机器视觉。Cengage Learning,2014年。[4] Sarah A Mueller Stein、Anne E Loccisano、Steven M Firestine和Jeffrey D Evanseck。主成分分析:分子动力学数据应用综述。计算化学年度报告,2:233–2612006。[5] Rich Pang、Benjamin J Lansdell和Adrienne L Fairhall。神经科学中的降维。《当代生物学》,26(14):R656–R6602016。[6] 卡罗尔·亚历山大。生成大型garch协方差矩阵的主成分模型。《经济注释》,31(2):337–3592002。[7] 乔·布恩、让·菲利普·布沙德和马克·波特。清理大型相关矩阵:来自随机矩阵理论的工具。《物理报告》,666:1–109,2017年。[8] J.H.M.达比郡。利率衍生品的定价和交易:WAPS实用指南。Aitch and Dee Limited,2016年。[9] Laurens Van Der Maaten、Eric Postma和Jaap Van den Herik。降维:比较性。《马赫学习研究杂志》,2009年10:66–71。[10] Tomaso Aste、Tiziana Di Matteo和ST Hyde。双曲面上的复杂网络。《物理学:统计力学及其应用》,346(1-2):20–262005。[11] Michele Tumminello、Tomaso Aste、Tiziana Di Matteo和Rosario N Mantegna。在复杂系统中过滤信息的工具。

38
可人4 在职认证  发表于 2022-6-14 11:52:24
《美国国家科学院院刊》,102(30):10421–10426,2005年。[12] Tiziana Di Matteo、Francesca Pozzi和Tomaso Aste。利用动态网络检测金融市场部门的层级组织。欧洲物理杂志B,73(1):2010年3-11月。[13] Tomaso Aste、Ruggero Gramatica和Tiziana Di Matteo。通过曲面上的拓扑嵌入探索复杂网络。物理评论E,86(3):0361092012。[14] Wolfram Barfuss、Guido Previde Massara、Tiziana Di Matteo和Tomaso Aste。使用信息过滤网络进行简约建模。物理评论E,94(6):0623062016。[15] Anshul Verma、Riccardo Junior Buonocore和Tiziana Di Matteo。集群驱动的对数波动率因子模型:对波动率集群来源的深化。《定量金融》,2018年第1-16页。[16] Geo Offrey E Hinton和Richard S Zemel。自动编码器,最小描述长度和亥姆霍兹自由能。《神经信息处理系统的进展》,1994年第3-10页。[17] Je ffrey Regier和Jon McAuli ffe.二阶随机变分推理。2016年海湾地区机器学习研讨会(BayLearn)。[18] 皮埃尔科蒙。独立成分分析,一个新概念?信号处理,36(3):287–3141994。目录29【19】Aapo Hyv¨arinen、Juha Karhunen和Erkki Oja。独立成分分析,第46卷。John Wiley&Sons,2004年。[20] 雷蒙德·卡特尔。因素数量的scree测试。多元行为研究,1(2):245–2761966。【21】T Sugiyama和Howell Tong。关于多变量线性随机系统降维中有用的统计量。《统计学理论与方法通讯》,5(8):711–7211976。【22】邓元煌、盛曾曾。在主成分分析中确定成分数的一种决策程序。

39
可人4 在职认证  发表于 2022-6-14 11:52:27
《统计规划与推理杂志》,30(1):63–711992年。[23]莫里斯·巴特利特。因子分析中的显著性检验。英国数学与统计心理学杂志,3(2):77–851950。【24】Asghar Ali、Clarke总经理和K Trustrum。主成分分析应用于水果营养试验的一些数据。《统计学家》,第365-3701985页。【25】斯万特·沃尔德。因子和主成分模型中成分数量的交叉验证估计。《技术计量学》,20(4):397–4051978年。【26】HT Eastment和WJ Krzanowski。交叉验证从aprincipal组件分析中选择组件数量。《技术计量学》,24(1):73–771982年。[27]Jan Beran。长内存进程的统计信息。劳特利奇,2017年。[28]Rama Cont.《资产回报的经验性质:程式化事实和统计问题》。QuantitativeFinance,1:223–2362001年。约翰·赫尔和艾伦·怀特。具有随机波动性资产的期权定价。《金融杂志》,42(2):281-3001987年。【30】约翰·C·赫尔。期权、期货和其他衍生品。培生教育(印度),2006年。[31]让-菲利普·布沙德和马克·波特。金融风险和衍生品定价理论:从统计物理到风险管理。剑桥大学出版社,2009年。【32】吕克·鲍文斯、塞巴斯蒂安·洛朗和杰罗恩·维克·罗姆博茨。多元garch模型:综述。《应用计量经济学杂志》,21(1):79–109,2006年。【33】彼得·克拉克。投机价格具有有限方差的从属随机过程模型。《计量经济学:计量经济学学会杂志》,第135-1551973页。【34】托本·安徒生、蒂姆·博勒斯列夫、弗朗西斯·迪博尔德和保罗·拉布斯。建模和预测灰色波动率。《计量经济学》,71(2):579–6252003。[35]汉斯·冯·斯托奇和弗朗西斯·W·兹维尔。气候研究中的统计分析。剑桥大学出版社,2001年。克里斯蒂安·弗兰兹克。

40
大多数88 在职认证  发表于 2022-6-14 11:52:30
地表温度的非线性趋势、长期依赖性和气候噪声特性。《气候杂志》,25(12):4172–4183,2012年。[37]Klaus Linkenkaer Hansen、Vadim V Nikouline、J Matias Palva和Risto J Ilmoniemi。人脑振荡中的长程时间相关性和标度行为。神经科学杂志,21(4):1370–13772001。斯蒂芬·泰勒。随机波动率建模:回顾与比较研究。数学金融,4(2):183–204,1994年。【39】F Jay Breidt、Nuno Crato和Pedro De Lima。长记忆非随机波动性的检测和估计。《计量经济学杂志》,83(1-2):325–3481998。【40】乔治·埃普·博克斯、格威琳·詹金斯、格雷戈里·雷内塞和格雷塔·姆容格。时间序列分析:预测和控制,第33页。John Wiley&Sons,2015年。[41]Ajay Singh和Dinghai Xu。随机矩阵应用于资产波动率之间的相关性。《定量金融》,16(1):69–832016年。[42]Rudi Sch¨afer、Nils Fredrik Nilsson和Thomas Guhr。具有动态调整的功率映射用于改进投资组合优化。《定量金融》,10(1):107–119,2010年。【43】弗拉基米尔·阿马尔琴科和列奥尼德·安德列维奇·帕斯托尔。一些随机矩阵集的特征值分布。斯博尼克:数学,1(4):457–4832007年。【44】贾科莫·利万(Giacomo Livan)、马塞尔·诺瓦斯(Marcel Novas)和皮尔保罗·维沃(Pierpaolo Vivo)。随机矩阵导论:理论内容30和实践,第26卷。Springer,2018年。[45]托马斯·古尔和伯纳德·卡贝尔。一种估计财务相关矩阵中噪声的新方法。物理学杂志A:数学与普通,36(12):30092003。【46】贾科莫·利万、西蒙·阿尔法拉诺和恩里科·斯卡拉斯。随机相关矩阵谱特性的精细结构:金融市场的应用。物理评论E,84(1):0161132011。【47】Mateusz Wilinski、池田裕一和青山秀美。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-30 07:49