楼主: kedemingshi
1200 31

[量化金融] 如何组合10亿个字母 [推广有奖]

11
能者818 在职认证  发表于 2022-5-11 01:43:51
然而,正如最近在[Kakushadze,2016]中讨论的那样,收缩的供应链也是一个因素模型。事实上,收缩是更一般变形的一种特殊情况,其中,与(4)中的SCM cij不同,使用secij=ij+MXs,s′=1Xiseφss′Xjs′(9)这里是矩阵假设Ij为正定义,且(相对)稳定。我们必须有ecii=Cii,所以这对二、先验的在其他方面,这可能是武断的。矩阵φss′是(4)中φss′的变形。(9)的问题在于:i)在实践中我必须与我们试图对其协方差矩阵建模的潜在收益有一定的相关性;ii)先验地,不清楚变形矩阵φss′应该是什么。可用数据仅限于N×M矩阵Xis和固定的矩阵φss′。为了超越这些数据,我们必须引入一些额外的输入。正如12世纪乔治诗人肖塔·鲁斯塔维利所说,“罐子里的东西就是会流出来的东西。”然而,并不是所有的东西都失去了。事实上,我们有大量的N(并且没有“集群”),这使事情变得简单。实际上,矩阵这不能武断。它必须以某种方式——无论是直接的还是间接的——与我们所追求的协方差矩阵的回报有关。最简单的选择是对角矩阵ij=Diδij。更一般地说,我们可以ij是形式(5)的K因子模型,ij=Γij,具有适当的斜对角Γii。事实上,实际上,还有什么可以我会在实践中吗?如果我们知道如何写出一个非因子模型协方差矩阵t,它很好地逼近Cm,并且是样本外稳定的,那么这篇论文将是非常不同的!假设Ij是一个K因子模型(K=0对应于对角线ij)由(5)给出,变形矩阵也是一个因子模型。实际上,eCij=ξiδij+K+MXα,β=1bOhmiαbΦαβbOhm这里的jβ(10):指数α=(A,s)取K+M值;BOhmiA=OhmiA;BOhmis=Xis,s=1,MbΦAB=ΦAB,A,b=1。

12
mingdashike22 在职认证  发表于 2022-5-11 01:43:55
KbΦss′=eΦss′,s,s′=1,M和bΦAs≡ 0.在这里,我们把φss′=(1)翻译成我们的语言- ζ) φss′和(“shr油墨目标”)ij=ζΓij,其中重量(“收缩系数”)为0≤ ζ ≤ 1,而Γij(通常选择为对角线矩阵或低K的K因子模型)是这样的,即Γii=Cii。这是ZK自己翻译的一句格言,来自鲁斯塔维利唯一已知的史诗中的一节,该诗的标题被错误地翻译为“豹皮骑士”(或类似)。InZK的拙见是,它不仅是格鲁吉亚文学中最伟大的杰作,也是有史以来最伟大的文学作品之一。它包括1600多个押韵完美的shairi orRustavelian qua系列,每行包含16=8+8个音节,第8和第9个音节之间有一个caesura。人类的大脑是如何做到如此完美的,令人难以置信,尤其是考虑到这首诗讲述了一个极其复杂的故事,包括对话、失语等。现在我们的状态良好。事实上,假设N较大且没有“聚类”,我们知道(1)中使用Cij(而不是Cij)的优化——一种因子模型——减少了N×(K+M)因子加载矩阵Xb上预期收益的加权回归Ohmiα,与变形矩阵φss′中的FCMΦ无关,并且我们甚至没有(足够约束的)计算指导原则。我们只需要以某种方式计算回归权重zi=1/ξi,即具体值。4.1回归权重呢?具体风险如下(10)。然而,为了计算它们,我们需要知道ΦABandeφss′。实际上,回想一下Cii=Cii,我们有ξi=Cii-KXA=1OhmiAΦABOhmiB-MXs=1Xiseφss′Xis′(11)因此,就变形矩阵φss′而言,我们有M(M+1)/2个参数可以使用,但没有太多的指导来进行游戏。事实上,这里没有灵丹妙药。

13
mingdashike22 在职认证  发表于 2022-5-11 01:43:58
简单本质上是我们唯一可以遵循的灯塔。。。因为最后我们有一个加权回归,它本身不需要知道ΦABoreφss′,只要我们知道权重,我们可以简单地取ξi=Cii。这似乎与(11)相矛盾,但事实并非如此。这是因为,在权重zi的重新标定下,残差ε是不变性的→ λzi,其中λ>0。因此,设置ξi=Ciiis相当于设置ξi=ζCii,其中0<ζ<1,这简化了K(K+1)/2(来自ΦAB)加上M(M+1)/2(来自φss′)的N个条件。对于足够大的N,这个系统似乎是过度约束的,但总是存在一个“解”:我们可以简单地取K=0和φss′=(1)- ζ) φss′。那么,除了逆样本方差,我们还能得到其他权重吗?答案是肯定的。这是一个简单的处方。如上所述,我们可以设置φss′=(1- ζ) φss′,但将Γij作为非平凡因子模型(K>0)。我们必须有Γii=ζCii。一般来说,ξ不等于重标度Cii。有一个不可能的例外:如果我们取Γij,就有一个统一的相关矩阵。使相关性为ρ。那么我们有Γij=ζσiσj[(1- ρ) δij+ρuiuj],其中ui≡ 1是单位N向量。在这种情况下,我们有ζi=ζ(1- ρ) Cii。因此,在这个单因素模型中,权重与逆样本方差相同,尽管回归超过M+1列。如果我们采用不同的因子模型(即使是具有不均匀相关性的单因子模型),通常ξi不等于重新标度的Cii。那么,风险因素应该/可能是什么?非平凡算法需要确保所有ξiso计算均为正且与FCM一致。[K akushadze and Yu,2016a]中给出了此类算法和源代码(见下文)。这是带有对角线“收缩目标”的收缩(见脚注14)。如[Ledoit and Wolf,2004]所述。也就是说,Xis中的M列,s=1,M,加上等于σi的单列。

14
nandehutu2022 在职认证  发表于 2022-5-11 01:44:01
通常情况下,后者与前者的线性组合之间有很高的相关性(见be low)。事实上,我们将在下面讨论,与σi成比例的因子应全部去掉,即从因子载荷矩阵xb中去掉Ohmiα,无论后者是如何构造的(见第5节)。4.2额外风险因素的候选因素由于我们假设没有“聚类”,即我们无法为我们的回报构造二元分类,对于额外的K风险因素可以是什么,这里有两个明显的选择:i)主成分和ii)风格因素(类似于股票风险模型中的因素)。下面我们将讨论第三种可能性。4.2.1主要成分该想法是采用SCM CIJA的第一个K<M主要成分Ohm伊莉亚。更确切地说,还有另一种选择,也就是OhmiA=σiV(A)i,A=1,K、 其中V(a)i,a=1,N、 是样本相关性矩阵ψij=Cij/σiσj的主成分。通常,两种选择之间的差异不是决定是否做出选择,后者优先(通常产生更好的结果),因为它会将(倾斜的、准对数正态分布的)波动性σi剔除,并与ψij的主成分进行处理,其对角线元素取区间值(-1,1)并且分布紧密。因此,我们将在这里采用这种方法。如上所述,eφss′=(1- ζ) φss′,我们取ΦAB=ζλ(A)δAB,因此我们的变形SCMeCij=ξiδij+σiσjKXa=1λ(A)V(A)iV(A)j+σiσj(1)- ζ) MXa=K+1λ(a)V(a)iV(a)j(12)这里:λ(a)是对应于主分量V(a)i(λ(1)的特征值≥λ(2)≥ ··· ≥ λ(M)和λ(a)≡ a>M时为0);ξi=ζσiPMa=K+1λ(a)[V(a)i]。就回归而言,这种结构只影响回归权重szi=1/ξi。事实上,前M个主成分V(a)i,a=1,M、 与Xis上的回归相同,s=1。

15
kedemingshi 在职认证  发表于 2022-5-11 01:44:04
. . , M、 因为这两个矩阵通过线性变换V(a)i=PMs=1XisUsa相互关联,其中usa是非奇异的M×M矩阵。至于ξi,计算它需要计算前K个主分量。对于足够低的K<< M我们可以使用幂迭代法[Mises and Pollaczek Geiringer,1929](算法见第4.1小节,r源代码见附录B[Kakushadze and Yu,2016b])。如果K~ M、 然后我们可以使用无迭代法(算法见第4.2小节,R源代码见附录C[Kakushadze and Yu,2016b])。例如,我们可以通过计算前几个原则来计算回归权重,例如分类有一个形式的因子负荷矩阵(或其列的子集)OhmiA=ωiδG(i),A,其中G:{1,…,N}→ {1,…,K}将我们的N个返回映射到K个“簇”。然而,请注意,“权重”ωi(不要与投资组合权重wiin(1)混淆)可以是负的(包括负的),并且不需要与单位N向量ui成比例≡ 1.回想一下ecii=Cii,Cij=σiσjPMa=1λ(a)V(a)iV(a)j。注意ξi/ζσi=1-PKa=1λ(a)[V(a)i];a>1项由较小的特征值加权。这需要O(niterMN)操作,其中迭代次数为niter>> K.随着K的增加,在某个点上~>M,使用下一种方法更有意义。这需要O(MN)运营成本。分量(与反向样本方差不同),然后对EIX进行加权回归。但是请注意,对于N>> 1第一主成分通常与截距有较大的横截面关系,即θ=√NPNi=1V(1)i接近于1,所以如果我们取K=1,ξi接近于重新标度的Cii。此外,更高的主成分条件是转帐(见脚注22)。4.2.2风格因素风格因素基于我们收益的测量或估计属性。

16
大多数88 在职认证  发表于 2022-5-11 01:44:08
即使是股票,它们的数量最多也只有10个。在Alphas的情况下,先验可能的风格因素是波动性、营业额、动量和容量的日志[Kakushadze,2014]。我们将在下面讨论前三个问题。这里的故事分为两部分。首先,如果我>> 1,那么从一般的角度来看,很明显,如果我们保持回归权重不变,在回归中加入一些风格因素不会产生很大的差异。其次,上述三个风格因素对成对相关性的预测效果不佳。对于营业额,这是基于[Kakushadze,2015d]中的经验证据提出的。对波动率的相似分析得出了相同的结论,即波动率对数不是预测相关性的良好指标。动量定义为一段时间内的平均回报。预期回报率也被定义为一段时间(可能是其他时间)内的平均实现回报率。将资本分配给Alpha本身就是一种“动力”策略:通常情况下,人们不会反对过去表现良好的Alpha。在回归(部分“杀死”阿尔法)中包括因子载荷矩阵中的动量。风格因素可能产生差异的一个地方是计算回归权重。也就是说,我们不把它们包括在回归中,但将权重设为zi=1/ξI,其中特定风险ξ仅适用于基于风格因素的因素模型。也就是说,我们通过因子对相关矩阵ψij进行建模。e、 ,在第0近似下,基于主成分的ξi仍然接近重标度Cii。假设势头是正的;另一方面,我们可以用动量代替波动率,因为它的分布不太偏斜。

17
mingdashike22 在职认证  发表于 2022-5-11 01:44:11
如果动量等于实际收益,那么这就是夏普e比率。然而,能力很难实现,也不清楚它是否会增加价值。在[K akushadze,2015d]之后,我们定义了νi=ln(σi/u),其中u是指νihas z e romean。我们定义了三种对称张量组合xij=uiuj、yij=uiνj+ujνi和zij=νiνj(ui≡ 1是单位N向量)。我们进一步定义了一个综合指数{a}={(i,j)|i>j},其中L=N(N- 1) /2值,即,我们将一般对称矩阵gijin的反对角下三角r元素拉到向量Ga上。这样我们可以构造四个L向量ψa,xa,yaandza。现在我们可以对xa、yaza和za进行一次ψa的线性回归。注意xa≡ 1是简单的inter-cept(单位L向量),所以这是ψa对Ya和Za与截距的回归。表1和图1总结了基于[Kakushadze,2015 d]中相同数据的结果,证实了上述结论。这并不一定意味着“曲棍球棒”Alpha(即那些在过去表现出色但有“流线型”的Alpha)不用于构建Alpha组合。如果我们用动量代替波动性,动量定义为[Kakushadze,2015d]中数据样本整个周期内的实际回报率,那么动量对数也不能很好地预测成对相关性。表2和图2总结了回归结果。该模型基于四个因素中的全部或部分因素,即截距、波动性对数、翻转对数和动量对数。如前所述,截距本身会使样本方差缩小,但与其他因素结合会产生差异。我们总是可以简单地将逆样本方差作为回归权重,而不必费心计算基于风格因素的特定风险。如果不使用真实寿命阿尔法进行详细分析,则不清楚基于风格因素的回归权重是否会增值。

18
mingdashike22 在职认证  发表于 2022-5-11 01:44:14
无论如何,我们不需要在回归中包含样式。4.2.3如何计算特定风险?在这里,我们将讨论计算特定风险的最简单方法,尽管这既不是唯一的方法,也不一定是最好的方法。如上所述,不必通过因子模型对SCM CIJJ进行建模,而是可以方便地对样本相关矩阵ψij进行建模。让相应的因子模型beeΓij=eξiδij+KXA,B=1eOhm安倍晋三Ohm其中eΓij=Γij/σiσj,eξi=ξi/σi,andOhmiA=OhmiA/σi.首先,在不失去普遍性的情况下,我们可以假设Ohm它们是线性独立的。其次,我们可以假设它们形成一个正交基,即矩阵HAB=PNi=1eOhm依斯克拉OhmiBis是K×K单位矩阵:HAB=δAB。事实上,我们总是可以通过变换(在matr ix符号中)e确保正交性或恶意性Ohm →EOhm (eHT)-1,其中eh是H的holesky分解,所以heht=H。此外,我们有eΓii=ψii≡ 1.与男性OhmiA,FCMΦabi是样本相关矩阵在由E列定义的K维超平面上的投影Ohmi在n维空间中:ΦAB=NXi,j=1eOhmiAψijeOhmjB(14)然后从(13)中得出特定风险:eξi=eΓii-KXA,B=1eOhm安倍晋三OhmiB=1-KXA,B=1eOhm安倍晋三OhmiB(15)然而,这种方法有一个警告。对于一般矩阵Ohmi不能保证所定义的ξ是正的,它们应该是正的。这就带来了很多限制Ohm伊莉亚。作为一个例子,让我们讨论一下K=1的情况。对于K=1,事情会简化。让我们表示E的唯一列OhmiAviaβi.ThenPNi=1βi=1和ξi=1- κβi(16)见e。g、 ,[Kakushadze,2015c]或[Kakushadze和Yu,2016a]进行更详细的讨论。式中,κ=PNi,j=1βiψijβj≤ λ(1),a和λ(1)是ψij的最大本征值。因此,所有ξi>0的有效条件是所有βi<1/λ(1)。

19
可人4 在职认证  发表于 2022-5-11 01:44:18
我们可以用一个更强大的条件来代替这个条件,避免计算最大特征值:一个有效的条件是所有的βi≤ 1/λ*, λ在哪里*=NPNi,j=1ψij。注意βi≡ 1/√N、 这与作为唯一风险因素的截距相对应,满足了这一条件。如果βi呈偏态分布,则通常会出现违反此条件的情况,例如,如果βi∝ σi;然而,例如,βi∝ ln(σi)这种违规行为要么是缺席,要么是罕见的,可以通过在少数违规元素中“统治”来处理。参见R函数qrm。[Kakushadze and Yu,2016a]附录A中的fr(),用于suchan算法,该算法是为一般K因子模型(不仅仅是K=1)构建的。然而,当我们有多种因素时,事情会变得更加棘手。基于多因素模型中单个列的Ifξi>0的所有K 1因子模型OhmiA,在K-f参与者模型中,我们仍然可以有一些ξi<0。参见第4节中的a算法和[Kakushadze and Yu,2016a]中R源代码的附录B,以避免这个问题(即使对于K=1)。然而,让我们不要忽视一个与计算特定风险相关的问题,即使它们都是正面的。计算ξivia(15)涉及SFCMΦAB,后者又涉及样本相关矩阵ψijvia(14)。而ΦABis预计比ψijas更不稳定,我们有K<< N、 使用FCMin(15)仍然会给回归权重添加一些噪声。这与使用逆样本方差(即ξi)进行对比≡ 1) ,作为回归权重,它们在样本外相对稳定。

20
nandehutu2022 在职认证  发表于 2022-5-11 01:44:21
这句话同样适用于所有K值。4.3我们可以增加因素的数量吗?因此,虽然我们可以尝试使用回归权重,但这是否会影响回归权重并不十分清楚,尤其是我们仍然局限于M个风险因素,这相当于第一个M个主成分——尽管我们在第一个例子中不必计算主成分。问题是,我们能否在回归中增加因子负荷矩阵中的列数,因为这可能会覆盖风险空间中的更多方向,并改善样本外性能。平淡地说,答案是我们需要更多的信息,即额外的投入来实现这一点。这里有一种方法[Kakushadze,2014]。这里的想法是,假设所有阿尔法基本上都有重叠的交易范围,我们可以将每个基础可交易资产的风险敞口视为一个风险因素——为了真实性,假设我们将美国股票视为基础可交易资产。这是有道理的,但问题是,这个因素应该借用什么矩阵Ohm尿布?在这种情况下,A只是在tradinguniverse中标记股票,比如说,它是流动性最强的2500个股票,所以K很大,比M的典型值大得多,在(慷慨的)1年回顾中,M的典型值只有250左右。如果我们要进行回溯测试,每个alpha的历史股票头寸数据必须可用。让这个位置数据是PIA,也就是美元持有量,许多Alpha可能比这更短暂。在由A标记的股票中,由i标记的阿尔法在由ts标记的时间,对于每个给定的对i,s,标准化的suchthatPA | PiAs |=1。我们可以尝试构造Ohm从Piasbyget中去掉时间序列指数s.最明显的选择OhmiA=M+1PM+1s=1pias不作为一段时间内的PIA波动的标志,通常假设Alpha的持有期较短。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-5 11:31