楼主: 能者818
1058 34

[量化金融] 基于因子模型的基数约束投资组合选择 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-6-1 05:36:59
注意,考虑到不相关因素,这两个近似值都变成了0-1纯线性问题。CCMV FM和CCMV F MLAmodels的线性近似值需要向模型中添加新的二进制变量,每个资产的一个二进制变量xsifi∈I和每个段s∈sw考虑,每个因子l有一个变量ytlf∈F和每个t段∈ Sβ。表2:。显示了每个模型的维度,其中标题n01下的一列给出了每个模型的二进制变量数,下面的nc列给出了连续变量数,最后M列给出了约束数。这些维度由N资产数量、nf因子数量、| Sw |每个变量所考虑的段数xsiand和| Sβ|每个变量ytl所考虑的段数给出。对于| Sβ|,计算经验中考虑的分段数固定为500,对于| Sw |,作为基数K参数的函数。虽然线性近似的维数远高于原始二次模型(CCMVFM),但我们将看到,鉴于组合问题优化求解器目前的巨大进步,这些线性模型的分辨率比等效二次模型的成本低得多。3、单因素模型的等式加权基数约束最小方差组合问题。在本节中,我们研究了EWCCMV问题的一些性质,其中只考虑了一个因素。对于单因素f,资产i的回报率Rio∈ I由ri=αI+βif+i、 式中,E(f)=0,E(f)=σf.J.f。

12
大多数88 在职认证  发表于 2022-6-1 05:37:02
Monge:通过因子模型进行基数约束投资组合选择等式加权基数约束最小方差组合(EWCCMVSF)的二次0-1模型为:(EW CCM V SF)KminxσfXi,j∈IβIβjxixj+Xi∈Iσixis。t、 Xi∈Ixi=K,xi∈{0, 1}, 我∈一、 (20)问题(20)可以写成:(EW CCM V SF)Kminβ,α,xβ+αs.t.Xi∈Ixi=K,β=σfPi∈一、 βixi,α=π∈一、 σixi,xi∈{0, 1}, 我∈一、 (21)3.1。理论结果设A为平面上的点集,A=(βiσf,σi) ,则,我∈我, 和基数参数k。定义1。A的加法集由A(K)表示,是由A.A(K)=(Xai)的K个点的加法生成的所有点的集∈SAai,SA:| S |=K)定义2。集合A(K)的凸包由conv(A(K))表示,是由A中的K个点相加生成的所有点的凸组合的集合,即:conv(A(K))=(NXi=1xiai:ai∈A、 xi∈R、 0个≤xi≤1,NXi=1xi=K)。问题(20)和(21)的线性松弛可写为:(EW CCM V SF)Kminβ,αβ+αs.t.(β,α)∈ conv(A(K))。(22)J.F.Monge:通过因子模型的基数约束投资组合选择建议2。(22)的最优解在集合conv(A(K))的边界上达到。证据这仍然需要证明这一主张是正确的。定理1(Carath\'eodory,(caratheodory 1907))。对于S Rd,如果x∈ conv(S)然后x∈某些T的conv(T)S、 | T|≤d+1。证据Carath'eodory定理确定conv(A(K))中的任何点RCA可以表示为a(K)的3个点的凸组合。请注意,这3个点来自A(K),A(K)中的每个点都是A的K点的加法。下一个推论将Carath'eodory定理限制在集合conv(A(K))的边界上。推论1。

13
能者818 在职认证  发表于 2022-6-1 05:37:05
多面体conv(A(K))的边界对于尺寸为0和1的面形成Ris,然后是(22),(β)的解*, α*), 是a(K)两点的凸组合。假设conv(A(K))边界上没有共线点。证据从推论1可以看出,(22)的解是在A(K)的一个点上,或在两个点的线性组合中达到的。这个结果的一个结果是,解只有两个或更少的分数值。我们在下面的命题中建立这个性质。提案3。问题(20)的解最多包含两个具有分数值的变量。证据如果(20)的解在conv(a(K))的顶点v中达到,则该点是a的K点的加法,因此存在S A:| S |=K,使得v=Pai∈Sai,如果i,则xi=1∈S、 如果解在维数为1的面上达到,则解是两个顶点的凸组合,v=Pai∈SAI和v=Pai∈Sai,来自conv(A(K)),描述arista的两个顶点。假设S∪S> K+1,即从A开始在两个或多个点上进行vand vdi ffer。例如,v=A+A+A+······+aK+aK+1+aK+2,以及v=A+A+A+···+aK+1+aK+2。J、 F.Monge:通过因子模型进行基数约束的投资组合选择内部点0.5v+0.5v=0.5(a+a)+0.5(a+a)+a+·····+aK+aK+1+aK+2也可以写0.5(a+a)+0.5(a+a)+a+···+aK+aK+1+aK+2=0.5(a+a+··+aK+aK+1+aK+2)=0.5z+0.5z z,其中z,z∈A(K)。

14
可人4 在职认证  发表于 2022-6-1 05:37:08
如果zand zbelong到A(K)的内部,那么0.5v+0.5v是一个内部点,也是一个矛盾。如果conv(A(K))的zor-zare顶点,那么v,vand z(或v,vand z)是共线点,这与conv(A(K))边界上没有共线点的假设相矛盾。因此,conv(a(K))边界上的一个点是a(K)最多两个点的线性组合,而a(K)的这两个点与a(K)最多在一个点上不同。备注:在多因素模型中,解决方案也在前沿,但在这种情况下,多面体面的维数小于或等于| F |,其中| F |是因素数。在这种情况下,解决方案是a(K)的| F |+1个点(顶点)的组合,但现在,这些点(顶点)不必是连续的,因此它们可以在多个点上与a不同。从计算经验中可以看出,因子模型问题的解决需要一点时间,因为在实践中,EWCCMVFM问题的线性松弛解几乎没有分数变量。3.2. 单因素模型的等式加权基数约束最小方差投资组合问题的算法作为EWCCMVSF模型的替代方案,在本节中,我们介绍了一种新算法,用于快速求解该模型。该算法基于下一个命题命题4。给定基数为K的资产T集,(20)中的目标函数值(不含常数因子1/K)为:obj(S)=Pi∈Tσi+σfPi,j∈Tβiβj=Pi∈Tσi+σfβT,其中βT=Pi∈Tβi.Let S∪{i} 和S∪{j} 两组基数K,在单个元素中不同,然后:obj(S∪{i} ()-obj(S)∪{j} )=σ我-σj+σf(βS+βi)-σf(βS+βj),(23),其中βS=Pi∈Sβi.J.F.Monge:通过因子模型的基数约束投资组合选择定义3。

15
大多数88 在职认证  发表于 2022-6-1 05:37:10
我们说,对于集合S,如果obj(S),资产i优于资产j∪{i} ()≤obj(S)∪{j} )。提案4。如果存在S* I和S I带I<<S*j和(βS*- βS)(βi- βj)>0,则i<<Sj。证据如果i<<S*j、 然后σ我-σj+σf(βS*+ βi)-σf(βS*+ βj)<0。假设一个矛盾i<<Sj不是真的,那么σj-σi+σf(βS+βj)-σf(βS+βi)≤通过将上述表达式相加,我们得到σf(βS*+ βi)-σf(βS*+ βj)+σf(βS+βj)-σf(βS+βi)<0,则(βS*-βS)(βi-βj)<0,我们有一个矛盾,这证明了如果i<S*j当i<<Sj时,带(βS*-βS)(βi-βj)>0。前面的命题允许我们为EWCCMVSF问题构建一个构造性的启发式,请参见算法1中的算法描述。让我们描述一下算法。作为第一步,该算法从初始解S开始,由β值较小的资产组成。第二步,算法识别资产j*∈S、 在当前解决方案中选择的资产集中,在目标函数中贡献最大。接下来,确定资产i*∈ 在当前解决方案中未选择的资产中,具有较低的贡献。因此,如果测试结果是肯定的,那么可以通过当前解的算法局部地改进modelEWCCMVSF的解值。否则,无法对当前解决方案进行改进,算法将结束。虽然该算法不能保证找到问题的最佳解决方案(EWCCMVSF(20)),但让我们证明其良好的性能。这也将在后面的计算体验中看到。(20)的最优解是一组K资产,即S*. 如果资产i属于S*然后*\\{i} j、,j/∈ S*, i、 e,资产i优于任何j,j/∈ S*, 结合S的资产*\\{i} 。该算法从一个由较低β的资产组成的集合开始。

16
能者818 在职认证  发表于 2022-6-1 05:37:13
对于optima解决方案中显示的每个资产,我∈S*不存在于S中,它认为(βS*> βS)和(βi>βj)。F、 Monge:基于因子模型的基数约束投资组合选择J∈ S\\S*. 因此,资产i改进了S提供的解决方案。很容易证明,只要从集San最优资产i中删除,算法就会找到最优解决方案∈S*.为了改进为算法1提供的解决方案,我们开发了第二个算法,请参见算法2。可能施加的基数参数很大,得到的解决方案比数量较少的资产更糟糕。算法2在解决方案中查找贡献最大的资产,并查看是否通过移除资产获得了改进。该算法在改进解的同时重复该过程。算法1:EWCCMVSF问题的构造性启发式输入:由N个有序资产组成的一组I(小于βI,具有I∈一) ,和刚毛=(βiσf,σi) ,则,我∈我.输入:基数K.1的参数设S={1,2,…,K}j的I.2 repeat3的前K个资产集∈Sdo4计算对象-obj(S \\{j})=σj+σf(主键∈Sβk)-(主键∈S: k6=jβk)5让j*= argj公司∈Smax{obj(S)-obj(S \\{j}}),即j*资产是否在S中在目标函数中贡献较大。6对于i∈I\\Sdo7计算对象-对象({S\\{j*}}∪{i} )=σj-σi+σf(βS+βj)-σf(βS+βi)8 Let i*= 阿吉∈I\\S最大{obj(S)-对象({S\\{j*}}∪{i} )},即*当资产j*从S.9中删除,如果i*<<S \\{j*}j*然后S={S \\{j*}}∪{i*};10至j*<<S \\{j*}我*;输出:设置基数K.J.F。

17
kedemingshi 在职认证  发表于 2022-6-1 05:37:16
Monge:通过因子模型进行基数约束的投资组合选择算法2:改进算法1的解决方案输入:来自算法1的集合S和来自算法1的集合A=(βiσf,σi) ,则,我∈S我.1对i重复2次∈Sdo3计算对象-obj(S \\{i})=σi+σf(主键∈Sβk)-(主键∈S: k6=iβk)4让我*= 阿吉∈Smax{obj(S)-obj(S \\{i}}),即i*资产是否在S中我在目标函数中贡献最大。5如果iobj(S)>K(K-1) obj(S \\{i*}) 那么S=S \\{i*}, K=K-1.6至j*<<S \\{j*}我*;输出:设置Sof基数K.4。计算结果在本节中,我们介绍了从计算经验中获得的结果。我们已经从OR库中可用的索引跟踪实例生成了几个实例(Beasley 1990)。对于单因素模型,OR库中测试数据集的完整列表可以在中找到http://people.brunel.ac.uk/~mastjjb/jeb/orlib/indtrackinfo。html。所选的仪表分别为INTRACK5、6、7和8,最大。这些数据集已在多家公司中使用,见(Beasley et al.2003、Canakgoz and Beasley 2009、Chang et al.2000、Woodsideriakhi et al.2011)。每个数据集包含一组资产的每周市场价格和市场指数。此外,我们考虑了每个数据集的四个主要成分,以便将这些成分用作因子,并评估第2节中介绍的因子模型。计算实验在一台配有2.9千兆赫兹Intel Core i5处理器、8GB RAM和操作系统OX的PC上进行。我们使用优化引擎CPLEXv12.5。我们将计算经验分为三部分。首先,我们比较了我们为因子模型提出的不同模型的性能。接下来,我们重复computaJ。F、 Monge:通过因子模型进行基数约束的投资组合选择单因子模型的模拟实验。

18
大多数88 在职认证  发表于 2022-6-1 05:37:19
最后,我们生成了一个ad-hoc实例,以最大限度地利用模型和算法。4.1. 因子模型的计算结果。对于所考虑的每个数据集,我们计算了它们的前四个主成分,然后是β和σifor这些组成部分(因子)中的每项资产。注意,主成分作为因子的使用提供了不相关的因子。计算经验是在以下四个模型上进行的:CCMV F M、CCMV F MLA、EW CCMV FM和EW CCMV F MLA。针对基数参数K的不同值求解每个数据集。表3-6显示了每个数据集中四个模型的计算结果(每个表的标题收集数据集名称、市场和资产数量),其中每个模型和基数考虑区域的列如下所示:时间,获得最佳解决方案所用的时间或3600秒的时间限制;对象,解决方案值;%desv=100(目标(·)-obj(CCM V F M)/obj(CCMV FM)),模型获得的解值与CCMVFM问题解的偏差;K、 CCMVFM问题解决方案中的资产数量、解决方案中的资产数量以及与问题CCMVFM解决方案一致的资产数量||w- w*||, l解变量与CCMVFM问题解变量的距离;SD公司=√wT∑w,各溶液的标准偏差,%desv,%SD对各模型的偏差(CCMV-FM);和SR回报/风险比率(wTR/√各型号的wT∑w)。CCM V F MLA解决方案的质量评估。

19
可人4 在职认证  发表于 2022-6-1 05:37:22
如果我们将注意力集中在表6(考虑的最大数据集)上,我们可以观察到所需的非常小的运行时间,以及与模型(CCMV F M)提供的解决方案相比,解决方案的优点(%desv),它并不太高。您还可以观察到,对于基数K的不同值,在我们所试验的所有实例中,CPLEX都达到了时间限制(1小时),而CCMV F MLAPR问题的经过时间比所考虑的CPLEX限制小一到两个数量级。例如,我们应该指出基数K=10的例子,其中线性近似模型(CCMV FMLA)得到的解与(CCMV F M)模型inJ的偏差为0.16%。F、 Monge:通过因子模型进行基数约束的投资组合选择大约20秒,标准差比(CCMV FM)模型的标准差高出6%。尽管两种解决方案中相同资产的数量仅为10个中的5个,而D值为0.88。这些注释也适用于较小的数据集,见表3-5。EW CCMV FM和EW CCMV F MLA解决方案的质量评估。首先,我们可以观察到获得EW CCMV F M的最优解及其近似值EW CCMV FMLA所需的非常短的时间。在任何情况下,都需要3秒钟以上。新CCM V F M及其近似值的解非常相似,因此EW CCMV F MLAdoes没有提供任何优势来证明其使用的合理性。在表6中,EW CCMV F M溶液与CCMV FM溶液的偏差在0.48%到7.55%之间。这种差异来自于对解决方案施加相等权重约束。

20
kedemingshi 在职认证  发表于 2022-6-1 05:37:26
然而,在某些情况下,当评估标准偏差和收益/风险比率时,等式加权解决方案提供了更好的结果。表3中出现了一个例外,将基数参数K设置为20或30会迫使我们在不超过13个资产的情况下选择更多的资产。每个问题的尺寸可从表2中获得。表7显示了每个模型考虑的最大实例的尺寸,该尺寸是从indtract8中获得的。txtdataset;此实例包含Russel 300指数中的N=2151个资产和固定为50的心形参数。线性近似中的分段数已固定为| Sw |=4·K+1=4·50+1=201,| Sβ|=500。虽然这个实例的EW CCMV F MLA问题有四十多万个二进制变量,但CPLEX只需要155秒就可以解决它。总之,从模型获得的结果中,我们可以从初步的计算实验中推断出,解的值相差不大。CCMV F M问题需要很长的运行时间,而其他模型的运行速度非常快,事实上,运行时间可以在几秒钟内测量。J、 F.Monge:通过因子模型进行基数约束的投资组合选择4.2。单因素模型的计算结果。接下来,我们将比较第3节中针对单指数因子提出的模型和算法的性能。我们使用了相同的数据集和其中包含的索引。此外,我们已将模型名称替换为单因素模型中的对应名称,并用第3节中提出的算法替换了EW CCMV SF(EW CCMV SFLA)的近似值。表8-11显示了与表3-6相同的信息,但针对单因素模型。我们首先讨论表8中的小实例。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-23 16:41