楼主: 何人来此
838 19

[量化金融] 基于Blackwell可逼近性的对数最优投资组合选择 [推广有奖]

11
能者818 在职认证  发表于 2022-5-7 01:53:15
,zt-1,pt-1,xt-1) 是一段历史,和zt∈~C.根据定理1,随机策略P,P。在第一个玩家中,无论顺序(x,z),(x,z)。由第二个玩家宣布向量值payoff s\'mt=TTXt=1f(pt,(xt,zt))的顺序=TTPt=1I{pt=s,zt=c}(δ[xt]- s(·| c))。TTPt=1I{pt=sN,zt=c}(δ[xt]- 锡(·| c))。TTPt=1I{pt=s,zt=cK}(δ[xt]- s(·| cK))。TTPt=1I{pt=sN,zt=cK}(δ[xt]- sN(·cK)).P-几乎肯定接近s et U,其中P是由序列P,P。条件分布和轨迹p,p。由测度P分布;通过I{pt=s,zt=cj}关闭指示器功能。让p,p。是一系列经过良好校准的预测,根据P,P。。表示(s,i,j)={t:pt=s,1≤ T≤ T、 xt=ai,zt=cj}和mt(s,j)={T:pt=s,1≤ T≤ T、 zt=cj}|,其中1≤ 我≤ M,1≤ J≤ K、 s可以是网格P(|A | C)的任意元素。集合U的可逼近性包含以下定理,这是定理1的直接推论。定理2。存在一个随机的在线策略P,P。对于任何序列z,x,zt,xt。林监督→∞TX1≤J≤KXs∈~P(~A|C)X1≤我≤M | NT(s,i,j)- MT(s,j)s(i|cj)|≤ (3)对于几乎所有序列p,p。根据P,P,…,生成的总概率分布分布分布。,其中,s是∧P(~A | C)={s,…,sM}的任意元素。我们称预测为p,p。满足(3)-校准。

12
mingdashike22 在职认证  发表于 2022-5-7 01:53:18
如果(3)对每一个>0都成立,则这些预测称为校准良好。Foster–Vohra[13]校准的一个不同之处在于,每个PTI都是一个条件概率分布,而这是关于边信息的校准。让cj∈C和X是根据概率分布s(·cj)=(s(1 | cj),…)分布的随机变量,s(M|cj)),其中P{X=ai}=s(i|cj)每1≤ 我≤ M.对于任何概率分布s∈~P(~A|C)={s,…,sN}和任何cj∈确定最佳的投资组合*(s | cj)=argmaxbEX~s(·cj)(对数(b·X))。(4) 我们也可以把(4)改写成b*(s | cj)=argmaxbMPi=1(log(b·ai))s(i | cj)。设∧Bt={b*(s|zt),B*(sN | zt)}是所有最优投资组合的集合,其中zt∈使用随机最大预测点,在r ound t.作为辅助信息∈根据Blackwell可接近性Theorem的P分布,我们可以在图1所示的游戏的任意一轮t中定义randomportfoliob*t=b*(pt | zt)=argmaxbEX~pt(·| zt)(log(b·X)),(5)其中pt∈~P(~A | C)是在第t轮宣布的随机预测,Zt是在第t步宣布的信号。相应的随机算法如图1所示。我们考虑两种类型的投资者:投资或使用随机算法计算最优投资组合,固定投资者使用边信息的连续函数。对于t=1,2。市场宣布信号zt。投资者宣布集合@P(@a@C)上的概率分布Pt=Pt(·|σt,zt)。市场宣布回归向量xt。投资者选择一个投资组合*T∈由PTS发布的BTS已考虑到BTS并更新其财富*t=S*T-1·(b)*t·xt)。固定投资者更新其财富St=St-1·(b(zt)·xt)。ENDFORFig。1.投资组合游戏的协议我们已经介绍了使用近似网格a fixedaccuracy的构建。整个施工按时间间隔1进行划分≤ T≤ . . .

13
mingdashike22 在职认证  发表于 2022-5-7 01:53:21
<tn≤ . . .. 在时间步t∈ [tn,tn+1)当n=1,2,…,这些网格以越来越高的精度逼近集合C,A和P(A):Mn→ ∞, 千牛→ ∞ 而n→ 0,un→ 0作为n→ ∞.下面的定理断言,在这种情况下,对于连续函数b(·):C表示的所有投资组合s类,投资组合(5)几乎肯定是对数最优的→ R.定理3。随机投资组合策略b*tde由(5)定义,并通过重新定义,对于全连续投资组合策略b(·):lim infT类,增量离散化几乎肯定是对数最优的→∞特洛格斯*TST≥ 0(6)对于几乎所有的轨迹p,p。,在哪里*T=QTt=1(b*t·xt)是通用投资组合策略实现的财富,ST=QTt=1(b(zt)·xt)是任意投资组合实现的财富,zt是任意一轮的信号。证据完整的证明基于按时间间隔1划分的构造≤ T≤ . . . < tn≤ . . . 以及上述精度不断提高的网格。为了简单起见,我们只给出了这种网格的证明。在给定>0和u>0的情况下,我们考虑相应的网格@C、@A和@P(@A@C),并证明了在O(u+)以下的普适组合的最优性。注意M=(1/u)和N=(1/)KM-1.用相应网格中的返回向量和近似信号替换和。让我们估计一下这种替换造成的精度损失。注意,对于任何b∈ Γ,x∈ A和A∈■使kx- ak<u我们有|(b·x)-(b·a)|=|(b·(x)-a) )|≤ kbkkx- ak≤ kx-ak<u。

14
大多数88 在职认证  发表于 2022-5-7 01:53:24
n代表b·x)≥ (b·a),|ln(b·x)- ln(b·a)|=ln(b·x)(b·a)=自然对数1+(b·x)-(b·a)(b·a)≤(b·x)-(b·a)(b·a)≤ u/λ,其中ln是自然对数;如果b·x)<(b·a)我们可以交换a和x的角色。设b(·)是任意的连续平稳投资组合策略。给定>0,考虑setC中满足以下条件的所有信号的有效精确近似网格@C={C,…,cK}:对于每个z∈ C安慈∈~C存在的问题,如KB(z)- b(ci)k<。因此,O(u+)上的所有和都发生了变化,这是因为这些向量和信号的替换。假设返回向量xt和信号zt是相应有限网格的新元素,并使用函数b(·)的连续性,我们得到任意组合的平均财富的估计值(·):Tlog ST=TTXt=1log(b(zt)·xt)=KXj=1TXs∈因为完整的构造基于k网格的顺序,其中k→ 0as k→ ∞, 对于每一个连续函数b(·),都存在一个k-网格,使得这个性质成立。其中NT(s,i,j)={t:pt=s,0≤ T≤ T、 xt=ai,zt=cj}。由(3)of rem 2TX1≤J≤KXs∈~P(~A|C)X1≤我≤M | NT(s,i,j)- MT(s,j)s(i|cj)|≤ +o(1)作为T→ ∞ 几乎可以肯定。从(7)开始,我们得到以下等式和不等式链,它们几乎肯定是有效的≤J≤KXs∈~P(~A | C)MXi=1NT(s,i,j)log(b(cj)·ai)=TX1≤J≤KXs∈~P(~A | C)MT(s,j)MXi=1log(b(cj)·ai)s(i | cj)+O()+O(1)=TX1≤J≤KXs∈~P(~A|C)MT(s,j)EX~s(·cj)(log(b(cj)·X))+O()+O(1)≤TX1≤J≤KXs∈~P(~A|C)MT(s,j)EX~(s·| cj)(日志(b)*(s|cj)·X)+O()+O(1)=TX1≤J≤KXs∈~P(~A | C)MT(s,j)MXi=1log(b)*(s|cj)·ai)s(i|cj)+O()+O(1)=TX1≤J≤KXs∈~P(~A |C)TMXi=1NT(s,i,j)log(b)*(s|cj)·ai)+O()+O(1)。

15
可人4 在职认证  发表于 2022-5-7 01:53:28
(8) 作为T→ ∞.现在,我们从(8)改为一般的s e ttingKXj=1Xs∈~P(~A |C)TMXi=1NT(s,i,j)log(b)*(s|cj)·ai)+O(u+)+O(1)=TTXt=1log(b)*t·xt)+O(u+)+O(1)=Tlog S*T+O(u+)+O(1)(9)几乎可以肯定,其中*这是通过最优投资组合获得的财富。关系式(7)和(9)意味着几乎可以肯定lim inf→∞特洛格斯*TST≥ - c(+u),其中c是一个正常数。固定近似网格的证明是完整的。3关于收敛速度的一些评论在本节中,继Mannor和Stoltz[18]之后,我们讨论了最优性条件下的收敛速度(6)。该速率由Blackwell可接近性定理(3)中校准的预报员的收敛速率以及在有限系列网格中C、~A和P(~A | C)定义。我们假设所有组合函数b(·)都是Lipschitz连续的。可接近性定理的证明产生了一种隐式策略,如Blackwell[3]所示。我们从lnorm k·k的一个变体Blackwell定理开始。表示dU(x)x在l-范数上的投影。

16
mingdashike22 在职认证  发表于 2022-5-7 01:53:31
根据这个定理(见Blackwell[3]或Cesa Bianchi and Lugosi[7]第7节)的解释,在每一个t>2的圆上,根据上面的符号,预报员应该根据集合P(|a | | C)上的分布随机选取他的动作ptat,例如(|mt-1.- 杜山-1) )·(f(Pt,(aj,ck))- “mt-1) ≤ 0代表所有1≤ J≤ M和1≤ K≤ K.Blackwell[3]的Blackwell定理和Kallenberg和Sztencel[16]的Hilbert空间值鞅的收敛定理的证明(参见alsoChen和White[6])提供了经验向量序列“MTT”到目标集U的一致收敛率:对于所有市场策略和所有T,存在一个绝对常数c,使得δ>0,概率为1- δ、 k\'mt- 杜山≤ cslogδT,(10),其中k·kis是RKN M中的欧几里德范数。定理3证明中使用的集合U是使用l-范数定义的。然后,利用三角形不等式和柯西-施瓦兹不等式,我们得到了k¨mTk≤ Kdu(\'mTk+k\'mT)- 杜山≤  +√千米自然保护区- dU(`mT)k,其中N=O((1/)KM-1). 因此,到(10)时,我们就有了k¨mTk≤ c+cslogΔKM-1T。(11) 的合适选择是当总和(11)的两个项的大小相同时,即~ T-公里+1。这是(8)中的最佳精度水平。此外,我们必须在(7)中找到最佳精度水平。我们应该优化M=(1/u)k的选择,其中u是o f近似值xt的精度水平。假设符号空间C是实数的闭合区间,b(·)是Lipschitz连续的,并且K=1/u,我们应该选择合适的u来最小化总和u+T-KM+1,其中KM=(1/u)k+1。最佳值为u~ (日志T)-k+2。结合一系列的网格,就像在Vyugin[21]中所做的那样,我们可以得到一个粗略的界O(logt)-(6)中收敛速度的k+2+v,其中v是anSee Cesa Bianchi和Lugosi[7],练习7.23。

17
可人4 在职认证  发表于 2022-5-7 01:53:34
回想一下,N=|P(|A | C)|,M=|A |,K=|C |。任意小的正实数,k是资产的数量。更精确地说,对于任何δ>0的情况,概率为1-δ、 Tlog S*T≥特洛格街- c(对数(T/logδ))-k+2+v表示所有T,其中c是常数,ST=QTt=1(b(zt)·xt)是任意Lipschitz连续投资组合b(·)获得的财富。4与不连续平稳策略竞争投资组合策略b*理论M3中定义的tde至少能渐近执行TAS以及任何连续策略b(zt)。策略b(zt)的一个弱点是,连续函数不能有效地快速响应有关返回向量变化的信息。支持b(·)连续性要求的一个积极论点是,仅与可计算的传输策略竞争是自然的,连续性被视为可计算性的必要条件(Brouwer的“连续性原则”)。如果允许b(·)是不连续的,我们就不能证明我们的投资组合策略y的渐近最优性*t、 我们把它压在相应的结构下面。考虑一个有两种资产的投资组合博弈,假设存在一个算法,当输入t和历史σt=b时*, 十、B*T-1,xt-1在所有投资组合和leta投资组合b的单纯形上计算概率分布Pt=Pt(·|σt)*tbe由Pt分配。用et=EPt(b)表示*t) =(e1,t,e2,t)′b的条件数学期望*t关于σt,假设zt=σt是第t轮的一个信号。

18
kedemingshi 在职认证  发表于 2022-5-7 01:53:37
定义b(zt)=(b(zt),b(zt)),其中b(zt)=1如果e1,t≤0和b(zt)=1- b(zt)。对于任何t,定义一个返回向量xt=(x1,t,x2,t)′,其中x1,t=2,x2,t=1 ife1,t≤x1,t=1,x2,t=2。设ST=QTt=1(b(zt)·xt)为固定投资组合(·)和S获得的财富*T=QTt=1(b*t·xt)是一笔通过随机分组策略获得的财富*第一轮都是罐头。根据定义日志*T=TPt=1log(b(zt)·xt)(b)*t·xt)。很容易验证,对于任何t,log(b(zt)·xt)(b)*t·xt)=(1+b*1,tif e1,t≤1+b*那么对于任何t,EPt日志(b(zt)·xt)(b)*t·xt)=EPt1+b*1,t≥EPt1-B*1,t1+b*1,t≥如果e1,t≤EPt1+b*2,t≥EPt1-B*2,t1+b*2,t≥否则EP日志*T≥T表示所有T,其中P是由所有Pt定义的总体概率分布,T=1,2。。根据大数鞅定律→∞TlogSTS*T≥几乎完全正确。因此,固定投资组合策略b(·)优于投资组合策略b*塔勒:当然。5结论在本文中,我们展示了如何将博弈论方法应用于普适投资组合结构的经典问题。我们在博弈论框架和非常规环境下提出了构建对数最优投资组合的方法。没有关于回归向量的统计假设。相反,我们使用校准方法定义返回向量的“人工概率分布”。利用这种分布,我们通过标准方案(1)构建对数最优投资组合,其中数学表达式是由经过良好校准的预测定义的概率分布。我们的logoptimal投资组合的性能至少与使用边信息的连续函数在每一轮重新分配投资的任何平稳投资组合一样渐近。

19
可人4 在职认证  发表于 2022-5-7 01:53:40
这种性能几乎可以肯定,其中相应的概率分布是基于Blackwell可接近性定理计算良好校准预测的亲babilisticalgorithm算法的内部分布。定理3不仅适用于对数损失函数,而且适用于任何Lipschitz连续损失函数。这种方法的缺点是(6)中的收敛速度非常慢,但它基本上适用于可接近性的所有非常规应用(可能V’yugin[21]除外),因为用于使用它的构造会在许多额外维度中产生结果,这些维度不适合该问题的几何。请注意,对于所有平稳过程和遍历过程,投资组合策略不存在收敛速度。6确认该研究得到了俄罗斯基础研究基金会的部分支持:13-01-12447和13-01-00521。参考文献1。Algoet,P.:预测、赌博和投资组合选择的通用方案,Ann。Probab。20(2) (1992), 901–941.2. Algoet,P.,和T.Cover:对数最优投资的渐近最优性渐近均分性质,Ann。问题。16 (1988), 876-898.3. Blackwell,D.:向量支付的极小极大定理的模拟,太平洋数学杂志6(1956)1–8.4。Blum,A.和A.Kalai:有无交易成本的通用投资组合,马赫数。学35 (1999), 193-205.5. 布莱曼,L.:有利博弈的最优赌博系统,在第四届伯克利数理统计和概率研讨会上发表。加利福尼亚州伯克利:加利福尼亚大学出版社(1961),65-78.6。Chen,X.,White,H.:Hilbert空间值Mirtingales的大数定律及其应用,计量经济学理论12(1996),284-304.7。塞萨·比安奇,N.,L乌戈西,G.:预测、学习和游戏纽约:剑桥大学出版社,2006年8月。

20
大多数88 在职认证  发表于 2022-5-7 01:53:43
封面,T:环球投资组合。数学金融。1 (1991) 1-299. Cover,T.,Ordentlich,E.:附带信息的通用投资组合。我在信息论上做交易。42 (1996) 348–36310. Dawid,A.P.经过良好校准的贝叶斯[讨论]。杰姆。统计学家。Assoc.77(1982),605-613.11。Dawid,A.P.基于校准的经验概率[附讨论]。安。统计学家。13 (1985) 1251–1285.12. Foster,D.P.,Vohra,R.校准学习和相关平衡。游戏与经济行为,21(1997),40-55.13。福斯特,D.P.,沃赫拉,R.渐近校准。Biometrika,85(2)(1998)379-390.14。非参数预测,学习理论的进展:方法、模型和应用,J.A.K.Suykens,G.Horv–ath,S.Basu,C.Michelli,an D.Vandevalle,编辑:阿姆斯特丹,柏林,牛津,东京,华盛顿特区:IOS出版社,北约科学系列(2003),339-354.15。Gy–orfy,L.,Lugosi,G.,Udina,F.基于非参数核的顺序投资策略。数学金融16(2)(2006),337-357.16。Kallenberg,O,Sztencel,R.向量值鞅的一些无量纲特征。Probab。第。雷尔。字段88(1991),215–247.17。Mannor,S.,Shimkin,N.具有可变阶段持续时间的重复矩阵对策中的后悔最小化。《游戏与经济行为》63(1)(2008),227–258.18。曼诺,S。,Stoltz,G.:校准的几何证明。运营数学研究35(4)(2010),721-727.19。Morvai,G:经验对数最优投资组合选择,控制与信息理论问题20(6)(1991),453–463.20。沃夫克,V.G.,沃特金斯,C.:环球投资组合的选举,载于《计算学习理论第11届年会论文集》(1998),12-23.21。V\'yugin,V.U基于校准方法的股票市场交易通用算法。LNCS 8139(2013),53-67。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-5 19:38