楼主: 能者818
856 16

[量化金融] 不完全信息下的博弈论动态投资模型: [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-6-10 10:52:59
如果它的价值为正值,则会给持有多头头寸的一方带来利润,如果为负值,则会给持有空头头寸的一方带来利润。如果代理有多个合同,则总结果将乘以合同数。让我们详细描述代理在时间t=kt,k=1,1时的决策过程-f: 我们使用以下符号:tjx–这是第j个合同在t=kt,8 k=1,1时的期货价格-ftiK——泰晤士报规定的免费代理资本;tjy–第j份合同中交易商品的现金价格t=kt,k=1,1-fjq——第j份合同中确定的货物数量;jm–第j-th份合同的保证金;jp——第j-th合同的佣金;rs–在第r步达成的期货合约数量,rs,1,1 -= Tr;tiW–第i个代理人在时间t=kt,k=1,1时的收入-f、 1。在时间t=1时,代理拥有起始资本1ik。他决定以数字1订立期货合约,同时以佣金j和保证金j的形式进行成本计算,j=1,1 s。假设满足限制:0<=+11) (sjjjpm1jK。到第一期结束时,他的收入为1W=1jK=+11) (sjjjpm.2。在时间t=2t时,自由资本的变化量和be等于2ik=1w。提前完成的期货已经到期并带来收入=-+1112))((sjjjjjjqxxm,  在此之后,代理人决定以2的金额签订新的期货合同,同时确定订立合同的成本=+21)(sjjjpm。到第二期结束时,他的收入为2Iw=2iK+ = =+--+1 21 112)()((SJSJJJJJJJJJPMQXXM, 式中,jq-为合同价值,j={1,-1}–描述购买或销售的特征。在这种情况下,假设以下限制:2iW0.p。

12
大多数88 在职认证  发表于 2022-6-10 10:53:03
在时间t=p时,自由资本的金额将发生变化,并等于时间t=1-piW。在p–1时签订的合同将到期并产生收入-=--+111))((psjjpjpjjjqxxm,  然后,这9家机构决定签订数个新的期货合约,同时以佣金和保证金的形式产生成本。到p期结束时,他的收入将等于topiW=piK+ -= =-+--+11 11)()((p PSJSJJJJJPJJJJPMQXXM. 在这种情况下,假设以下限制:piW0等。T、 在时间T=T的最后时刻,自由资本的数量将发生变化,并变为等于1-提示。在T=T-1时签订的合同到期并带来收入T.=T,=.=T-1型-=--+111))((TSJJTJTJJJJQXXM.  在T=T时,没有签订新合同,因此代理人在上一期结束时的收入将达到T=T+-=--+111))((TSJJTJTJJJJQXXM.   正是这种规模应该最大化每个代理。注:每期初,每个代理人拥有一定数量的自由资本。在自由资本项下,我们将根据给定时间的现金市场价格,假设代理人当前可支配的现金以及代理人在此期间拥有的实际货物,以货币表示。3根据动态编程描述问题。确定性案例。作为一种优化方法,我们将使用动态编程方法。让我们考虑一下不存在不确定性的情况,也就是说,当所有数据都被精确地确定,并且系统从一种状态到另一种状态的转换是以等于1的概率进行的。代理在t=kt,k=1,1的离散时刻做出决策-f、 因此,我们可以将此过程分解为1-fa阶段。

13
kedemingshi 在职认证  发表于 2022-6-10 10:53:06
让我们将第i个代理的自由资本作为系统的初始状态:0=t:0iK,i=n,1。每个周期结束时代理人的自由资本,,。。。,,21,i=n,1,将被视为时间t=kt,k=1,1离散时刻的系统状态-f、 该过程的效率将以incomepiW=piK为特征+ -= =-+--+11 11)()((p PSJSJJJJJPJJJJPMQXXM, 由每个代理接收,i=n,1用于p个第一时间段。效率由函数011()表示(Itittikuwus-=--,Tt,2=,我们将最大化此函数。我们介绍函数))(,(21--rkttikUSt,表示代理在最优策略下为k个第一步收到的收入。函数)(,(21--Rktikust,k=1,1-F满足}()(,({))(,(32211Maxkkktukturktittiktikttiksustust)形式的函数方程+=-----, 其中1--=KKKTITISSS——代理人在一段时间内收入的增加【1,-kktt],而setktU–是该步骤中可接受的控件集,由以下限制0)(1)确定-蒂乌斯。上述方程是动态规划的基本函数方程。让代理在初始时刻的总收入为00IISW=,因此,函数)(,(21--Rktikust,对于k=1,1-Fasume the formkktUkturktittikWUStmax)(,(21--=.   作为应用动态规划方法的结果,知道初始资本的值,我们得到一系列函数:{))(,(21--rkttikUSt}–最大收入的函数,i=n,1,k=1,1-f、 相应的最优控制Stiu=(tiu1,tiu2,…,tistu),i=n,1,t[0,T]。11.4随机情况。

14
nandehutu2022 在职认证  发表于 2022-6-10 10:53:09
游戏描述一个n人的多步骤非合作游戏正在构建中= <I={1,…,n},niiU1}{,niiW1}{=>,其中I={1,…,n}-是代理集,iU–代理的策略集,iW:U=iiU→1R-是代理的支付函数,i=n,1。为了解决这个问题,我们将使用综合解决方案的原理。定义:Let beX-游戏Г中的配置文件集,iW:X=U=iiU→1R,i=n,1-代理的支付函数,)(maxxWMiXxi=. 那么折衷集的定义如下::}。),(())((:{maxmaxxxxwmxwmxxciiiiiiiih--=找到妥协集的算法:1)计算每个游戏配置文件中所有玩家的获胜函数。2) 查找所有游戏配置文件中每个玩家的最大获胜值:)(maxxWMiXxi=,i=n,1。3) 对于每个轮廓xX计算第i个代理的支付函数的偏差)(xWi,与最大值,i=n,1.4)对于每个剖面X与X,我们找到差异的最大偏差)(xWMii-,i=n,1,即我们计算)((maxxWMiii-. 5) 在配置文件集X上,我们找到一个点X,它向表达式传递最小值)((maxxWMiii-, 也就是说,我们找到profilex:)。())((maxminxWMxWMiiiiiXx-=-达到最小值的配置文件,将是所有玩家的折衷点。12由于所有折衷模式在这个最优性原则的意义上都是等价的,也就是说,它们中的每一个都能保证最不满意的玩家获胜,那么我们将选择对应于最大获胜函数的策略。

15
何人来此 在职认证  发表于 2022-6-10 10:53:12
因此,如果所有代理人都选择了特定的控制权,则代理人在最后一步的保证收入等于价值)。)()((((11211maxmin-=----++TSJJTTJTJJJJIXXTIQUXUXMK利用动态规划方法,计算了具有固定成员控制的最终时刻的保证收益。根据折衷解决方案的原则选择每一步的AgenttUcontrol,然后在每一步通过反向程序的方法选择单个控制,从而形成单个过程轨迹。5确认本工程部分得到工程RFBR编号18-01-00796的支持。参考文献【1】Malafeyev O.A.、G.V.Alferov、A.S.Maltseva,《反腐败组织检查的博弈论模型》,AIP会议出版社,(2015),1648,http://dx.doi.org/10.1063/1.4912668.[2]Malafeyev O.A.、V.N.Kolokoltsov,《腐败、动态博弈和应用的平均场博弈模型》(2015),http://dx.doi.org/10.1007/s13235-015-0175-x.[3]Malafeyev O.A.,非合作博弈中的自然度量和平衡点,Vestnik Leningradskogo Universiteta,Seriya Ma tematika,Mekhanika,Astronomiya,4,(1978),143-145。[4] Malafeyev O.A.,带相依运动的动态博弈,Dokla dy akademii nauk SSSR,23,(1973),783-786.13[5]Avrachenkov K.,Neglia G.,Elias J.,Martignon F.,Petrosyan L.合作网络形成博弈的纳什讨价还价解。//计算机科学课堂讲稿。2011年,第307-318页。[6] Gubko M.V.通过网络代理交互控制组织系统。//Avtomatika i Teleekhanika。2004年。第8页,第115-123页,第9页,第131-148页。[7] Jackson M.O.社会和经济网络。普林斯顿大学出版社。2008年【8】杰克逊M.O.,沃林斯基A。

16
kedemingshi 在职认证  发表于 2022-6-10 10:53:15
社会和经济网络的战略模型//J、 经济学。学说1996年。^171第44-74页。[9] Malafeev O.A.控制的冲突体系//圣彼得堡。Izdatelstvo SPbGU,2000年。276页【10】Petrosyan L.A.,Sedakov A.A.《单向流两阶段网络游戏》//Vestnik Sankt Peterburgskogo大学。Seriya 10。Prikladnaya matematika,informatika,protsessy upravleniya。4号。2014年,第72-81页。[11] O.A.Malafeyev,《冲突的动态过程》,圣彼得堡州立大学。圣彼得堡,1993年,95年。[12] F.L.Chernousko、N.N.Bolotnik、V.G.Gradetskiy,《操纵机器人:动力学、控制、优化》。Nauka,1989年,368年。(俄语)[13]O.A.Malafeyev,N.D.Redinskikh,G.V.Alferov,《经济学建模中的电路类比:腐败网络》,第二届国际发射电子学会议记录,(2014),http://dx.doi.org/10.1109/Emission.2014.6893965.【14】O.A.Malafeyev,L.A.Petrosyan,《差分搜索游戏-具有完整信息的Dy namicgames》,维斯特尼克·列宁格勒斯科戈大学,塞里娅·马特马提卡,梅哈尼卡,天文学,2,(1983),26-30。[15] O.A.Malafeev,《微分非合作多人对策中平衡点的存在性》,Vestnik Leningradskogo大学,Seriya Matematika,Mekhanika,Astrononomiya,3,(1982),40-46。[16] O.A.Malafeev,基本非合作n人游戏,维斯特尼克列宁格勒斯科戈大学,马蒂马提卡塞里亚。Mekhani ka。Astronomiya,1,(1978),50-53.14【17】X.Grigorieva,O.Malafeev,《具有不同参数的竞争性多周期邮差问题》,应用数学科学,2014年。第8卷。编号145-148。p、 7249-7258。[18] Malafeev O.A.,Kolokoltsov V.N.《理解博弈论》,世界科学出版社,新泽西州,2010年,286页。

17
kedemingshi 在职认证  发表于 2022-6-10 10:53:20
[19] Itai Arieli,《拥挤游戏中的转移实施》,讨论文件第9-14号,2014年10月,第17页。[20] Malafeyev O.A.、Kolokoltsov V.N.、腐败的平均场博弈模型、动态博弈和应用。2015年第5期。№ 3.第34条。[21]Drozdov G.D.,Malafeyev O.A.,Nemnyugin S.A.,竞争性单一部门发展的多组分动力学,过程:2015年纪念V.I.Zubov(SCP)2015年“稳定性和控制过程”国际会议。S、 457-459。[22]Malafeyev O.A.,Redinskikh N.D.,Stohastic分析腐败混合网络的动态,过程:2016年国际会议“非线性控制系统的稳定性和振荡”(Pyatnitskiy会议,2016年)。S、 7541208。[23]Pichugin Y.A.,Malafeyev O.A.,公司纠正指标的统计估计,应用数学科学。2016年第10期。№ 41-44. p、 2065-2073【24】Parfenov A.,Malafeyev O.,2007年。多Agent交互网络模型中的均衡和折衷管理。力学与控制问题:非线性动力系统№  39.第154-167页。【25】Rose Ackerman S.,1978年。腐败:政治经济学中的一项研究。学术出版社。【26】Rose Ackerman S.,1999年。腐败与政府。原因、后果和改革。剑桥大学出版社,第356页。[27]Malafeyev O.,Sosnina V.,2007年。三agent协同交互过程管理模型。力学与控制问题:非线性动力系统№ 39.第131-144页。【28】Bernheim B.Douglas和M.D.Whinston,1990年。多市场接触和共谋行为。兰德经济杂志21(1)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 15:50