楼主: 何人来此
961 26

[量化金融] 基于风险规避代理的市场冲击序列检测 [推广有奖]

11
大多数88 在职认证  发表于 2022-5-9 11:17:53
每次k时,市场观察者都会选择行动UKASUK∈ U={1(stop),2(continue)}(10)这里的“stop”表示价值发生了变化,并且在向投资者出售新发行的债券之前,卖家会将这些信息合并到一起。该公式考虑了与检测延迟和误报成本相关的成本的一般参数化。definegk:=由(a,a,…,ak)生成的σ-代数-1,ak)。(11) i)停止成本:资产在时间τ时的价值发生突变(冲击)。如果在变化点之前选择了actionuk=1,对于不熟悉风险度量的读者来说,这是一个错误,那么应该注意的是,CVAR是过去15年金融风险建模的“重大”发展之一。相比之下,风险值(VaR)是百分位损失,VaRα(x)=min{z:Fx(z)≥ α} 对于cdf Fx。虽然CVaR是一个一致的风险度量,但VaR不是凸的,因此也不一致。CVaR还有其他显著的性质[29]:它在α中是连续的,在(x,α)中是联合凸的。对于连续cdf-Fx,CVaRα(x)=E{x | x>VaRα(x)}。请注意,方差不是一个一致的风险度量。区分代理商的“本地”决策和做市商的“全球”决策很重要。显然,影响ukas选择的决定将在下文中明确说明。将产生报警罚款。这与事件相对应∪我≥2{xk=i}∩ {uk=1}。让fiI(xk=i,uk=1)表示状态i,i中的假警报成本∈ X与FI≥ 0.预期的虚警惩罚isC(πk,uk=1)=Xi∈XfiE{I(xk=I,uk=1)|Gk}=fπk(12),其中f=(f,…,fX)是用递增的元素选择的,因此距离“1”更远的状态会受到更高的惩罚。显然,f=0。ii)延迟成本:当事件{xk=1,uk=2}发生时,即即使状态在k发生变化,市场观察者也无法识别变化,产生延迟成本。

12
mingdashike22 在职认证  发表于 2022-5-9 11:17:57
预期延迟成本isC(πk,uk=2)=de{I(xk=I,uk=1)|Gk}=deπk(13),其中d>0是延迟成本,并且以1作为单位向量。B.市场观察者的最快检测目标做市商在每次k asuk=u(πk)时选择其行动∈ {1(停止),2(继续)}(14),其中u表示固定策略。对于每个初始分布π∈ π(X)和保单u,以下成本与ju(π)=Euπ(τ)相关-1Xk=1ρk-1C(πk,uk=2)+ρτ-1C(πk,uk=1))(15)式中ρ∈ [0,1]表示经济贴现系数。(只要f不为零,就保证在有限时间内停止,因此允许ρ=1。)考虑到成本,市场观察者的目标是通过计算最优策略来确定成本最小的τ*就这样*(π) =infu∈uJu(π)(16)序列检测问题(16)可被视为部分观测的马尔可夫决策过程(POMDP),其中信念更新由社会学习过滤器给出。C.随机动态规划公式市场观察者的最优策略*: π(X)→{1,2}是(15)的解,由Bellman的动态规划方程给出如下:V(π)=min(C(π,1),C(π,2)+ρXa∈AV(Tπ(π,a))σ(π,a))(17)u*(π) =argmin(C(π,1),C(π,2)+ρXa∈AV(Tπ(π,a))σ(π,a)),其中Tπ(π,a)=RπaPπRπaPπ是CVaR社会学习过滤器。(12)和(13)中的C(π,1)和C(π,2)是市场观察者的成本。这里是ρ∈ [0,1]是衡量市场观察者不耐烦程度的贴现因子。因为C(π,1)和C(π,2)是非负的,并且有界于π∈ π(X),所有ρ的停止时间τ都是有限的∈ [0, 1].然后,市场观察者的目标是确定停止集S={π∈ π(X):u*(π) =1}由以下公式给出:S=(π:C(π,1)<C(π,2)+ρXa∈AV(Tπ(π,a))σ(π,a))Ⅲ。

13
可人4 在职认证  发表于 2022-5-9 11:18:00
CVAR社会学习过滤器的特性本节讨论了有关CVAR社会学习过滤器结构特性的主要结果,并强调了它在表征市场观察者的价值函数和最优政策特性方面所起的重要作用。根据定理1,风险规避主体做出的决策在观察值中是单调有序的,在先验值中是单调的;它的单调有序行为意味着本文选择的贝叶斯模型是一个有用的理想化模型。A.假设本文将使用以下假设:(A1)观察矩阵B和转移矩阵P是TP2(所有二阶子项都是非负的)(A2)代理的局部成本向量cais子模块。那是isc(x,2)- c(x,1)≤ c(x+1,2)- c(x+1,1)。TP2[47]矩阵确保了公众信任贝叶斯更新可以与之前的[48]和子模块[49]成本进行比较,确保如果在x中选择a=2的风险较小,在x+1中选择a=2的风险也较小。B.CVaR社会学习滤波器的特性Y×A局部决策似然概率矩阵Rπ(类似于观察似然)可通过Rπ=BMπ计算,其中MπY,A=P(a | y,π)(18)P(a | y,π)=I(CVaRα(c(xk,a))<CVaRα(c(xk,a)),其中a=a/{a}。这里我表示指示器功能。设Hα(y,a)=CVaRα(c(xk,a))表示CVaR测量的成本,与行动a和观察y相关,以方便操作,即Hα(y,a)=minz∈R{z+αEy[max{(c(x,a)- z) ,0}]}(19)这里Ey=E[.| Hk]。y表示E和Hα对观测值的依赖性。

14
大多数88 在职认证  发表于 2022-5-9 11:18:04
让我们*(π,y)=argmin Hα(y,a)表示试剂的最佳作用,其明显依赖于分布和观察。下面的结果表明,代理人选择的交易决策在他们的私人观察中是单调有序的。人类通常在做决定之前将数字属性转换为序数尺度。例如,在餐厅用餐的费用是200美元还是205美元并不重要;个人会将此成本归类为“高”。此外,信用评级机构使用顺序符号,如AAA、AA、A。定理1。在(A1)和(A2)项下,动作a*(π,y)madeby每个代理都在增加,因此在y中对任何先验信念π都是有序的。在(A2)项下,a*(π,y)相对于单音似然比顺序(附录中的定义1)以π为单位增加。附录中给出了证据。定理1说代理表现出单调有序的行为。A*(π,y)在观测中是单调的,需要y来刻画信念空间中不同区域上的局部决策矩阵,下面将对其进行说明。定理2。在(A1)和(A2)下,最多有Y+1个不同的局部决策似然矩阵Rπ,置信空间∏(X)可以划分为以下Y+1个多边形:Pα={π∈ π(X):H(1,1)- H(1,2)≥ 0}Pαl={π∈ π(X):H(l)- 1, 1) - H(l)- 1, 2) < 0(20)∩ H(l,1)- H(l,2)≥ 0},l=2,YPαY+1={π∈ π(X):H(Y,1)- H(Y,2)<0}此外,每个多面体上的矩阵Rπ都是常数。附录中给出了证据。定理2需要为市场观察者指定政策。事实上,如第IV-B.IV节所述,它会导致最快检测中的异常行为(非凸)停止区域。

15
何人来此 在职认证  发表于 2022-5-9 11:18:07
风险规避代理的社会学习和变化检测本节说明了风险规避社会学习过滤器的特性,该过滤器产生了非凸值函数,因此是最快检测的非凸停止集。A.风险厌恶因子的社会学习行为下面的讨论强调了风险厌恶因子α和区域Pαl之间的关系。对于给定的风险厌恶因子α,定理2表明,在信念空间上存在至少+1个多面体。[17]表明,对于风险中性情况,X=2,P=I(值为随机变量),区间Pα和Pα对应于放牧区,区间Pα对应于社会学习区。在牧区,当信仰被冻结时,特工们会采取同样的行动。在社会学习领域,有观察学习。然而,当代理优化更一般的风险度量(CVaR)时,对于不同的风险规避因素,社会学习区域是不同的。CVaR风险度量的社会学习区域如图1所示。选择了以下参数:B=0.8 0.20.3 0.7, P=1 00 1, c=1 23 0.5.可以观察到,社交学习区域的宽度随着α的减小而增大。这可以解释为风险规避者表现出更大的随大流倾向。1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.00.20.30.40.50.60.70.80.91.0π (2)απ*π**图1。α的社会学习区∈ (0,1)。可以看出,与π对应的曲线**π*不相交,它们的分离(社会学习区域)随α而变化。这里P=I,也就是说,这个值是一个随机变量。0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.00.20.30.40.50.60.70.80.91.0π (2)απ**π*图2。α的社会学习区∈ (0, 1].

16
nandehutu2022 在职认证  发表于 2022-5-9 11:18:10
可以看出,当代理人充分规避风险时,社会学习区域是不存在的,当股票价值发生变化时,社会学习区域更大,即P6=i,而不是选择其他行为的“风险”。使用相同的B和C参数,但使用转换矩阵XP=1 00.1 0.9社交学习区域如图2所示。从图2可以看出,当国家在演变,当代理人充分规避风险时,社会学习区域非常小。这可以解释为:具有强烈风险厌恶情绪的经纪人不喜欢从人群中“学习”;但同样的结果是,当P6=市场冲击检测的I.B.非凸停止集时,我们现在说明贝尔曼随机动态规划方程(17)的解决方案,该方程通过考虑两种状态的基于代理的模型来确定最快市场冲击检测的最佳策略。显然,代理人(当地决策者)和市场观察者是相互作用的——代理人做出的当地决策决定了公众的信念。25 0.5 0.79 1.0-4.-3.-2.-101π(2)V(π)0.25 0.50.75 1.000.511.522.53π(2)u*(π) 图3。值函数V(π)与双阈值最优策略u*(π) 与π(2)的关系。双阈值策略的意义在于停止区域是非凸的。对于市场观察者来说,非凸集的含义是——如果他认为停止是最优的,那么当他的信念更大时,停止不一定是最优的。πkand因此通过(14)决定市场观察者的决策。根据定理2,多面体Pα,Pα和Pα是[0,1]的子集。在(A1)和(A2)下,Pα=[0,π**(2) ),Pα=[π**(2), π*(2) ),Pα=[π*(2) ,1],其中π**π*分别是Hα(2,1)=Hα(2,2)和Hα(1,1)=Hα(1,2)的置信状态。

17
能者818 在职认证  发表于 2022-5-9 11:18:14
根据定理2和(17),值函数可以写成,V(π)=min{C(π,1),C(π,2)+ρV(π)I(π)∈ Pα)+ρXa∈AV(Tπ(π,a))σ(π,a)I(π)∈ Pα)+ρV(π)I(π)∈ Pα)}滤波器对不连续值函数中的置信π结果的显式依赖性。最优策略一般有多个阈值,停止区域一般是非凸的。示例:图3显示了具有以下参数的玩具示例的值函数和最优策略:B=0.8 0.20.3 0.7, P=1 00.06 0.94, c=1 22.5 0.5.市场观察者的参数选择为:d=1.25,f=[03],α=0.8,ρ=0.9。从图3可以清楚地看出,市场观察者有一个双阈值策略,并且价值函数是不连续的。从信号处理的角度来看,双阈值策略是不寻常的。回想一下π(2)描述了没有变化的后验概率。市场观察者“改变主意”——随着变化的后验概率降低,它从不变变为变化!因此,全局决策(停止或继续)是基于代理的模型中从局部决策中获得的后验概率的非单调函数。这个例子说明了社交学习过滤器的异常行为。V.数据集示例a。TechBuzz游戏和模型:为了验证这个框架,我们考虑了来自TechBuzz游戏的数据,这是一个由雅虎发起的股票市场模拟!研究和O\'Reilly Media,以获得预测高科技事件和交易的见解。这个游戏由多个次级市场组成,交易当代竞争对手技术的股票。在每个交易瞬间,交易者(或玩家)都可以访问每个股票的搜索“嗡嗡声”。嗡嗡声是搜索雅虎的用户数量的一个指标!在过去七天内搜索股票,占同一市场所有搜索的百分比。

18
大多数88 在职认证  发表于 2022-5-9 11:18:17
因此,如果搜索名为“SKYPE”的股票占雅虎总数的80%!搜索在电信应用软件市场,Skype的buzz分数是80。一个市场内所有技术的热门分数加起来总是100分。选择该数据集是为了演示雅虎提供交易信息时的框架!。股市模拟的模型如下所示。选择状态X表示股票价值,X=1表示高价值股票,X=2表示低价值股票。众所周知,如果感知价值更高,它就会受到欢迎。因此,嘈杂的观察结果被认为是反映股票数量的嗡嗡声分数[50]。对于可处理性,假设所有代理对风险的态度相同,即α对所有代理都是相同的。经纪人根据成本和使用buzz分数更新的信念选择购买(a=1)或销售(a=2)。在股票交易的每一天,我们只考虑购买或出售最大股份的代理人,并将其交易决定(数据集中的正值或负值)记录为购买或出售一单位股票。这是一个合理的假设,即交易最大股份的代理人(“金融大玩家”)将显著影响公众的信念。B.数据集2005年4月1日至7月27日期间,分别在VOIP和PORTMEDIA市场上交易的股票、SKYPE和IPOD的buzz得分来自雅虎!数据集。股票价值基本上是股票及其股息支付的函数[50]。派息和股息与buzz分数成正比。使用Buzz评分,股票价值按照[50]中建议的方法计算。股票和IPOD在此期间的空间离散值如图所示。

19
nandehutu2022 在职认证  发表于 2022-5-9 11:18:21
4和图7以及缩放的buzz分数。1) SKYPE的最快检测:通过查看图4中的数据,可以看到该值在6月份发生了变化。为了应用最快的检测协议,我们考虑在5月17日至6月8日之间设置一个窗口。据观察,在此期间,价格(几乎)保持不变,每股价值接近13美元。在此期间的交易决定(以及价值)和公众信念如图5所示。“雅虎网络镜”,http://research.yahoo.com/AcademicRelationsydata-YRBuszGame-transactions-period1-v1。0,ydata-yrbuzzgame-buzzscoresperiod1-v1。4月5日6月7日。511.522.533.544.555.5乌兹别克斯坦共和国图。4.显示了股票SKYPE在4月至7月的空间离散值和缩放的buzz分数。可以看出,该值在6月份发生了变化。市场观察者的目标是检测价值的变化,即当xk=1时,仅使用交易决策。五月十七日五月二十四日五月三十一日六月712五月十七日五月二十四日五月三十一日六月七十日。50.6461.0π(1)作用图。5.代理人的每日交易决定与相应的信念更新一起显示。这里a=1对应于买入,a=2对应于卖出股票。自π(2)∈ [0,0.354]是停止区,它对应于π(1)≥ 0.646. 变化发生一天后被检测到。市场观察者werechosen的本地和全球成本如下:=0.5 11 0.5, f=0 2, d=0.8模型参数选择如下:=0.7 0.30.3 0.7, P=1 00.04 0.96.观察矩阵Bwas参数的选择是基于[51]中提供的实验证据,即当存在“单独”的社会学习时,基于同伴效应的交易率为71%。由于社会学习区域(在我们的模型中)中的局部决策概率矩阵Rπ=B,因此选择了参数。

20
能者818 在职认证  发表于 2022-5-9 11:18:25
选择过渡矩阵P中的参数来反映所考虑的时间窗口,如E{τ}=25。观察到该状态在6月6日发生变化,6月7日检测到风险规避因子α=0.45。值函数和0的最优策略。34 0.5 0.76 1.0-2.5-2.-1.5-1.-0.500.51π(2)V(π)0.25 0.354 0.5 0.75 1.000.511.522.53π(2)u*(π)π**π*图6。值函数和在π(2)上绘制的α=0.45的最优策略。这里是π**π*对应于社会学习区域的边界点。u*(π) =1对应于停止和u*(π) =2表示继续。π(2) ∈ [0,0.354]对应于停止区域。2012年4月至5月至6月3456乌兹别克斯坦。7.显示了股票IPOD的空间离散化值和4月至7月的缩放buzz分数。可以看出,该值在4月至7月期间发生了变化。市场观察者的目标是检测价值的变化,即当xk=1时,仅使用交易决策。市场观察者如图6所示。停止集对应于π(2)∈ [0, 0.354]. π(2)区域∈ [0,0.34)和π(2)∈ [0.76,1]对应于缺乏社会学习的地区。可以观察到,值函数是不连续的。2) IPOD的最快检测:从图7可以看出,该值在4月和7月发生了变化。为了应用最快的检测协议,我们考虑从7月2日到7月10日的窗口。据观察,在此期间,价格(几乎)保持不变,每股价值接近17美元。这一时期的交易决策(以及价值)和公众信念如图8所示。市场观察者werechosen的本地和全球成本如下:=0.5 11 0.5, f=0 1.8, d=0.95模型参数的选择如下:7月2日7月3日7月4日7月5日7月6日7月8日7月9日7月10012日7月2日7月3日7月4日7月5日7月6日7月7日8日7月9日1000.50.6321动作π(1)图8。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 19:25