楼主: nandehutu2022
538 21

[量化金融] 关于双参数Poisson-Dirichlet的金融应用 [推广有奖]

11
何人来此 在职认证  发表于 2022-5-7 07:53:52 |只看作者 |坛友微信交流群
上面的10个分区是通过添加一个新框而产生的:o一种方式是4个具有形状的分区,另一种方式是3个具有形状u=4的分区,$$JJJu=3,//对于一个年轻的图,c组合公式(1)提供的u(c)等于o具有给定块大小的集合分区的数量,o在财务方面与rankedcapitalizations描述的市场形成状态的方式相同。分区上的可交换概率分布将相同的概率分配给具有相同形状的所有分区。当人们有兴趣研究排名块大小(大写)的分布,而不考虑块标签(标记)时,该框架非常有用。如果πn(c)表示具有n个元素和shapec的分区的概率,那么具有该形状的所有分区的总概率ispn(c)=u(c)·πn(c)显然,这些概率在具有n个元素的所有形状(杨氏图)上的总和必须为1。在数学遗传学的背景下,金曼[19]考虑了n=1,2,3.的分区上的分布族{pn}。。元素,并注意到随机抽样会产生自然的一致性约束,将n级分布连接起来-他把满足这种约束的分布称为{pn}划分结构。继续这个例子,让我们考虑10个具有该形状的分区。在每个分区中,5个盒子中的任何一个都可以被移除,所以剩余的分区将有4个元素。对于每个分区,有2种方法获得3/5oo2/5DDDDADD。在5个元素的分区上删除一个方框,会在4个分区上产生概率分布。

使用道具

12
mingdashike22 在职认证  发表于 2022-5-7 07:53:55 |只看作者 |坛友微信交流群
例如 =P +P 另一方面,这种一致性约束定义了分区增长的前向条件概率,例如-→=P .P 换句话说,分区结构是在增长(或上升)和衰退(或下降)的情况下,分区上一致的分布族。这使得我们能够将市场动态视为分区上的组合随机游动过程,由上下转换序列驱动。2可交换分区2。1.对集合分区的描述星系、恒星、公司、人形成集群,这些集群的大小很少是统一的。金融和经济方面的股票和公司可以从以下角度考虑:股票市场由k只股票组成,总资本为n个货币单位。如果i-t最大公司的nidenotes价值(通过资本化),那么市场权重由xi=ni/n和向量x=(x,x,…)代表资本分配曲线。新的货币单位可以加入任何股票,从而将特定股票的资本化增加到ni+1,总资本化增加到n+1,或者货币单位可以将股票的相应股票和市场资本化减少1。此外,IPO期间可能会发行新股,这将导致集群数量增加到k+1同样,公司的资产/价值可能会增加或减少。此外,一家新公司也有可能进入市场在共同基金行业,进入市场的资金与现有基金的规模成正比,但新基金的出现总是有机会的。聚类过程可以用集合的分区来表示。

使用道具

13
可人4 在职认证  发表于 2022-5-7 07:53:59 |只看作者 |坛友微信交流群
例如,三个字母‘a’、‘b’和‘c’的集合可以按如下左列所示进行分区,右列中相应的年轻图表示分区类:{a,b,c}{a,b},{c}{a,c},{b}{b,c},{a}{a},{b},{c}如果在集合分区中,由簇/块表示,集群标签并不重要,每个集群中项目的顺序是无关的,这样的划分称为可交换的。这样的分区具有相同的形状,并且完全由其块大小的向量来描述。具有相同形状的分区属于相同的可交换类(或分区类)。以三家公司为例,集合{a,b,c}有5个分区和3个可交换类,由右列中的年轻图表表示。n个元素分成k个簇(块)的每个可交换分区可以用两种方式描述。1.对于一阶描述,由于簇的标记并不重要,因此可以方便地考虑按降序排列的簇大小n>n>…>n=n+···+n在种群生物学术语中,它被称为频率向量:n=[n,n,…nk]显然,年轻的图表对应于这个描述。2.对于第二种描述,假设cdenote大小为1的簇的数量,cdenote大小为2的簇的数量,等等。如果Cj表示带有j个项目的簇的数量,那么项目的总数isn=c+2·c+·m·c,簇的数量由k=c+·m+c给出,其中m是最大簇的大小。为了区分划分向量c和频率向量{},使用DC={c,c。

使用道具

14
大多数88 在职认证  发表于 2022-5-7 07:54:02 |只看作者 |坛友微信交流群
}让c (n,k)表示向量c描述了n个元素分成k个簇的情况。2.2可交换类的大小每个可交换类都包含集合分区,由相同的分区向量c={c,c,c,…}表示。一个类中的分区数由向量c表示,由u(c)=n!Qcj!(j!)cj(1)的确,通过多项式公式,有锥元素子集、ctwo元素子集等的分区的数目是!1.1!| {z}ctimes2。2!| {z}ctimes。必须除以qcj!因为相同大小的块的排列不起作用。例如,4元素集{a,b,c,d}有15个分区和5个可交换类:{a,b,c,d}n=[4]c={0,0,0,1}u(c)=4!(4!)= 1{a,b,c},{d}n=[3,1]c={1,0,1,0}u(c)=4!(1!)(3!)= 4{a,b,d},{c}{a,c,d},{b}{b,c,d},{a}{a,b},{c,d}n=[2,2]c={0,2,0,0}u(c)=4!2.(2!)= 3{a,c},{b,d}{a,d},{b,c}{a,b},{c},{d}n=[2,1,1]c={2,1,0,0}u(c)=4!2.(1!)(2!)= 6{a,c},{b},{d}{a,d},{b},{c}{b,c},{a},{d}{b,d},{a},{c}{c,d},{a},{b},{c},{b},{c},{n=[1,1,1]c={4,0,0,0(c)=4!4.(1!)= 有趣的是,分区n=[2,1,1]可以通过6种方式实现,而统一分区n=[2,2]只能通过3种方式实现。2.3分区结构如果分区向量为c的类中的所有分区都被认为是等效的,那么它们应该具有相同的概率。如果πn(c)表示一个元素从c类划分为u(c)个元素的概率,那么这个可交换类的概率ispn(c)=u(c)·πn(c)。显然,这些概率应该满足yxc(n) pn(c)=1(2)这里是c (n) 表示求和运行在n个元素的所有分区类上。分区结构。一般来说,为所有n的值在分区类上分配概率度量是不够的。

使用道具

15
nandehutu2022 在职认证  发表于 2022-5-7 07:54:05 |只看作者 |坛友微信交流群
Kingman[19]注意到,除了(2)之外,还有一致性条件将可交换性度量与pn联系起来-1和pnand称这种{pi}划分结构的一致序列。2.4 Ewens-Pitman抽样公式Ewens在《种群生物学》一书中提出了单参数断棒模型(6)的有限维对应物。给定划分向量c,Ewen的抽样公式分配概率asp(c)=θkθ[n]n!Qcj!jcj(3)Pitman研究了双参数模型(7)的尺寸偏差表示,并在[24]中获得了Ewen抽样公式的相应扩展。双参数Pitman抽样公式(PSF)给出了划分类cp(c)=θ[k,α]θ[n]n!Qcj!Y(1 - α) [i]-1] 我!其中θ[k,α]=θ(θ+α)··(θ+α)(k- 1) ),这表明对于α=0,公式收敛到(3)。Kerov[17]提出,公式(4)可以通过条件相关变量的随机分配模型得到。2.5 Chinese Restaurant Process Chinese Restaurant Process提供分区的概率动力学,确保概率不变。Zabell[28]将这个比喻解释为“在伯克利的任何一个晚上,都有大量的人去市中心的某家中餐馆。当每个人到达时,他都会看着每个餐厅的窗户,决定是否进去。他进去的机会随着已经在里面看到的人数的增加而增加。。。但他很可能去了一家空荡荡的餐厅……”更正式地说,假设第一张空桌(如表1)上有固定数量的桌子(餐厅)和第一位顾客。

使用道具

16
能者818 在职认证  发表于 2022-5-7 07:54:08 |只看作者 |坛友微信交流群
客户n+1观察被占用的k个表,并o将表与概率为i=ni的nipeople连接- αn+θo将新的、未占用的表与probabilityp连接起来*=θ+αkn+θ重要的是,这个过程提供了分区上的可交换概率。例如,分区n=[2,1,1]可以迁移到以下状态2-αθ+41-αθ+41-αθ+4θ+3αθ+4o@@//:::::::::::oo2.6由Petrov、Olshanski、Borodin([3]、[23]和[12])、Feng等人([8]、[7]和[6])以及Ruggiero和Walker([27])开发的有限维离散,即有序有限单纯形中的随机游动扩散过程。Costantini,Garibaldi等人([15],[14])独立地研究了由向下-向上转换引起的马尔可夫链。近似双参数扩散过程的想法相对简单。让我们定义一些大的n,从一些分区开始,让我们考虑向下和向上跳跃,其中o向下移动随机删除年轻图表中的一个单元格o向上移动根据中餐馆流程进行操作,例如,下图显示了4个分区和相应的DU链之间可能的转换:wwpppppppooqqqqxxqqqqqqookkkkeekkkkkchhhhhhhhh(a)下链//ppppppppp/%kkkkkkkkkkkkkkkkkkkkqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqOOOOOOOOOz:z:z:z:z:e%e%e%e%OO(c)DU-chain图7:向下-向上转换的示例D-和U-算子保留了Ewens-Pitman抽样公式给出的概率结构,因此获得的马尔可夫链也保留了这种分布。

使用道具

17
mingdashike22 在职认证  发表于 2022-5-7 07:54:12 |只看作者 |坛友微信交流群
下图显示了Kingman simplex中扩散过程的近似值,参数α=0.3,θ=50 200 400 600 800 1000 12000.10.150.20.250.30.35图8:分区上的扩散样本路径,顶五xi(t)3狄里克莱分布和尺寸偏差抽样3。1迪里克莱分布断棒模型是更一般的迪里克莱分布的一个特例,它是一种概率度量,覆盖比例向量。其密度函数由向量α=(α,…,αm)p(x)=Γ(pαi)Γ(α)·Γ(αm)xα参数化-1··xαm-1根据单纯形中的比例向量定义分布m=十、∈ Rm | Pmi=1xi=1,xi>0表示向量x是很方便的∈ 用参数αasx向量描述的mhas m维狄里克莱分布~ Dm(α)狄里克莱分布的另一种等价定义是通过伽马变量向量的归一化来证明其性质。对于m个独立的伽马分布变量yi~ 由x定义的比例的G(αi)向量=yPyi,ymPyi,ymPyi有狄利克莱分布x~ α(Dm)。γ分布具有y的卷积性质~ G(α),y~ G(α)y+y~ G(α+α)这个性质,加上卢卡奇的刻画,说它是唯一的分布,具有y/y与y+y的独立性,简化了以下性质的证明。财产。设θ=Pmi=1α,记下参数之和。如果yo=Pmj=1yjdenotes独立gammavariables之和yi~ G(αi),那么这个和有伽马分布~ G(θ)的卷积性质。如果分量yi被分离,其他分量被集中在一起,那么向量(yi,Pj6=iyj)具有独立分量,其伽马分布参数为αi和θ- αi相应。

使用道具

18
大多数88 在职认证  发表于 2022-5-7 07:54:16 |只看作者 |坛友微信交流群
根据ByYo的标准化结果,xi=yi/Yo的β分布为xi~ B(αi,θ)- αi)让x[-i] 表示从向量xx中移除第i个分量[-i] =(x,…xi-1,xi+1。。。xm)因为在向量x中∈ 分量的msum是1,在向量x中[-i] 分量之和变成1- 因此,归一化向量x[-i] /(1)- xi)属于M-1简单。Dirichlet分布具有一个重要的中立性性质,即xiand x的独立性[-i] /(1)-xi)。此外,如果原始向量x~ Dm(α),然后[-i] 一,- xi~ Dm-1(α[-i] )对于m=2,这个属性是微不足道的。对于任意维,让我们考虑具有m个独立gammavariates的向量和相应的Dirichlet分布向量,其分量xj=yj/yo。从两个向量中去除第i个分量,并对第二个分量进行归一化,得到J6=ixj·1- xi=xj·1- yi/yo=yjyoyo- yi=yjPk6=iykIndependence(中立)源自Lucacs property。测试棒断裂。这些性质表明,从狄里克莱特分布中取样是一种断棒方法。让我们想象一下,一根单位长度的棍子被以下一步一步的过程打破。根据边际属性,第一个分量x=Z可以按z建模~ B(α,θ)- α) 通过中性属性,第一块可以被打破。其余的部件都有Dm-1(α[-i] )分销。对于长度为1的斗杆剩余部分,重复该步骤- xwithz~ B(α,θ)- α- α) xx=z(1)- z) z1- z1- z生产新零件x=z(1- z) 剩余长度(1- z) (1)- z) =1- 十、- xetc。一般按kzk阶段~ B(αi,θ)-Pkj=1αj)xk=zkk-1Yj=1(1- yj)=zk1.-K-1Xj=1Xj对于k=m,最后一个分量只是一个余数。

使用道具

19
nandehutu2022 在职认证  发表于 2022-5-7 07:54:20 |只看作者 |坛友微信交流群
在对称Dirichlet分布的情况下,αi=α破缺规则简化为tozk~ B(α,θ)- kα)xk=zk(1)- 十、- ··· - xk-1) 3.2尺寸偏差抽样上一段中的勾选断裂法从狄里克莱分布分量中逐个分量抽样比例。在许多应用中,以及在泊松-狄里克莱分布的发展中,更重要的是研究按降序排列的比例x(1)>x(2)>。因此,如果有一个程序,可以从分布中给出作为输出顺序的统计信息,那就更方便了。总的来说,这并不容易,但是可以设计一种模拟策略,提供真实分布中外观比例的样本,这是由尺寸偏差抽样给出的。假设给定一个Dirichlet分布向量x~ Dm(α)是随机选择的,因此xjis是选择第j个分量的概率。或者,它可以被可视化为在长度为1的木棍上均匀地放置一个点,长度为1除以比例x,x。。并选择该点所在的比例/块。这个比例的值被称为尺寸偏差样本,显然,选择最大工件的机会最高,等等。一旦选择了比例,就将其分开,并以标准化残差重复该过程。结果是向量x的大小偏倚排列,其中分量随机交换,偏倚于有序情况。排列向量中第一个尺寸偏置拾取的密度函数可以通过以下参数找到。比例ex可与概率ex一起选取,作为向量的第一个分量(ex,x,…,xm)或向量的第二个分量(x,ex,x,…,xm)等。

使用道具

20
何人来此 在职认证  发表于 2022-5-7 07:54:23 |只看作者 |坛友微信交流群
在每一种特殊情况下,无条件概率的发现都相当于相对于狄里克莱密度的边缘化,从而产生β密度Bαi,θ-αi(ex),因此总概率isp(ex)=mXi=1ex·Bαi,θ-有偏(αi)的大小(αi)在αx(αi)的情况下- α) exα-1(1 - ex)θ-α-1=Γ(θ + 1)Γ(α + 1)Γ(θ - α) exα(1)- ex)θ-α-1换句话说,第一个SBP ex=Ey具有参数移位的β分布~ B(1+α,θ)- α) 在断开第一个SBP并反复应用该程序后,可以证明从斗杆剩余部分断开的工件具有β分布ZK~ B(1+α,θ)- αk)(5)和相应的比例- 前任- ··· - exk-1) 由于θ=αm模拟在阶段k=m终止- 1.剩余部分的exmis长度。通过这种方式获得的样本有先出现较大比例,然后出现较小比例的趋势。显然,在对比例进行排序后,这两种方法(标准方法和有大小偏差的方法)产生了相同分布的序列,因为SBP只随机排列对称Dirichlet向量的分量。首先,尚不清楚SBP的目的是什么,因为有序Dirichlet分布向量的成分可以通过标准程序进行采样,然后进行排序。然而,正如下文所示,size biasedsimulation允许从直接无法访问的案例中进行采样。泊松-狄利克雷分布。1对称m维Dirichlet分布Dm(α)的单参数族让我们考虑极限情况,其中→ ∞ 因此θ=αm,这意味着当尺寸趋于一致时,总电荷θ保持不变,单个参数α=θm→ 0

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-13 07:05