人大经济论坛 › 论坛 › 经济学人二区 › 外文文献专区 › 关于双参数Poisson-Dirichlet的金融应用

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

发帖

楼主: mingdashike22

415 21

[量化金融] 关于双参数Poisson-Dirichlet的金融应用 [推广有奖]

11楼

能者818

发表于 2022-6-27 22:11:07 |只看作者 |坛友微信交流群

上面的10个分区是通过添加一个新框来实现的：o一种方式是4个具有形状的分区，另一种方式是3个具有形状u=4的分区，$$JJJJJJJJJu=3，//对于年轻的图，c组合式（1）提供的u（c）等于o具有给定块大小的集合分区的数量，o在财务方面与rankedcapitalizations描述的市场形成状态的方式相同。分区上的可交换概率分布将相同的概率分配给具有相同形状的所有分区。当人们有兴趣研究排名块大小（大写）的分布，而不考虑块标签（标记）时，此框架非常有用。如果πn（c）表示具有n个元素和shapec的分区的概率，那么具有该形状的所有分区的总概率ispn（c）=u（c）·πn（c）显然，这些概率在具有n个元素的所有形状（杨氏图）上的总和必须为1。在数学遗传学的背景下，金曼[19]考虑了n=1、2、3的分区上的分布族{pn}。。元素，并注意到随机抽样会导致自然一致性约束，将n级分布连接起来-他把满足这种约束的分布称为{pn}划分结构。继续这个示例，让我们考虑10个具有该形状的分区。在每个分区中，可以删除5个盒子中的任何一个，这样剩余的分区将有4个元素。对于每个分区，有2种方法可以获得3/5oo2/5ddddaddduniform删除5个元素的分区上的一个框，可以在4个分区上得到概率分布。

使用道具举报

12楼

nandehutu2022

发表于 2022-6-27 22:11:10 |只看作者 |坛友微信交流群

例如P =p +p 另一方面，这种一致性约束定义了分区增长的前向条件概率，例如-→=p .p 换句话说，分区结构是在增长（或上升）和衰退（或下降）下一致的分区上的一系列分布。这使得我们能够将市场动态视为由上下转换序列驱动的分区上的组合随机游动过程。2可交换分区2.1集合分区的描述星系、恒星、公司、人形成集群，这些集群的大小很少是统一的。可以从以下角度考虑金融和经济类股票和公司：股票市场由k只股票组成，总资本为n个货币单位。如果i-thlargest公司的nidenotes价值（按资本化计算），则市场权重由xi=ni/n和向量x=（x，x，…）表示资本分配曲线。新的货币单位可以加入任何股票，从而将特定股票的资本化增加到ni+1，总资本化增加到n+1，或者货币单位可以将股票的相应股票和市场资本化减少1。此外，有可能在IPO期间发行新股，这将导致集群数量增加到k+1同样，公司资产/价值可能会增加或减少。此外，一家新公司也有可能进入市场在共同基金行业，进入市场的资金与现有基金的规模成比例地合并，但新基金的出现总是有机会的。聚类过程可以用一个集合的分区来表示。

使用道具举报

13楼

mingdashike22

发表于 2022-6-27 22:11:13 |只看作者 |坛友微信交流群

例如，三个字母“a”、“b”和“c”的集合可以按如下所示在左栏中进行分区，右栏中相应的年轻图表示分区类：{a、b、c}{a、b}、{c}{a、c}、{b}{b、c}、{a}、{b}、{a}、{b}、{c}，如果在集合分区中，则用集群/块表示，集群标签并不重要，每个集群内项目的顺序也不相关，所以这种分区称为可交换分区。这样的分区具有相同的形状，并且完全由其块大小的向量来描述。具有相同形状的分区属于相同的可交换类（或分区类）。以三家公司为例，集合{a，b，c}有5个分区和3个可交换类，由右列中的年轻图表表示。n个元素到k个簇（块）的每个可交换分区可以用两种方式描述。1、对于一阶描述，由于簇的标记并不重要，因此可以方便地考虑按降序排列的簇大小n>n>…>nk，其中nidenotes是第i大簇的大小，因此n=n+····+nk在种群生物学术语中，它被称为频率向量：n=[n，n，…nk]显然，年轻的图对应于这个描述。2、对于第二种描述，让cdenote number of clusters of size 1，cdenote number of clusters of size 2，etc.如果Cj表示带有j个项目的集群数量，那么项目总数isn=c+2·c+···········································································。为了区分划分向量c和频率向量{}，使用DC={c，c。

使用道具举报

14楼

mingdashike22

发表于 2022-6-27 22:11:16 |只看作者 |坛友微信交流群

}让c （n，k）表示向量c描述了将n个元素划分为k个簇。2.2可交换类的大小每个可交换类都包含集合分区，由相同的分区向量c={c，c，c，…}表示。用向量c描述的类中的分区数由u（c）=n给出！Qcj！（j！）cj（1）的确，通过多项式公式，具有锥元素子集、ctwo元素子集等的划分数是！1.1!| {z}ctimes2。2!| {z}C时间。必须由QCJ划分！因为相同大小的块的排列不起作用。例如，4个元素集{a，b，c，d}有15个分区和5个可交换类：{a，b，c，d}n=[4]c={0，0，0，1}u（c）=4！(4!)= 1{a，b，c}，{d}n=[3，1]c={1，0，1，0}u（c）=4！(1!)(3!)= 4{a，b，d}，{c}{a，c，d}，{b}{b，c，d}，{a}{a，b}，{c，d}n=[2，2]c={0，2，0，0}u（c）=4！2.(2!)= 3{a，c}，{b，d}{a，d}，{b，c}{a，b}，{c}，{d}n=[2，1，1]c={2，1，0，0}u（c）=4！2.(1!)(2!)= 6{a，c}，{b}，{d}{a，d}，{b}，{c}{b，c}，{a}，{d}{b，d}，{a}，{c}{c，d}，{a}，{b}，{c}，{d}n=[1，1，1]c={4，0，0}u（c）=4！4.(1!)= 有趣的是，分区n=[2，1，1]可以通过6种方式实现，而统一分区n=[2，2]只能通过3种方式实现。2.3分区结构如果分区向量为c的类中的所有分区都被认为是等效的，那么它们应该具有相同的概率。如果πn（c）表示分区类别c中元素与u（c）元素的概率，那么可交换类别ispn（c）的概率=u（c）·πn（c），显然，这些概率应满足yxc（n） pn（c）=1（2），此处为c （n）表示求和运行在n个元素的所有类的分区上。分区结构。一般来说，为所有n的值在分区类上分配概率度量是不够的。

使用道具举报

15楼

可人4

发表于 2022-6-27 22:11:19 |只看作者 |坛友微信交流群

Kingman[19]注意到，除了（2）之外，还有连接可交换概率度量pn的一致性条件-1和pnand称这种{pi}划分结构的一致序列。2.4 Ewens-Pitman抽样公式Ewens在《种群生物学》一书中提出了单参数断棒模型（6）的有限维对应物。给定划分向量c Ewen的采样公式分配概率asp（c）=θkθ[n]n！Qcj！jcj（3）Pitman研究了双参数模型（7）的尺寸偏差表示，并在[24]中获得了Ewen抽样公式的相应扩展。双参数Pitman抽样公式（PSF）给出了划分类cp（c）=θ[k，α]θ[n]n！Qcj！Y(1 - α） [我-1] 我！ci（4），其中θ[k，α]=θ（θ+α）····（θ+α（k- 1），这表明对于α=0，公式收敛到（3）。Kerov[17]提出，公式（4）可以通过条件相关变量的随机分配模型得到。2.5中餐厅流程中餐厅流程提供分区的概率动力学，确保概率保持不变。扎贝尔（Zabell）[28]将这个比喻解释为“在伯克利的任何一个晚上，都有大量的人去市中心的一些中餐馆。当每个人到达时，他都会看着每个餐厅的窗户，决定是否进去。他进去的机会随着已经在里面看到的人数的增加而增加。。。但他很可能去了一家空荡荡的餐厅……”更正式地说，假设第一张空桌（如表1）上有有限数量的桌子（餐厅）和第一位顾客的座位。

使用道具举报

16楼

mingdashike22

发表于 2022-6-27 22:11:23 |只看作者 |坛友微信交流群

客户n+1观察被占用的k个表，并o将表与概率i=ni的nipeople连接- αn+θo将新的未占用表与probabilityp连接起来*=θ+αkn+θ重要的是，这个过程在分区上提供了可交换的概率。例如，分区n=[2，1，1]可以迁移到以下状态2-αθ+41-αθ+41-αθ+4θ+3αθ+4o@@//:::::::::::oo2.6作为分区随机游动的有限维离散有序有限单纯形中的扩散过程由Petrov、Olshanski、Borodin（[3]、[23]、[12]）、Feng等人（[8]、[7]、[6]）以及Ruggiero和Walker（[27]）开发。Costantini、Garibaldi等人独立地研究了由向下-向上转换引起的马尔可夫链。（[15]、[14]）。近似双参数扩散过程的想法相对简单。让我们固定一些大的n，从一些分区开始，让我们考虑向下和向上跳跃，其中o向下移动随机删除Young图中的一个单元格o向上移动根据中餐厅流程执行例如，下图显示了4个分区与相应DU链之间的可能转换：wwpppppppppooqqqqxxqqqqqqookkkkeekkkkkkchhhhhhhhh（a）下链//ppppppp//%%kkkkkkkkkkkkkkkkkqqqqqqqqqqqqqqqookkkkkkkkkkkkkkkkkkkkkkkkkkkkkchhhhhhhh（b）上链OOOOOOOO盎司：z:z:z:z:z:e%e%e%e%e%OO（c）DU-chain图7：向下-向上转换的示例d-和U-运算符保留了Ewens-Pitman抽样公式给出的概率结构，因此获得的马尔可夫链也保留了此分布。

使用道具举报

17楼

可人4

发表于 2022-6-27 22:11:27 |只看作者 |坛友微信交流群

下图说明了参数α=0.3，θ=50 200 400 600 800 1000 12000.10.150.20.250.30.35的Kingman单纯形中扩散过程的近似值。图8：分区上的扩散样本路径，顶部五个xi（t）3 Dirichlet分布和尺寸偏差采样3.1 Dirichlet分布断棒模型是更一般的Dirichlet分布的特例，这是一个比例向量上的概率度量。其密度函数由向量α=（α，…，αm）p（x）=Γ（pαi）Γ（α）···Γ（αm）xα参数化-1···xαm-1根据单纯形的比例向量定义分布m级=x个∈ Rm | Pmi=1xi=1，xi>0表示向量x很方便∈ 用参数向量αasx描述的m维Dirichlet分布~ Dm（α）Dirichlet分布的另一种等效定义是通过伽马变量向量的归一化来证明其性质。对于m个独立gamma分布变量yi~ 由x定义的比例G（αi）向量=yPyi，···，ymPyi具有Dirichlet分布x~ Dm（α）。γ分布具有y的卷积性质~ G（α），y~ G（α）y+y~ G（α+α）这一性质以及卢卡奇特征，表示它是唯一的分布，与y+y具有独立性，简化了以下性质的证明。属性。设θ=Pmi=1αidenote参数之和。如果yo=Pmj=1yjdenotes独立gammavariables之和yi~ G（αi），那么这个和有γ分布yo~ G（θ）的卷积性质。如果分量yi被分离，其他分量被集中在一起，则向量（yi，Pj6=iyj）具有独立分量，其伽马分布参数为αi和θ- αi相应。

使用道具举报

18楼

能者818

发表于 2022-6-27 22:11:30 |只看作者 |坛友微信交流群

从标准化结果来看，xi=yi/yo具有β分布xi~ B（αi，θ- αi）Let x[-i] 表示从向量xx中删除第i个分量[-i] =（x，…xi-1，xi+1。。。xm）因为在向量x中∈ 分量的msum为1，在向量x中[-i] 组件之和变为1- 因此，归一化向量x[-i] /（1- xi）属于m级-1简单。Dirichlet分布具有中立性的一个重要性质，即独立于xiand x[-i] /（1-xi）。此外，如果原始向量x~ Dm（α），thenx[-i] 1个- xi~ Dm公司-1(α[-i] ）对于m=2，此属性很简单。对于任意维，让我们考虑具有m个独立gammavariates yi的向量和相应的Dirichlet分布向量，分量xj=yj/yo。从两个向量中去除第i个分量，并对第二个分量进行归一化，得到j 6=ixj·1- xi=xj·1- Yjyoyo=Yjyoyo- yi=yjPk6=iykIndependence（中立）源自Lucacs property。测试棒断裂。这些性质表明，从Dirichletdistribution中进行采样的方法是断棒法。让我们想象一下，一根单位长度的棍子是通过以下一步一步的过程断开的。根据边际属性，第一个分量x=Z可以建模为Z~ B（α，θ- α）通过中立性，第一块可以被打破。其余部件有Dm-1(α[-i] ）分发。对于斗杆长度为1的其余部分重复该步骤- X带Z~ B（α，θ- α- α） xx=z（1- z） z1级- z1级- z生产新零件x=z（1- z）剩余长度（1- z）（1）- z） =1- x个- xetc。一般按kzk阶段~ B（αi，θ-Pkj=1αj）xk=zkk-1Yj=1（1- yj）=zk1.-k-1Xj=1Xj对于k=m，最后一个分量只是一个余数。

使用道具举报

19楼

mingdashike22

发表于 2022-6-27 22:11:33 |只看作者 |坛友微信交流群

在对称Dirichlet分布的情况下，αi=α破缺规则simpli fies tozk~ B（α，θ- kα）xk=zk（1- x个- ··· - xk公司-1） 3.2尺寸偏差抽样上段中的勾选打断法从Dirichlet分布分量中逐分量抽样比例。在许多应用中，以及在泊松-狄利克雷分布的发展中，更重要的是研究按降序排列的比例x（1）>x（2）>。因此，如果有一个过程可以从分布中给出输出顺序统计信息，那将更加方便。总的来说，这并不容易，但是可以设计一种模拟策略，提供真实分布中外观比例的样本，这是由尺寸偏差抽样给出的。假设给定一个Dirichlet分布向量x~ Dm（α）随机选择其一个分量，因此xjis是选择第j个分量的概率。或者，可以将其可视化为在长度为1的木棍上均匀放置一个点，该木棍除以比例x，x。。选择该点所在的比例/块。这个比例的值被称为尺寸偏差样本，显然，选择最大工件的机会最高，等等。一旦选择了比例，就将其分开，并用归一化残差重复该过程。结果是向量x的大小偏差排列，其中分量随机交换，偏向有序情况。排列向量中第一个尺寸偏差拾取的密度函数可以通过以下参数找到。比例ex可与概率ex一起选取，作为向量的第一个分量（ex，x，…，xm）或向量的第二个分量（x，ex，x，…，xm）等。

使用道具举报

20楼

大多数88

发表于 2022-6-27 22:11:36 |只看作者 |坛友微信交流群

在每一种特殊情况下，无条件概率的发现相当于Dirichlet密度的边缘化，从而产生β密度Bαi，θ-αi（ex），因此总概率isp（ex）=mXi=1ex·Bαi，θ-αi（ex）在尺寸偏差pick Simples top的对称Dirichlet分布密度（ex）=exmαΓ（αm）αΓ（α）Γ（θ- α） exα-1(1 - ex）θ-α-1=Γ(θ + 1)Γ(α + 1)Γ(θ - α） exα（1- ex）θ-α-1换言之，第一个SBP ex=eyhas beta分布，带移位参数ex~ B（1+α，θ- α）在打破第一个SBP并反复应用该程序后，可以证明从斗杆剩余部分打破的工件具有β分布zk~ B（1+α，θ- αk）（5）和相应的比例Sexk=ezk（1- 前任- ··· - exk公司-1）由于θ=αm，模拟在阶段k=m终止- 1，剩余部分的exmis长度。以这种方式获得的样本有先出现较大比例，然后出现较小比例的趋势。显然，在对比例进行排序后，这两种方法（标准方法和有尺寸偏差的方法）产生了相同的分布序列，因为SBP只随机置换对称Dirichlet向量的分量。首先，尚不清楚SBP的目的是什么，因为有序Dirichlet distributedvector的成分可以通过标准程序进行采样，然后进行排名。然而，正如下文所示，size biasedsimulation允许从直接无法访问的案例中进行采样。4泊松Dirichlet分布4.1对称m维Dirichlet分布Dm（α）的单参数族让我们考虑极限情况，其中维数ym→ ∞ θ=αm，这意味着，当尺寸趋于完整时，总电荷θ保持不变，单个参数α=θm→ 0

使用道具举报