楼主: 何人来此
2015 51

[量化金融] Wasserstein距离下的模型风险度量 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-10 17:22:57
为了与前面使用的符号一致,我们用运输计划γ表示边际分布pX、pYby p、q和联合分布pX、yb。值得注意的是,转换将初始分布p(x)转换为最终分布q(y),从而导致状态空间上度量的变化Ohm.模型风险度量的关键任务之一是求解特定约束条件下的最坏情况模型。这些约束设置了合法替代模型的标准。现在用V(x)(x)表示损失函数∈ Ohm), 参考模型的概率密度函数为p(x),备选模型的概率密度函数为q(x)。我们用所有合法模型的期望损失的上确界supq(y)Z来描述这个问题Ohmq(y)V(y)dy(9)根据上一节的讨论,我们将测度的变化视为概率态跃迁。备选模型的概率密度函数q(y)仅仅是联合密度(或运输计划)γ(x,y)的边缘化,即q(y)=ROhmγ(x,y)dx。这允许我们取γ(x,y)上的上确界,而不是q(y):supγ(x,y)ZOhm×Ohmγ(x,y)V(y)dxdy(10)上确界问题的第一个约束来自节理密度w.r.t x的边缘化,如参考模型Z所示Ohmγ(x,y)dy=p(x)(11)与Glasserman和Xu的工作类似,我们通过与参考模型的距离来限制所有替代测量。现在,距离由等式8中给出的平均运输成本来衡量。它反映了根据运输计划γ(x,y),试图将一个状态x转移到另一个状态y的敌对对手所支付的预期成本。这导致以下约束,这些约束定义了一组合法的度量:ZOhm×Ohmγ(x,y)c(x,y)dxdy≤η(12)式中的常数η。

12
nandehutu2022 在职认证  发表于 2022-6-10 17:23:00
12被称为Wasserstein距离预算,就像Glasserman和Xu方法中的相对熵预算一样。为了解释特定的密度函数q*(y) 在等式给出的约束上确界问题中。9-12,Wasserstein距离,在公式4中定义,q*(y) 名义密度p(x)不能超过η。事实上,如果q*(y) 可通过边际化运输成本γ获得*(x,y)满足等式11-12,然后根据等式4,其瓦瑟斯坦距离与标称密度函数p(x)isW(p,q*) = infγZOhm×Ohmγ(x,y)c(x,y)dxdy≤ZOhm×Ohmγ*(x,y)c(x,y)dxdy≤ 另一方面,如果W(p,q*) < η、 然后是密度函数q*(y) 可以用运输计划γ的边缘化来表示*(x,y)这令人满意。11-12. 否则,在Wasserstein距离的定义中,公式4,η为termZ设置了较低的界限Ohm×Ohmγ(x,y)c(x,y)dxdy(14),因此,作为上述项的上限,瓦瑟斯坦距离等于或大于η。这立即违反了假设W(p,q*) < η. 综上所述,η设置了Wasserstein距离的最大水平(预算),以使备选度量值合法。值得注意的是,即使问题(方程式10-12)是使用运输计划(Kantorovich公式)来制定的,其解决方案也可以用运输图T来表示*: Ohm → Ohm,T*(x) =arg最大值∈OhmV(y)-c(x,y)β(15) 其中β∈ R++是一个常量。根本原因是方程式14 w.r.T运输计划γ的线性。假设最坏的情况是将一个状态XT传输到另一个状态T*(x) 。那么,竞争对手就没有动机将x转移到T以外的国家*(x) ,比如T(x),因为对手可以通过增加γ(x,T)来继续改进目标*(x) 同时减少γ(x,T(x))(以相同的量)。公式推导示意图见附录A。

13
mingdashike22 在职认证  发表于 2022-6-10 17:23:03
15.3.2运输计划的熵约束Q。15为inEq制定的问题提供了最坏情况下的运输图。10-12. 这种表述实际上假设了双方之间的零和博弈,在这种博弈中,我们的对手试图将状态x转换为y*(x) (决定性地)使其利益(因此我们的损失)最大化。以秒为单位。2.1,我们提到,实际的市场结构可能更具竞争力,包括或多或少独立行动的异质代理。这需要一个广泛的跃迁密度y | X(y | X)(而不是δ函数)。在实践中,具有广泛分布的传递度也是有利的。出于风险管理的目的,由于模型的模糊性,我们需要考虑广泛的替代措施。因此,广泛分布通常比狭窄分布更具代表性。从信息论的角度来看,广泛分布包含的信息较少(熵较多),因此更适合表示模型模糊度。现在考虑一下基于f-发散的方法不适用的实际情况。它们通常具有过于严格的参考度量,因为它们仅由(状态空间的)子空间支持。要正确量化模型风险,应考虑整个状态空间支持的广泛分布。然而,这些分布并没有明确的f-散度w.r.t作为参考度量,这提供了这些方法的一个固有问题。使用Wasserstein度量代替f-Differencei的主要目的之一就是解决这个问题。具体而言,我们希望包括所有措施,不考虑其支持。这一目的是通过使用Kantorovich的公式实现的,如第。2.2.

14
可人4 在职认证  发表于 2022-6-10 17:23:06
然而,如等式15所示,在没有进一步约束的情况下,最坏情况模型仍然可以通过运输图来实现。如果参考度量仅由子空间支持,则这会导致最坏情况度量具有限制性。为了实现广泛的最坏情况分布,可能需要对等式10-12施加进一步的限制。用P表示的狄拉克参考度量值提供了一个特殊示例,其中eq。15不适合描述最坏情况。应用交通地图T*结果是{T(x)}支持的最坏情况度量,其中x是supp(P)中的唯一元素。最坏的衡量标准也是狄拉克。在大多数情况下,这种最坏情况下的度量不恰当地解释了模型的模糊性。为了解决这个问题,我们可以进一步施加熵约束,以确保最坏情况度量得到整个状态空间的支持:-ZOhm×Ohmγ(x,y)lnγ(x,y)dxdy≥ u(16)LHS是联合分布(运输计划)γ(x,y)的(差别)熵[6],RHS是常数u∈ R(或正常数u∈ 离散状态空间的R++)。此约束不包括与交通地图等效的所有交通计划。事实上,每个运输图都给出了一个具有δ-函数转移密度的运输计划(见等式5)。对于此类运输计划,δ函数使等式16的LHS接近负单位(或离散状态空间为零),因此被排除在外。或者,可以根据跃迁密度函数pY | X(y | X)来解释等式16。我们可以通过-ZOhm×Ohmγ(x,y)ln pY | x(y | x)dxdy≥ u+ZOhmp(x)ln p(x)dx(17)等式17对跃迁密度函数施加了限制。更严格的限制(u更大)意味着更宽的转变密度,反映出更具竞争力的市场结构。

15
大多数88 在职认证  发表于 2022-6-10 17:23:09
另一方面,如果我们通过将u移向负单位(或离散状态空间为零)来完全放松约束,那么我们允许跃迁密度以δ函数的形式出现,对应于单主体对手。我们可以进一步引入信息论中的术语,并重写等式17byZOhmp(x)H(Y | x=x)dx≥ u - H(X)(18),其中H(X)表示随机变量X的熵[6]。由于其分布p(x)由参考模型给出,因此H(x)被视为常数。另一方面,H(Y | X=X)是信息熵w.r.t转变密度pY | X(Y | X)。它被解释为随机变量Y的熵,以X为条件,取给定值X。H(Y | X=X)量化给定状态X的运输不确定性。通常,竞争越激烈的市场,涉及更多独立决策者,导致更不确定的状态转换,从而产生更大的H(Y | X=X)。因此,等式18允许我们通过参数化u来合并实际的市场结构。值得注意的是,在信息论中,LHS ofEq。19被称为条件(微分)熵,用H(Y | X)表示[6]。这导致了constraintEq的等效信息论版本。16: H(Y | X)≥ u - H(X)(19)3.3主要结果和讨论等式10的最大值问题,受等式11、12和16的三个约束,制定了模型风险度量的Wasserstein方法的完整版本。现在假设存在联合分布γ*(x,y)解决了这个问题。然后,最坏情况模型的特征是概率密度函数Q*(y) =Zx∈Ohmγ*(x,y)dx,y∈ Ohm (20) 为了解决约束上确界问题,我们引入了两个乘法器α∈ R+和β∈ R+,并将原始问题转化为对偶问题。

16
kedemingshi 在职认证  发表于 2022-6-10 17:23:12
解决对偶问题的内部导致了我们的主要结果(参见附录B的推导):q*(y) =ZOhmdxp(x)扩展V(y)α-c(x,y)αβROhm经验值V(z)α-c(x,z)αβdz(21)值得注意的是,乘数α和β实际上是控制变量,分别决定熵约束方程16和运输约束方程12的约束水平。α接近零时的极限对应于熵约束方程16的完全松弛。在此极限下,公式20退化为由公式15给出的输运图所诱导的概率密度函数。在光谱的另一端,由于严格的熵约束,当α接近完整性时,等式20接近均匀分布。在β=0的极端情况下,公式20得出一个简单的结果q*(x) =p(x)。这是因为等式12的运输约束达到其最紧极限(η=0)。不允许状态转换,因此保留了参考模型。另一方面,当β接近实际值时,最坏情况分布q*(y)~ exp(V(y)/α)呈指数分布。在这种情况下,运输成本基本上为零。因此,最坏情况下的度量是最大化期望值V(Y)并具有相当大的熵的度量(最大期望值由arg maxyV(Y)处的Dirac度量给出,但这会导致非常低的熵)。表21列出了公式21的特殊情况。1表示α和β的不同值。表1:不同(α,β)组合下的最坏情况概率密度函数。p为名义分布,u为均匀分布。δ表示Diracδ-泛函和T*是等式15给出的交通图。α = 0 αα → ∞β=0p(x)βp(T*-1(x))/| JT |由公式20给出→ u(x)β→ ∞ δ(x-arg最大V(x))∝ eV(x)/α3.4根据表进行的实际考虑。

17
mingdashike22 在职认证  发表于 2022-6-10 17:23:17
1,当α接近整体时(即在最严格的熵约束下),最坏情况下的度量接近均匀分布。实际上,我们可能希望最坏情况下的分布收敛到给定的密度函数,而不是均匀分布。这需要通过将熵约束公式19推广到-DKL(P(Y | X)| Q(Y))≥ u - H(X)- H(Y)(22)DKL(P(Y | X)| Q(Y))表示条件相对熵,由两个概率密度函数w.r.t Y,pY | X(·| X)和Q(·)的KL散度的期望值DKL(P(Y | X=X)| Q(Y))给出。条件相对熵的形式为dkl(P(Y | X)| Q(Y))=ZOhmp(x)ZOhmpY | X(y | X)lnpY | X(y | X)q(y)dy公司dx=ZOhm×Ohmγ(x,y)lnγ(x,y)q(y)dxdy-ZOhmp(x)ln p(x)dx(23)将等式23替换为等式22,可以获得约束的显式版本:-ZOhm×Ohmγ(x,y)lnγ(x,y)q(y)dxdy-ZOhmq(y)ln q(y)dy≥ u(24)很明显,前面的熵约束等式16只是Eq的一个特例。其中QI为均匀分布。根据这个公式,我们需要解决的问题由等式10、11、12和24组成。结果与等式不同。21加权函数q(推导见附录B):q*(y) =ZOhmdxp(x)q(y)expV(y)α-c(x,y)αβROhmq(z)扩展V(z)α-c(x,z)αβdz(25)值得注意的是,公式25的形式与Bayes定理相似,并且qserves是先验分布。事实上,如果条件分布采用以下形式:p*X | Y(X | Y)∝ 经验值V(y)α-c(x,y)αβ(26)然后Bayes定理指出P*Y | X(Y | X)=p*X | Y(X | Y)q(Y)EYp*X | Y(X |·)q(·)=q(y)经验V(y)α-c(x,y)αβROhmq(z)扩展V(z)α-c(x,z)αβdz(27),即观察X=X时Y的后验分布。

18
可人4 在职认证  发表于 2022-6-10 17:23:20
现在,如果我们观察到x上的分布p(x),那么我们可以推断Y到beq的分布*(y) =ZOhmp(x)p*Y | X(Y | X)dx=ZOhmdxp(x)q(z)expV(y)α-c(x,y)αβROhmq(y)经验V(z)α-c(x,z)αβdz(28),这正是等式25中给出的最坏情况分布。贝叶斯定理和公式25之间的联系不仅仅是巧合。事实上,公式28中给出的Y的最坏情况分布可以视为潜在变量的后分布。另一方面,由p(X)给出的X的参考模型被认为是实际观察到的分布。假设不存在参考模型(即未对X进行观测),则我们对潜变量Y的最佳猜测仅由其先验分布q(Y)给出。现在,如果可观测变量X确实取一个特定值X,那么我们需要根据贝叶斯定理(等式27)更新我们的估计。条件概率密度p*X | Y(X | Y)采用公式26的形式,反映了可观测变量X和潜在变量Y相距不远的事实。假设我们在标称分布p(x)之后生成一个采样集{xi},然后对于每个xi,我们得到一个后验分布p*公式27中的Y | X(Y | xi)。总的来说,潜在变量Y上分布的最佳估计是这些后验分布的聚集结果。这是通过将它们的概率p(xi)加权平均来实现的,如等式28所示。这导致了对模型风险度量的贝叶斯解释,其结论是,通过对可观测变量x“观察”参考模型p(x),通过更新潜在变量Y的分布,从先验分布q(Y)到后验分布q,给出了最坏情况下的模型*(y) 。表2:具有先前qat不同(α,β)组合的最坏情况密度函数。是标称分布。

19
可人4 在职认证  发表于 2022-6-10 17:23:23
δ表示Diracδ-函数和T*是等式15给出的运输图。α = 0 αα → ∞β=0p(x)βp(T*-1(x))/| JT |由公式25给出→ q(x)β→ ∞ δ(x-arg最大V(x))∝ q(x)eV(x)/α如果我们对参考模型一无所知,那么将先前的qt设置为均匀分布似乎最有意义(因为均匀分布使熵最大化,因此包含的信息最少)。这导致了公式21得出的主要结果。然而,有时选择一个先验比均匀分布更方便。一个特别有趣的情况是将qthesame设置为标称分布p。在这种情况下,β的极限→ ∞ (运输约束的完全放松)由Q给出*(x) =p(x)eθV(x)ROhmp(x)eθV(x)dx(29),其中我们替换参数α-1byθ。这个极限正是相对熵方法给出的最坏情况分布。尽管等式29很简单,但不建议设置q=p,因为这样做会失去改变参考度量支持度的能力。实际上,相对熵方法的一个常见问题是,式21中的分母可能不可积。为了了解这一点,我们研究了相对熵方法下最坏情况下的密度函数:q*KL(x)∝ p(x)eθV(x)(30)如果V(x)增加得太快(或p(x)Decastoo缓慢,如在重尾情况下),则等式30的RHS可能不可积。例如,我们考虑最坏情况方差问题,其中V(x)=x。如果参考模型遵循指数分布,则等式30不可积。然而,使用提议的Wasserstein方法,选择适当的优先Qs的灵活性有助于我们绕过这个问题。事实上,人们可以选择一个不同于标称分布p的先验分布q,以保证其衰减足够快。根据等式。

20
何人来此 在职认证  发表于 2022-6-10 17:23:26
我们只需要保证Q(y)expV(y)α-c(x,y)αβ(31)是可积的w.r.t y。幸运的是,总是可以找到一些满足此标准的QT。作为一个简单的选择,我们可以设置q(y)∝ e-V(y)/α以确保可集成性。这样的选择使得等式31与xp成正比-c(x,y)αβ(32)我们假设状态空间Ohm 是一个具有有限维数的欧几里德空间,运输成本c(x,y)由其欧几里德距离给出。那么对于allx∈ Ohm 公式32是可积的w.r.t y,因为当y离开x时,被积函数会以指数形式减小。总之,使用相对熵约束q来描述问题。24允许灵活选择先验分布q。这实际上很有用,因为可以通过选择适当的先验来避免可积性问题。如Glasserman和Xu[7]所述,相对熵方法不具有这种灵活性,这被视为一种特殊情况,在此情况下,先前的qequals p.4应用程序4.1跳跃风险在一个不同的参考模型下,我们从一个以几何布朗运动形式出现的价格过程开始,T=uStdt+σStdWt(33)。T时的对数回报遵循正态分布:x:=lnSTS公司~ Nu -σT、 σT(34)当波动率为零时,收益率具有确定性,分布密度isp(x)=limσ→0√2πTσe-[x-(u-σ/2)T]2σT=δ(x- uT)(35)在这种情况下,无法使用f-散度对模型风险进行量化。事实上,参考度量是狄拉克度量,因此不存在等效的替代度量。特别是在KL散度下,最坏情况下的测度由p(x)eθV(x)R计算Ohmp(x)eθV(x)dx=δ(x- uT)(36),与参考测量值相同。这与Girsanov扩散过程定理一致,该定理指出漂移项的变化量与波动率成一定比例,即¢u=u- λσ.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 11:08