楼主: 能者818
1080 33

[量化金融] 二元预测与真实世界的统计差异 [推广有奖]

21
何人来此 在职认证  发表于 2022-6-24 11:40:41
很明显,如果随机变量在错误的概率类别中,可能会误判性能。不同的基础分布需要不同的样本量,因为数定律在分布中的运行方式不同。即使基础分布是厚尾分布,一系列二元预测也将非常迅速地收敛到细尾高斯分布,但对于具有区域风险敞口的人来说,经济损益跟踪绩效将需要相当大的样本量,例如,基础是帕累托分布的[33]。我们从四个可能的精确表达式开始:1)生存条件下的真实世界表现,或者换句话说,P/L或定量累积分数。2) 一组赌注,一个人的年度预测被纠正的频率的简单总和3)德芬内蒂的Brier得分λ(B)n4)M4比赛中使用的n个观测值的M4点估计得分λM4,以及其续集M5.13 141)回报空间中的P/L(生存条件下):“P/L”是自然收益和损失指数的缩写,即绩效的累积账户。设一维一般随机变量X的Xibe实现,支持inR,t=1,2。n、 真实世界的报酬Pr(.)以简化的方式表示为asPr(n)=P(0)+Xk≤Ng(xt),(10),其中gt:R→ R是一个表示支付的可测量函数;g可能是路径依赖的(以适应生存条件),也就是说,它是前一个周期τ<t或累积集水坑τ的函数≤tg(xτ)引入吸收障碍,例如破产避免,在这种情况下,我们写下:P(r)(T)=P(r)(0)+Xt≤n(Pτ<tg(xτ)>b)g(xt),(11),其中b是R中的任意数,我们称之为生存标记和(.)指示器功能∈ {0, 1}.等式11中指示符函数的最后一个条件是处理遍历性或缺少遍历性[9]。评论5。

22
何人来此 在职认证  发表于 2022-6-24 11:40:44
P/L重言式对应于真实世界的分布,在生存条件下有一个吸收屏障。2) 频率空间:标准心理学文献有两种方法。A–将预测计数为计数器时:P(P)(n)=nXi≤nXt公司∈χ、 (12)其中∈χ∈ {0,1}是随机变量x∈ “预测范围”中的χtin,以及此类预测事件的总数。B–在处理分数(校准方法)时:在没有可见的净绩效的情况下,研究人员会产生一些更先进的指标或分数来衡量校准。我们选择了“金标准”以下的De Finetti的Brierscore(DeFinetti,[34])。它之所以受到青睐,是因为它不允许套利,并且需要完美的概率校准:如果某个事件发生的概率为1,那么只有在该事件一直发生的情况下,下注的人才能获得完美的分数。Letft公司∈ [0,1]是预报员预测t的概率,https://www.m4.unic.ac.cy/wp-content/uploads/2018/03/M4Competitors-Guide.pdfTheM4比赛还需要进行范围估计,根据平均标度区间得分(MSIS)技术进行评估,这反映了变量的确定性,并映射到平均绝对偏差的分布。λ(B)n=nXt≤n(英尺)-Xt公司∈χ). (13) 对于一个完美的概率评估师来说,这需要最小化。3) 应用:M4和M5比赛:M系列(Makridakis[35])使用各种方法评估预测员,以预测点估计值(以及一系列可能的值)。

23
nandehutu2022 在职认证  发表于 2022-6-24 11:40:47
2018年的最后一场比赛M4很大程度上依赖于一系列分数λM4j,该分数在必须预测分布的第一时刻及其周围的分布的情况下非常有效。定义7:M4第一时刻预测得分M4竞争精度得分(Makridakis等人[35])根据以下指标判断竞争对手,指标为j=1,2λ(M4)jn=nnXi | Xfi- Xri | sj(14),其中s=(| Xfi |+| Xri |)和sis(通常)周期i前可用观测值的原始平均绝对偏差(即“原始”预测或样本测试的平均绝对误差),xfii预测变量i作为点估计,Xri是实现变量,n是仔细检查后的实验数量。换句话说,它是平均绝对标度误差(MASE)和对称平均绝对百分比误差(sMAPE)的应用【36】。建议M5分数(预计2020年)增加了对所考虑变量极值的预测,并重复了与定义7中原始变量相同的测试。A、 推导分布1)P(P)(n)的分布:备注3二元预测的平均计数(表示为“高于”或“低于”阈值),P(P)(n)为(使用P作为快捷方式),渐近正态平均值和标准偏差qn(P- p) 无论随机变量X的分布类别如何,结果都相当标准,但重新定义见附录。2) Brier分数分布λn:定理2不考虑随机变量X的分布,甚至不假设(f)的独立性-A1),(fn-An),对于n<+∞, 分数λnhasall阶矩q,E(λqn)<+∞.证据就我而言,(fi-Ai)≤ 1.事实上,我们可以更接近于在独立的博彩政策中完全分配分数。

24
可人4 在职认证  发表于 2022-6-24 11:40:50
假设二元预测是独立的,并遵循β分布B(a,B)(近似或包括[0,1]中的所有单峰分布)(通过两个狄拉克函数加上一个伯努利分布),并且让p为成功率p=E(Ai),对于Brier分数的n评估,λ的特征函数为νn(t)=πn/2-一-b+1Γ(a+b)pFb+1,b;a+b,(a+b+1);itn公司-(p-1) Fa+1,a;a+b,(a+b+1);itn公司(15) 这里▄Fis是正则化的广义超几何函数▄F(=F(a;b;z)(Γ(b)。。。Γ(bq))和PFQ(a;b;z)hasseries扩展P∞k=0(a)k。。。(ap)k(b)k。。。(bp)kzk/k!,是(a)(.)是液压锤符号。因此,我们可以证明如下:在上述求和独立的条件下,λnD-→ N(u,σN)(16),其中N表示高斯分布,第一个参数为平均值,第二个参数为标准偏差。u和σnare的证明和参数化见附录。3) 经济损益或定量指标的分布r:备注4生存时间T的条件,定量指标P(r)(T)的分布将遵循基础变量g(x)的分布。如果没有吸收障碍(即没有生存条件),讨论就很简单。4) M4分数的分布:绝对偏差的分布与变量本身的概率等级相同。Brier得分处于标准L2,并基于二阶矩(始终存在),正如De Finetti所说,仅以平方偏差的概率更有效。然而,对于非双星,即使存在第二时刻,在厚尾情况下依赖绝对偏差也要有效得多[37]。七、

25
mingdashike22 在职认证  发表于 2022-6-24 11:40:54
非言语回报函数和机器学习带来的好消息早期的例子侧重于简单的回报函数,在某些情况下,冲突和Ican是良性的(在细尾环境下)。非线性支付函数下概率的不可分离性:现在我们引入一个支付函数g(.)这是非线性的,即对随机变量X的经济或其他量化响应随X的水平而变化,差异变得更大,矛盾更严重。注释6(概率作为集成内核)。概率只是一个积分或求和中的一个核,而不是一个真正的东西。经济世界是关于定量回报的。备注5:概率的不可分离性T F:A→ [0,1]是概率分布(带导数f)和g:R→Ra可测函数,即“回报”。显然,对于A的Aa子集:ZAg(x)dF(x)=ZAf(x)g(x)dx6=ZAf(x)dx gZAdx公司在离散项中,带π(.)概率质量函数:(17)Xx∈Aπ(x)g(x)6=Xx∈Aπ(x)gnXx∈Ax!=事件发生概率×平均事件证明的回报。Jensen的不平等。换言之,只有当g(x)是重边函数时,事件发生的概率才是预期的回报。接下来,我们将重点放在通过“信念”或“预测”在数学上或法律上可处理但在口头上不可靠的函数上。1) 误解g:图6显示了摩根士丹利的错误历史,说明了在非线性风险敞口中错误表达的“崩溃”等口头概念。2007年,在房地产市场开始下滑之前,华尔街公司摩根士丹利(MorganStanley)决定“对冲”房地产“崩盘”。

26
mingdashike22 在职认证  发表于 2022-6-24 11:40:57
问题是,他们没有意识到“崩溃”可能会带来许多价值,有些价值比他们预期的更糟,如果有轻微的倾斜,他们会受益,但如果有较大的倾斜,他们会损失很多。他们在预测危机时表现平平,但在“对冲”中损失了100亿美元。DeclineStartingPoint 20 40 60 80 100 120-60-40-2020造成的严重损害带来的收益图。摩根士丹利的故事:一个无法用语言描述的基本非线性支付的例子。x轴代表变量,垂直轴代表回报。这种风险敞口在derivativestraders的行话中被称为“圣诞树”,通过使用strikeK购买看跌期权并使用较低的strike K出售看跌期权来实现- 还有一个更低的K- , 具有≥ ≥ 图7显示了一个更复杂的回报,称为“黄油fly”。2) g和机器学习:我们注意到,g映射到各种机器学习函数,这些函数通过通用通用逼近定理(Cybenko[38])或广义期权收益分解(见动态套期保值[13])产生详尽的非线性。考虑函数ρ:(-∞, ∞) → [K,∞), 用K,ther。v、 X∈ R: ρK,p(x)=K+对数ep(x-K) +1个p(18)我们可以用加权ωi表示所有非线性支付函数g∈R: g(x)=XiωiρKi,p(x)(19)通过某种相似性,ρK,p(x)映射到a看涨价格的值,敲打K和到期时间t归一化为1,所有利率设置为0,唯一其他参数σ为基础的标准偏差。我们注意到g(.)是ReLu函数的期望值之和:E(g(x))=XiωiE(ρKi,p(x))(20)方差和其他高阶统计度量很难以闭合或简单的形式获得。评论7。

27
kedemingshi 在职认证  发表于 2022-6-24 11:41:00
风险管理是关于改变支付函数g(.)而不是做出“良好的预测”。我们注意到g(.)不是一个指标,而是一个可以应用各种指标的目标。我们注意到机器学习使用交叉熵来衡量变量分布和预测之间的差异,这种技术无法有效地捕捉g(.)的非线性。在主成分图上,使用交叉熵的距离更有效地表示为L^2范式增强了极值。关于更长的讨论,[37]。50 100 150 200x-20-1010203040f(x)图7。奶油蛋糕(通过一系列选项或ReLuρKi构建),两边都有开口尾翼,并有一级和二级衍生品。同样,x轴代表变量,垂直轴代表回报。这个例子特别有潜力,因为它没有语言上的对应关系,但可以被optiontraders和机器学习理解。示例3。XIV是一种与波动性相关的交易所交易票据,在2018年2月波动性突然剧增后破产,同时能够正确“预测”此类变化。简单地说,他们的g(.)函数是非线性的,不适合对随机变量的第一个重要时刻进行简单的预测。下面的简单示例可以向我们展示他们的错误以及正确预测和性能之间的不匹配,以及在胖尾下发生的情况。考虑以下“短期波动率”回报函数,g(x)=1- x每日估值,其中x是资产价格的每日变动,这意味着如果x最多变动1个单位(比如标准差),则存在利润,损失超过该单位。这些条款可以在一份名为“varianceswap”的典型合同中找到。假设票据(或基金)预测平均每日(标准化)波动率将“低于1”。

28
mingdashike22 在职认证  发表于 2022-6-24 11:41:03
现在考虑以下两种类型连续7天的X偏差(以标准化标准偏差表示)。序列1(细尾):{1,1,1,1,1,0,0}。平均偏差=0.71。损益:g(x)=2。预测是正确的。序列2(厚尾):{0,0,0,0,0,0,0,5}。平均偏差=0.71(相同)。损益:g(x)=-18(半身像,真的半身像,但预测是正确的)。因此,在这两种情况下,对<1的预测都是正确的,但波动性的集中——尾巴的肥胖——产生了巨大的差异。简而言之,这说明了在金融界,“糟糕”的预测者如何造就伟大的交易员和决策者,反之亦然。生存决策是按顺序制定的。因此,如果能降低被吸收的几率,则错误校准可能是一个好主意。参见【39】和【9】的附录,其中显示了系综概率和时间概率之间的差异。《一天内n名赌徒总数的预测》见《生而必死:Inside XIV,the Busted Volatility ETN》,华尔街日报,2018年2月6日)。与一个赌徒在n天内的情况不同,这是由于条件作用。从这个意义上讲,衡量最终破产(概率为1)的管理者的静态绩效毫无意义。八、结论:最后,在现实世界中,重要的是净绩效(经济或其他),在无关紧要或有帮助的地方犯“校准”错误应该受到鼓励,而不是惩罚。偏差-方差论点在机器学习中是众所周知的,它是提高性能的手段,在理性的讨论中(见《游戏中的皮肤》[9])是生存的必要机制,也是一种非常有益的心理适应(Brighton和Gigerenzer[41]提出了一个有力的论点,即如果它是一种偏差,那么它就是一种非常有用的偏差。)如果一个错误不会让你付出任何代价,或者帮助你生存或改善你的结果,那么这显然不是错误。

29
kedemingshi 在职认证  发表于 2022-6-24 11:41:06
若这让你们付出了一些代价,并且在社会上已经存在了很长时间,那个么考虑一下这些类型的错误可能隐藏着进化上的优势——以下类型:将熊误认为石头比将石头误认为熊更糟糕。我们已经证明,在风险管理中(以及在预测社会经济和金融变量时),永远不应该在概率空间中操作。附录A。二元计数P(P)(n)的分布我们正在处理伯努利随机变量的平均值,结果众所周知,但值得重做。参数为p的伯努利分布的特征函数为ψ(t)=1-p+E(It)p。我们关注N-求和累积量生成函数ψ(ω)=logψ(ωN)N。我们有κ(p)阶累积量:κ(p)=-ippψtpt型→0So:κ(1)=p,κ(2)=(1-p) pN,κ(3)=(p-1) p(2p-1) N,κ(4)=(1-p) p(6(p-1) p+1)N,证明了p(p)(N)通过大数定律快速收敛√N、 通过centrallimit定理,以N的速率到达高斯函数,(从上面的累积量开始,它的峰度=3-6(p-1) p+1n(p-1) p)。B、 Brier得分基数概率分布f:首先,我们考虑偏离基数概率的分布。我们使用的贝塔分布涵盖了有条件和无条件两种情况(这是等式15中a和b的参数化问题)。作者的一个建议是,M5比赛通过让“预测者”预测时间序列中的最小值(或最大值)来纠正这一点。

30
能者818 在职认证  发表于 2022-6-24 11:41:09
这确保了预测器满足在水面上停留的限制条件。概率分布:让我们刷新Kolmogorov[42]提出的非参数讨论和测试背后的标准结果,以证明概率分布(sic)是稳健的这一主张背后的基本原理——换句话说,X的概率分布并不依赖于X的分布([43][32])。概率积分变换如下。设X有一个连续分布,其累积分布函数(CDF)为FX。然后,在没有其他信息的情况下,定义为U=FX(X)的随机变量在0和1之间是一致的。证明如下:对于t∈[0,1],P(Y≤ u) =P(FX(X)≤ u) =P(X≤ F-1X(u))=FX(F-1X(u))=u(21),是均匀分布的累积分布函数。无论x的概率分布如何,情况都是这样。显然,我们正在处理1)fβ分布(如上文所述,在纯粹随机的情况下为特例均匀分布,或在具有一定精度的情况下为β分布,其中均匀分布为特例),以及2)概率为p的Ata贝努利变量。让我们考虑一般情况。设ga,bbe为beta分布的PDF:ga,b(x)=xa-1(1 - x) b类-1B(a,b),0<x<1。结果有点笨拙但可控:u=a(-(p- 1)) - ap+a+b(b+1)pΓ(a+b)Γ(a+b+2),σn=-n(a+b)(a+b+1)a(p- 1) +a(p- 1)- b(b+1)p+(a+b+2)(a+b+3)(a+b)(a+b+1)(p(a- b) (a+b+3)(a(a+3)+(b+1)(b+2))- a(a+1)(a+2)(a+3))。我们可以进一步验证,由于其峰度小于3,Brier分数比高斯分数具有更细的尾部。证据我们从yj=(f)开始-Aj),连续贝塔分布随机变量和离散贝努利随机变量之间的差异,均由j。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 05:16