楼主: 何人来此
1286 28

[量化金融] 基于信息熵的市场效率量化 [推广有奖]

11
可人4 在职认证  发表于 2022-6-11 06:00:00
在第4节中,效率的定义也可以从第2节中描述的主要概念中推导出来,反之亦然。在第5节中,可以引入一个增强的、更广义的定义。设X是一个s系统,系统中的事件X具有给定的概率分布p(X)。我将系统X相对于信息的效率定义如下:e ff(X | Y)=H(X | Y)H(X)(1)H(X)是系统X的信息熵,由以下公式给出:H(X)=-Xxp(x)logp(x)(2)H(x | Y)是给定信息的系统x的条件熵。对于给定的信息Y=Y,它是:H(X | Y=Y)=-Xyp(y)Xxp(x | y)logp(x | y)(3) p(x | y)是如果给定事件y的信息,则实际事件x发生的概率。H(X)c可以用不同的方式来解释,这涵盖了系统的不同方面:1。它测量系统中的不确定性量。2、系统中包含的平均信息量(意外值)。根据香农[38],这是可以传输的信息量。它是衡量信息内容可预测性的一种方法。对于H(X | Y),通常有以下解释:1。H(X | Y)描述了已知信息Y时系统X的不确定性。在第5节中,我将定义扩展到更一般的情况。根据Shannon[38]的定义,该概率可以通过贝叶斯公式p(x | y)=p(y | x)p(y | x)+p(y | x)从概率p(y | x)计算得出,其中p(y | x)是在真实事件x发生时获取信息的概率,而p(y | x)是在真实事件x发生时无法获取信息的概率。2.

12
可人4 在职认证  发表于 2022-6-11 06:00:03
术语H(X | Y)可以表明当信息Y已知时,系统X中的可预测性有多大。由于所有的解释在数学上都是相同的,我将在随后的章节中遵循所有这些解释,并参考熵的方面,它在每种情况下都给出了最好的解释。从公式(1)开始,我表明效率定性定义的主要思想可以从新的效率定义中得出:Imaginea s系统是完全有效的,因此效率(X)=1。在这种情况下,H(X | Y)=H(X)。因此,系统的可预测性不受外部信息的影响。该系统包含独家信息和保持不可预测性的效率是最高的,这与有效市场的常见定性定义相对应。如果E fff(X)=0,则H(X | Y)=0。在这种情况下,系统包含独家信息的效率是完全无效的,因为X的所有信息都可以通过了解y得到,这与有效市场的常见定性定义相对应。根据定义,我们可以进一步看到,任何0>eff(X)>1的系统,因此,H(X)>H(X | Y)并非完全有效。这是合理的,因为至少系统X的一些信息可以通过使用信息Y来预测。在这种情况下,效率等级可以在0%到100%之间量化,从而实现系统效率的分级。作为系统的标准效率(X),我用信息集Y定义特殊情况*:E fff(X)=E fff(X | Y*) =H(X | Y*)H(X)(4),其中Y*表示有关系统X的所有可用信息。“all”信息表示给定环境中某一时刻可能提供的最佳信息。

13
nandehutu2022 在职认证  发表于 2022-6-11 06:00:06
Y的定义*强调与Fama使用的强效率定义相似(见第2.2节)。4与经典方法的关系在本节中,我展示了如何从第2节中介绍的EMH的两个不同概念中得出新定义,以证明信息效率定义的普遍性。4.1信息效率Fama首先给出的信息效率的主要定义是:o价格反映所有可用信息。为了将效率概念背后的想法正式化为一个新的定义,我调整了一些术语以适应更合适的上下文。我的效率定义不限于股票市场;要考虑的系统可能是效率的分级,不应与Fama引入的基于不同信息集的系统的效率混淆(见第2.2节)。关于两者之间的关系,请参见第4.1节。一个产生价格的系统(如市场),但也可以是一个产生报价的系统(如第6节中的硬币),也可以是任何其他可能的机制,使信息内容合法化。考虑到这一点,我将“价格反映”一词改为“系统包含”。定义中的“包含”一词是指系统外的信息不能改变systemX的信息量。公式中的这种变化不仅保持了Fama对效率定义的本质,而且满足了形式化的要求。随着这一变化,信息效率的定义变为:o系统包含所有可用信息。在下一步中,我将此公式转换为公式。包含信息Y的系统X可以描述为这样一个系统,其中该信息不会改变H(X)所赋予系统的信息内容。

14
mingdashike22 在职认证  发表于 2022-6-11 06:00:09
这可以使用互信息M(X,Y)=H(X)轻松表示-H(X | Y)。因为互信息是通过了解信息Y可以在系统X上推断出的信息的一部分。将相互信息应用到我们的效率公式中,它被描述为一个系统,其中相互信息m(X,Y*) = 0(5)其中Y*与上一节公式(4)中使用的信息相同。M(X,Y*) = 0表示H(X | Y*) = H(X)。这意味着Y的k知识*不改变H(X | Y)的信息熵的数量*) 与H(X)不相容。因此,所有可用信息Y*包含在系统中。相反,一个完全有效的系统是一个系统,其中系统X的所有信息都是通过知道信息Y来显示的*. 这样的系统并不有效,因为系统H(X)包含的信息可以完全从系统外的信息中派生出来。在这种情况下,条件熵H(X | Y*) = 0和互信息M(X,Y*) = H(X)。基于这些思想,M(X,Y*) 可用于导出系统效率的度量。为了将值限制在0和1之间,应使用H(X)(该系统的总信息)缩放测量值。为了得到完全效率为零的图和最有效的图,从一中减去结果项。EFF(X | Y*) = 1.-M(X,Y*)H(X)=1-H(X)- H(X | Y*)H(X)=H(X | Y*)H(X)(6)因此,我得到了与第3节中定义完全相同的定义。到目前为止,我只从Fama的定义中考虑了Strong效率[13]。但也可以考虑半强和弱效率。通过改变先验知识,可以建立与半强和弱效率的联系。

15
mingdashike22 在职认证  发表于 2022-6-11 06:00:12
在这种情况下,效率分别由eff(X | Ysemi)和eff(X | Yweak)给出。E fff(X | Yweak)=H(X | Yweak)H(X)(7)E fff(X | Ysemi)=H(X | Ysemi)H(X)(8)E fff(X | Ystrong)=H(X | Ystrong)H(X)=H(X | Y*)H(X)=有效性(X)(9)与强有效性(系统已经包含信息,如上所述)的论点相反,相对于部分信息集Y的有效性可能还有其他原因。部分效率度量(X | Y)的一种可能的替代解释是,信息与X的信息内容无关。以yweak为例,这意味着市场可能是100%有效的,因为关于过去时间序列的信息一直都包含在其中,也可能是因为过去的时间序列根本不影响系统。在任何情况下,eff(X | Yweak)显示了与Yweak知识相关的系统工作效率。除了上一段的解释外,与Fama给出的定义相比,新定义的另一个不同之处值得一提:它是对信息基础的依赖。例如,在新的定义框架内,一个系统可能对半强信息100%有效,但对强信息只有60%有效。这可以解释为某种个人效率测量。如果参与者只感知到信息的一个子集(Y Y*),这可能是因为系统与Y的关系不是百分之百有效*, 但在个人层面上(与Y相关),它似乎对参与者100%有效。当然,反过来是不可能的。如果一个系统缺乏信息子集的效率,那么如果一个人获得了关于该系统的额外信息,那么这个系统的效率将永远不会更高:eff(X | Y)<1 with Y Y*=> EFF(X | Y*) < 1(10)4.2无效率。效率的其他方面是无效率属性(见第2.3节)。

16
nandehutu2022 在职认证  发表于 2022-6-11 06:00:15
为了使这种方法正式化,我遵循Kelly(25)所做的一项工作,他为系统中的参与者(给定概率输出)确定了一种最佳获胜策略,而不会有破产的风险。Kelly表明,在这种情况下,最大资本增长率gmax=limn→∞logVnV(11)由互信息gmax(X | Yi)=H(X)给出- H(X | Yi)(12)这意味着,根据参与者i的知识Yi,个体最大资本增长为Gmax(X | Yi)。根据效率定义,在一个高效的市场中不可能存在任何利润(见第2.3节),结果是,在一个完全高效的市场中,GMAX应该为零。在完全无效的市场中,情况恰恰相反。这意味着gmax应该是最大的。根据方程式(12),最大l系数等于H(X)。为了得到介于0和1之间的效率度量,我对Gmax进行了归一化。对于效率不高的系统,结果为零,对于效率最高的系统,结果为一,这是将标准化的gmax从一上推导出。如下所示:E off(X | Yi)=1-Gmax(X | Yi)H(X)=1-H(X)- H(X | Yi)H(X)=H(X | Yi)H(X)(13)再次,我得到了效率的信息定义。无效率和信息效率之间的差异仅由信息集给出。信息集Y*在第4.1节中,描述了有关s系统的所有信息。本节中的信息仅指一个参与者的信息,因此,仅指一个参与者的系统效率。然而,如果一个参与者的知识i为Yi=Y*(这意味着一个参与者了解系统的一切),这个参与者可以被视为“无所不知”(理想)的参与者。在这种情况下,没有任何专业技能和信息技能是等效的。

17
能者818 在职认证  发表于 2022-6-11 06:00:18
因此,正如Rothenstein和Pawelzik[36]的论文所述,效率的定义也可以表述为理想的贸易商在市场中获得利润的能力。如第2.3节所述,无效率不如信息效率。原因是,通常没有一个参与者能够访问所有信息,因此即使理论上可行,也无法做出贡献。5效率的来源在上一节中,我展示了信息效率测量的简化版本涵盖了与效率的经典定义相关的所有方面。为了进一步分析,有必要加强这一定义,以涵盖更复杂和现实的情况。随着定义的加强,可以推导和讨论市场效率的两个主要来源。到目前为止,我只考虑过这样一个系统,在这个系统中,给定的值与事件的概率是公平的。在这种情况下,支付报酬的isp。这种情况是更一般情况下的特例,其中奖励为q,q为预期概率。由于在这样一个系统中可能产生的最大利润,效率定义会发生变化。如Kelly所示【25】,这种情况下的最大曲线由Gmax给出,q(X | Y)=H(q)- H(X | Y)(16),其中H(q)=-Xxp(x)logq(x)(17)在本文中,我只考虑系统中没有成本的情况。这意味着pq(x)=1。在最初的论文中,Kelly推导出的公式不是依赖于概率q,而是来自报价α=q(无成本的公平报价)。在这种情况下,公式为:Gmax,α(X | Y)=H(α)- H(X | Y)(14),其中H(α)=Xxp(X)记录αX(15),如果参与者预测事件正确,则以α作为支付的奖励。其中,p(x)是e出口x的概率,q(x)是确定奖励的预期概率。

18
何人来此 在职认证  发表于 2022-6-11 06:00:21
H(q)是系统的熵,包括支付概率的考虑。H(q)表示如果有关于此类系统的最佳信息,可以实现的最大收益。从等式(17)可以看出,当报价是公平的(q(x)=p(x))时,H(q)最小。因此,Gmax,q≥ Gmax公司q和Gmax,q=Gmaxifq(x)=p(x)。这意味着,拥有最佳策略的玩家可以在不公平报价的系统中比在公平报价的系统中获得更多的回报(例如,参见第6.4节和图4)。考虑到这一点,简单的效率定义为:eff(X | Y)=H(X | Y)H(X)=1-GmaxH(X)(18)效率定义的变化,包括不公平的现状:效率q(X | Y)=1-Gmax,qH(q)=1-H(q)- H(X | Y)H(q)=H(X | Y)H(q)(19)就像在p=q的定义中一样,效率定义在0和1之间。但在增强的情况下,分母r是H(q)。随着定义的扩展,现在可以找到效率的来源。因此,我从提高效率的定义开始:效率q(X | Y)=H(X | Y)H(q)(20)方程(20)表明效率受两个不同项的影响。数值H(X | Y)描述了通过k知道一些信息Y来预测系统X未来的可能性。当信息Y中没有预测能力时,H(X | Y)是最大的(因此等于H(X))。在这种情况下,效率是最大的。但是,如果有可预测性,那么H(X | Y)<H(X),效率就会降低。可预测性越高,H(X | Y)越低,效率越低。在perfectprediction的情况下,H(X | Y)和效率都将为零。这代表了可预测性的效率。影响效率的第二项是分母H(q)。如上所述,当报价公平时,H(q)最小。对于所有其他引号,q(x)6=p(x)是H(q)≥ H(X)。

19
何人来此 在职认证  发表于 2022-6-11 06:00:24
自H(X | Y)起≤ H(X),则e fff=H(X | Y)H(q)≤ 1.因此,对于q(x)6=p(x)的任何情况,这样的s系统必然是有效的。这是因为如果出现不公平的报价,庄家会付出比收入更多的钱。与可预测性不同的是,参与者可以在不了解活动实现情况的情况下(在这样的系统中)挣钱(见第6.4节)。这代表了错误定价的效率。当然,不可能在所有情况下都将第二个不效率源与第一个不效率源单独分开,因为对真实分布的了解也揭示了对单个事件的了解。但是,由于价格/报价可以从方程(16)中改变,因此可以看到gmax可以是最大H(q)(在H(X | Y)=0的情况下)。因此,在这个定义中,最大熵H(q)被用作分母,因为H(q)≥ H(X)≥ H(X | Y),这确保0≥ EFF q(X | Y)≤ 1.与一个排气口的重新实现无关,该效率来源可被视为独立的。总的来说,对不公平报价的扩展表明,两个几乎独立的资源影响着系统的效率。影响的一个来源是真实事件的水平及其可预测性,第二个来源是价格动态/报价的水平。6抛硬币的例子在本节中,我通过使用信息效率定义来确定抛硬币游戏的效率,来说明信息效率定义的功能。该示例的优点是所有图形都是可计算的,因此,不同的结果是可见的。

20
kedemingshi 在职认证  发表于 2022-6-11 06:00:27
在这种情况下,可以准确计算系统的效率。我展示了不同参数的计算:一个公平的硬币有公平的赔率,一个公平的硬币有不公平的赔率,一个不公平的联合有公平的赔率。6.1游戏和参数介绍该模型的工作原理如下:玩家可以在事件x上下注一个单位的数量(硬币的头部“h”或尾部“t”)。在玩家下注之前,她会得到关于结果的信息。但是,这个信息y只有在一定概率p(x | y)下才是正确的。如果她下注正确,她将获得一个重新上缴的α=1/q,否则,如果她下注错误,她将输掉她的赌注。计算该模型的效率需要以下数据:1。头部和尾部的概率:p(x=\'t′)=1- p(x=\'h’)(21)这些图描述了c oin在交配后出现头部或尾部的概率。2、正确了解结果的概率:p(y=\'h′| x=\'h′)=1- p(y=\'t′x=\'h′)(22)p(y=\'t′x=\'t′)=1- p(y=\'h′x=\'t′)(23),其中x代表事件的结果,y代表事件的信息。p(y=\'h′| x=\'h′)是一个玩家获得信息(或相信)的概率,即如果掷硬币的结果是正面的,那么硬币显示正面。因此,p(y=\'t′x=\'t′)与信息(或信念)和尾部概率相同。由于头部或尾部的给定信息没有限制,条件概率p(y=\'t′x=\'t′)和p(y=\'h′x=\'h′)是定义,可用于任何信息处理系统,其中可以计算信息的倾向性(例如少数群体游戏[7]或跷跷板游戏[34])。或者,信息也可以基于代理的信念,这些信念以一定的概率p(x | y)进行修正。因此,衡量效率的机制并不依赖于外部信息源。完全独立。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 06:07