楼主: 何人来此
1074 31

[量化金融] 如何建模假新闻 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-10 15:32:25
尽管如此,X确实存在,人们根据他们获得的部分信息,根据他们对X的最佳估计做出决策。这就是传播理论中的数学技术可以用来描述科学和社会中观察到的现象的意义。在接下来的内容中,我们将扩展上述想法,以解决模拟虚假新闻及其影响的问题。在继续之前,我们顺便指出,虽然我们在这里考虑了涉及两个可能的替代方案的情况,由二进制随机变量X表示,但当X可以取多个值时,分析的复杂性基本保持不变。同样,关于X值的知识以恒定σ揭示的假设可以放宽,而不影响分析的可处理性(Wonham 1965)。在这种情况下,将(1)中的第一项替换为XRtσ(s)ds,其中σ(s)表示时间s的信息流动率。可以通过将(1)中的布朗噪声{Bt}替换为该时间范围上的布朗桥来模拟在有限时间范围内确定X值的情况(Brody,Hughston&Macrina,2007)。更一般地说,在布朗运动不是不确定性的合适模型的情况下(例如,如果噪声过程可能有跳跃),那么可以通过L'evyproces对噪声项进行建模,同样不影响分析的可处理性(Brody&Hughston 2013)。四、 模拟假新闻当假新闻发布时,例如由恶意个人发布以误导公众,虚假信息会叠加在其他信息上。然而,假新闻就其性质而言,并不代表人们希望确定的数量X的价值的真实陈述,因此它不能被视为构成帮助人们发现X的真正价值的信号的一部分。

12
能者818 在职认证  发表于 2022-6-10 15:32:28
另一方面,从信号处理的角度来看,任何不是信号一部分的东西都可以被视为噪声。根据这一逻辑,我们得出了存在虚假新闻时的信息处理模型:ηt=σXt+Bt+Ft,(6)其中时间序列{Ft}t≥0表示假新闻。噪声项{Bt}没有偏差,它代表了大量关于X值的未经证实的谣言和猜测的集合。然后,中心极限定理表明了噪声分布的正态性,使得布朗运动成为建模噪声的可行候选者。因此,时间序列{Ft}引入了额外的偏差。我们现在可以对英国下议院委员会关于fakenews的报告(Collins等人,2018年)中提出的公开问题提供一个精确的数学答案:“假新闻”一词在2016年被广泛使用,目前尚无一致的定义。克莱尔·沃德。告诉我们。“当我们谈论这个巨大的范围时,如果我们不清楚自己的意思,我们就不能开始考虑监管,也不能开始谈论干预”。有鉴于此,我们提出以下建议:定义(假新闻)。信息处理(6)中出现的时间序列{Ft}表示“假新闻”,如果它有偏差,使得E[Ft]6=0,其中E表示期望。这里存在的偏见很重要,否则{Ft}只会代表进一步的噪音,而不是故意的错误信息。毫无疑问,额外的无偏见噪音是一种滋扰,拖延了发现真相的过程;但这并不能最终迫使公众远离真相。

13
可人4 在职认证  发表于 2022-6-10 15:32:32
这就是说,在某些情况下,仅仅延迟揭示真相的过程是有好处的,在这种情况下,释放E【Ft】=0的无偏噪音将是有效的,可以将这种情况描述为代表一种温和形式的虚假信息。然而,这种情况实际上相当于操纵信息流量σ(t),并与Brody&Law(2015)提出的虚假信息模型相对应。关于{Ft}和X之间的统计相关性,可能会出现两种情况:一种情况是没有人知道X的值,在这种情况下{Ft}应该独立于X,另一种情况是,X的值为少数可能希望传播假新闻的个人所知,在这种情况下,{Ft}很可能依赖于X。之前已经设想过,可以将(1)中所述类型的基于信息的模型扩展为故意误判真相的模型(Brody&Law 2015)。有人提议,恶意操纵公众的个人可以改变信息流量σ的值。因此,公众会根据σ的特定值进行推断,而σ的实际值实际上是不同的,因此公众被误导了。这种方案相当于为某些u设置ft=uXt,这可能出现在下面描述的选举微观结构模型中,其中X的值可能对候选人已知,但对公众未知,从而允许候选人传输X相关假新闻。更一般地,考虑到发布时间的随机性,可以考虑形式为Ft=uX(t)的假新闻结构- τ) 1{t>τ}。这里1表示指示符函数,如果A为真,则1{A}=1,否则1{A}=0。

14
大多数88 在职认证  发表于 2022-6-10 15:32:35
这相当于信息过程ξt=^σXt+bt具有随机^σ,可以获得条件概率的解析表达式(Brody&Law 2015)。为了分析假新闻的影响,有必要将公众分为三类。我们定义第一类是指那些不知道他们所看到的信息中可能存在虚假元素的人。然而,他们的行为是合理的,因为他们根据公式(5)进行估计,除了用η代替ξt。换句话说,他们“正确”推断出后验概率,但基于错误的信念,即他们收到的信息是类型(1),而实际上是类型(6)。我们将看到,这类人最容易受到虚假新闻的影响。我们用第二类来表示那些知道虚假新闻潜在存在的公众,但不确切知道时间序列{Ft}中虚假新闻项目的发布时间。这些个体面临着技术上最具挑战性的任务,因为在他们的估计中,他们必须处理三个未知量,X、{Bt}和{Ft},但只有一个已知量,{ηt}。正如我们将看到的,尽管条件概率P(X=xi |{ηs}0)的解析表达式≤s≤t) 可以得出,这一分析比第一类选民的分析更为复杂。因此,这一类的人比第一类的人更了解他们生命中的不确定性。最后,第三类的人包括那些高度知情的人,他们知道时间序列{Ft}的值。因为{Ft}不包含与X相关的信息,所以它们可以简单地忽略信息{ηt}中的{Ft},并使用ξt=ηt- t开始根据第(5)条计算出他们的后信念。

15
可人4 在职认证  发表于 2022-6-10 15:32:38
像第一类中的人一样,第三类中的人在他们的学习中倾向于自信。然而,我们注意到,第三类个体在某种程度上应被视为理想化个体。毕竟,对于一个人来说,完美地识别哪些新闻是虚假的,哪些不是虚假的,几乎是一项无法逾越的任务。五、 估计假新闻的到达时间从属于我们分类第二类的人的角度来看,有两个问题需要解决:首先,必须估计信息源是否受到假新闻的污染。基于这种考虑,我们必须确定条件概率P(X=xi |{ηs}0≤s≤t) ,它给出了事件X=xi可能性的最佳估计。注意,前一个问题相当于计算出条件概率ft(u)du=P(τ∈ du |{ηs}0≤s≤t) τ取一个小区间[u,u+du]内的值,我们将计算该区间。在继续之前,我们注意到,有一个被广泛研究的研究领域,即与“变化点检测”或“无序检测”有关的隔离理论(第1954页,Shiryaev 1963a,1963b)。这个问题的性质如下。一个人观察一个时间序列,其性质是序列的结构在某个随机时间发生变化。在观察到的数据不能立即看出这种转变的情况下,任务是检测是否发生了“制度变化”,如果发生了,则检测可能发生的时间。从数学上讲,这类问题的原型是检测布朗运动获得漂移的随机时间τ(Karatzas 2003),或检测泊松过程跳跃率从一个过程变化到另一个过程的随机时间τ(Galchuk&Rozovskii 1971,Davis 1976,Peskir&Shiryaev 2002)。

16
何人来此 在职认证  发表于 2022-6-10 15:32:41
因此,在布朗背景下,观察是由Bt+u(t- τ)1{t≥ τ} ,这与设置σ=0和Ft=u(t)相同- τ) 1{t≥ τ} 在我们的信息处理中{ηt}。因此,我们看到,虚假新闻的分析在信号检测中引入了一种新的问题,人们希望在噪声结构在随机时间从一种状态切换到另一种状态的噪声环境中检测未知信号X。换言之,人们试图检测切换的时刻,即fakenews出现的时间τ,同时估计X。直觉上应该很清楚,这种问题将在虚假新闻分析之外有广泛的应用。考虑到这一点,让我们在莫斯通虚假新闻的背景下检查τ的条件密度。为此,让我们考虑一下FT=m(t)给出的假新闻模型- τ) 1{t≥ τ} ,其中m:R→ R是一个任意函数,我们假设它至少有一次可微。这是虚假新闻模型的形式,II类选民认为这是真实的模型。然后计算表明,τ的条件密度由ft(u)=f(u)PipieRt(σxi+m(s)给出-u) 1{s≥u} )dηs-Rt(σxi+m(s-u) 1{s≥u} )dsR∞f(w)PipieRt(σxi+m(s-w) 1{s≥w} )dηs-Rt(σxi+m(s-w) 1{s≥w} )dsdw,(7),其中m(u)=dm(u)/du,pi=P(X=xi)。注意,f(u)是τ的先验密度,它反映了释放时间如何分布的初始视图。因此,byR给出了假新闻发布时间的最佳估计∞uft(u)du。在ft(u)的帮助下,我们现在能够解决第二类公众的X估计问题。根据条件期望的塔性质,我们可以写出[X |{ηs}0≤s≤t] =E[E[X |{ηs}0≤s≤t、 τ]|{ηs}0≤s≤t] 。(8) 我们的策略是首先制定出内部预期。

17
mingdashike22 在职认证  发表于 2022-6-10 15:32:49
由于以τ为条件的信息过程{ηt}是马尔可夫的,因此这将减少到Y(ηt,τ)=E[X |ηt,τ],根据贝叶斯公式,由Y(ηt,τ)=pkxkpkxp给出σxkηt-σxkt- σxkm(t- τ) 1{t≥ τ}Pkpkexpσxkηt-σxkt- σxkm(t- τ) 1(t≥ τ). (9) 因此,X的最佳估计值由r给出∞Y(ηt,u)ft(u)du。前面的分析表明,虽然可以推导出一个封闭形式的表达式,以便对想要确定的数量X进行最佳估计,但过程有些复杂。请注意,我们处理了一条虚假新闻在随机时间发布的情况。然而,描述第二类选民的数学形式主义可以以一种前瞻性的方式扩展到发布多条虚假新闻的情况。我们将在下面对这种更一般的设置进行模拟。六、 代表选民框架考虑到前面的讨论,我们的建模设置所产生的分类很清楚:有些公众很容易被误导和操纵,因为他们通过选择或其他方式忽视虚假新闻的可能存在;那些对假新闻的潜在存在持谨慎态度,但对自己的判断不能太确定的人;以及那些能够发现并忽视虚假新闻的人。通过模拟研究,可以最容易地捕捉到这三个类别的特征。为此,让我们考虑一个是或否的公投场景,其中包含假新闻的简单线性模型:Ft=u(t- τ)1{t≥ τ}. 这里,u是一个常数,其符号对应于公众被误导的方式,τ是一个指数分布的随机变量,密度f(u)=λe-λu,λ>0 a常数。我们让实现X=1与“是”投票关联,X=0与“否”投票关联。

18
能者818 在职认证  发表于 2022-6-10 15:32:52
特别是,我们解释事件X=1和X=0的可能性,以代表公众的总体意见。也就是说,p=p(X=1)代表当前打算投“赞成票”的公众百分比,反之,则代表1- p=p(X=0)。因此,先验概率p可以根据今天的民意调查统计数据进行校准。然而,随着时间的推移,公众意见会随着信息流的变化而变化,因此先验概率会相应更新。值得一提的是,虽然在早期关于过滤技术现象学应用的讨论中,我们描述了个人行为的建模,但在这里,我们采用了整体观点,其中先验概率p指公众持有的不同观点的集合(类似概念见Brody&Hughston 2013)。我们在这里倡导的理念是“代表选民”,类似于经济学中的代表代理人模型。这对于获得对所观察现象的定性理解非常有用。本文稍后将通过引入一个替代的“选举微观结构”框架,类似于经济学中的市场微观结构模型,回到个人行为的层面。这对于制定针对虚假新闻的对策和政策制定非常有用。在集合形式主义中,随机变量X取零值的事件可以解释为全体选民同意他们应该投票支持“否”结果的情况。如果信息流量参数σ是常数,那么X的值确实会渐近显示出来,因此,在有限的时间范围内,公众舆论会逐渐收敛到一种选择或另一种选择。

19
大多数88 在职认证  发表于 2022-6-10 15:32:55
当然,这在现实生活中很少发生,因为σ将随时间变化,并且在选择发生后趋于消失。然而,在目前的情况下,假设σ是一个常数并不是不合理的,因为我们只对截止到投票日的动力学感兴趣。考虑到这些初步意见,我们模拟了对应于三个投票类别的典型样本路径,以选择各种模型参数(u、σ、λ、p)。模拟结果如图1所示。模拟路径的预期主要特征是,不知道虚假新闻存在的选民确实会朝着预期的方向摇摆。或许不太明显的是,第二类选民知道可能存在虚假新闻,但不知道发布时间,他们往往会对他们收到的信息可能被篡改的可能性作出过度补偿。因此,他们的估计偏离了“正确”(类别0.0 0.2 0.4 0.6 0.8 1.0时间-0.4-0.20.00.20.40.6有假新闻的信息处理无假新闻0.0 0.2 0.4 0.6 0.8 1.0倍0.460.470.480.490.500.510.520.53投票比例等级III类IIIFIG。1: 公民投票模拟。与线性假新闻模型相关的典型样本路径已标记。左面板显示了信息处理{ξt}没有假新闻和{ηt}有假新闻,在这里发布时间为0.4。右图显示了三类选民的民意随时间的演变:(I)不知道虚假新闻存在的选民;(二) 那些意识到虚假新闻潜在存在的人;以及(III)那些能够完全无视虚假新闻的人。这里,X=0对应于“否”结果,X=1对应于“是”结果。

20
可人4 在职认证  发表于 2022-6-10 15:32:59
我们看到,在这个特定的样本路径中,大多数III类选民将投票支持“不”的结果。然而,有证据表明,一条虚假新闻试图说服选民支持“是”的结果,其效果是将一类选民的比例提高了2%多一点,刚好足以将多数票改为“是”。另一方面,第二类和第三类曲线的相对接近程度表明,第二类选民能够在很大程度上纠正他们接触虚假新闻的情况。模拟的参数Schosen为u=0.5,σ=0.3,λ=3,p=0.5,对于随机变量X,样本结果为X=0。三) 假新闻发布前的估计。然而,一旦假新闻发布,分类选民在从他们的估计中消除假新闻的影响方面表现得出奇地好。人们可以把这解释为一种迹象,即仅仅知道虚假新闻的可能性,就已经是消除其影响的有力解毒剂。这方面的进一步证据将在下面我们对选举微观结构模型的讨论中看到。七、民意调查统计在选举中的应用我们继续对fakenews出席的选举中的民意调查统计动态进行建模。为简单起见,我们假设有两个主要候选,由二进制随机变量X表示,取与这两个候选对应的值0和1,先验概率为p和1- p、 分别为。正如Dearier所指出的,在代表性选民框架中,先验概率p代表了公众最初对X值应该取哪个值持有的不同意见和混合意见。然而,公众的意见会随着时间的推移根据信息的启示而演变,我们通过过程{ηt}来建模。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 11:07