楼主: 何人来此
1076 31

[量化金融] 如何建模假新闻 [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-6-10 15:33:02
如果公众支持候选人0,则支持候选人1的恶意个人可能会发布关于候选人0的虚假声明。根据我们之前的模型ft=u(t- τ)1{t≥ τ} 虚假新闻的贡献率继续以u>0的速度增长。然而,在现实中,人们可能会预计,随着时间的推移,任何一条虚假新闻的强度0.0 0.2 0.4 0.6 0.8 1.0倍0.440.460.480.500.520.540.56第三类投票比例Scandidate A voteCandidate B vote0.0 0.2 0.4 0.6 0.8 1.0倍0.440.460.500.520.56第一类投票比例Scandidate A voteCandidate B voteFIG。2: 没有或有虚假新闻的选举动态。在这个例子中,在没有虚假新闻候选人B的情况下,候选人B最初在民意调查中有些挣扎,但仍能轻松赢得选举(左图)。然而,由于持续不断的假新闻(在本例中发布了九次,由垂直线表示),公众被误导,从而使候选人A以微弱优势获胜(右图)。在我们使用相同参数选择进行的100K模拟中,由于大约30%的情况下出现虚假消息,落选的候选人最终赢得了选举。参数如下:σ=0.3,u=2,α=5,p=0.5,λ=10。减少。因此,我们将在这里考虑对Ft的修正,即fakenews的强度最初随时间呈线性增长,但随后呈指数衰减。换句话说,我们让在时间τ发布的一条虚假新闻对FTM的贡献由m(t)给出-τ) 1{t≥ τ},其中m(u)=uue-αuf对于某些阻尼率α>0,τ根据f(u)=λe分布-λu.一旦虚假新闻的影响得到充分抑制,公众支持可能会回到候选人0的方向。然而,可能会发布另一条新闻,等等。

22
何人来此 在职认证  发表于 2022-6-10 15:33:05
该过程将重复进行,直到投票日。我们模型的结构现在应该是显而易见的。时间τ是第一条假新闻的发布,将逐渐减弱,时间τ是下一条新闻的发布,依此类推。假新闻发布之间的等待时间由指数分布模拟。换句话说,释放时间是泊松过程的跳跃时间。我们对在各种虚假新闻存在的情况下民意调查统计数据的动态演变的模拟研究感兴趣。为简单起见,我们认为虚假新闻是片面的,即只由候选人之一的支持者发布。为了模拟的目的,我们还应该假设各种虚假新闻发布的阻尼率都是相等的,线性增长率也是一样的。模拟研究得出的典型样本路径如图2所示。为清楚起见,我们仅显示第一类和第三类选民。通过这种方式,我们可以看到虚假新闻的全面、彻底的影响。我们看到,在这条示例路径中,如果没有假新闻,将赢得选举的候选人最终将落选。事实上,根据图表标题中所示的参数选择,我们发现“失利”候选人(如果没有假新闻,他将在选举中失利)最终获胜的可能性约为30%。当然,这个数字取决于模型参数的选择,因此可以通过增加fakenews强度或频率参数来任意增加。因此,尽管虚假新闻的每一个要素都在时间上受到了明显的抑制,但如果不采取行动,对民主的持续攻击可以而且将取得成功。VII I.选举微观结构模型上述代表选民框架在建模虚假新闻的类型化方面及其在现象学层面的影响方面非常有效。

23
mingdashike22 在职认证  发表于 2022-6-10 15:33:09
它还可以通过模拟研究的方式应用于有效的情景分析,例如,虚假新闻改变选举结果的可能性的参数依赖性。我们现在将转向另一种表述方式,该表述侧重于个体选民的微观层面,以推断公众的宏观行为。虽然此选举微观结构模型中使用的数学成分与代表选民框架中使用的基本相同,但有一个重要的概念差异,即在选举微观结构模型中,信息过程中的信号可以由发送者(例如候选人)传输。以下是政治选举的语言框架,但这种待遇同样适用于公民投票。我们的模型基于以下想法,这在一定程度上简化了个人达成其首选候选人的机制:在决定选举中投票给谁时,个人将尝试根据一些问题或因素来评估候选人。例如,候选人对税收、社会福利、新闻自由、移民、堕胎、交通、枪支管制、医疗保健、公共开支等问题的看法如何?也可以考虑非政治因素,如候选人的健康状况或个人诚信水平等。如下文所述,候选人在这些因素上的立场将转化为总分,投票人最终选择得分最高的候选人。接下来,让我们假设在一场有l名候选人和N名选民的选举中,有K个独立的此类因素。我们让Xlkdenote作为第l位候选人在第k位因子上的位置。

24
kedemingshi 在职认证  发表于 2022-6-10 15:33:13
然而,候选人在这些因素上的立场,如果他们有效的话,对选民来说并不总是透明的。然而,在竞选期间,候选人将试图向选民传达他们的立场。这种交流通过许多渠道进行:通过活动的广告,通过新闻媒体的宣传,通过口碑传播,通过社交媒体,等等。因此,选民获得了部分信息,我们将像以前一样,以ηk,lt=σk,lXlkt+Bk,lt+Fk,lt(10)的形式对其进行建模,k=1,2,K和l=1,2,五十、 换句话说,我们总共有KL信息过程{ηk,lt}。其中一些可能受到假新闻的污染,假新闻可以采取不同的形式。例如,候选人可能会试图让自己在更广泛的选民群体中看起来比自己可能更讨人喜欢(比如隐瞒自己的健康状况,或者淡化自己对税收的看法)。他们可能会发布负面广告,散布关于对手的不实或半真半假的信息。或者,可能有恶意的代理人散布支持某个候选人或另一个候选人的完全捏造的故事。正是后一种虚假新闻可以在社交媒体上迅速传播,因此最近引起了广泛关注。一位选民对一位拥有一系列要素值的候选人的吸引力有自己的看法。我们通过得分函数对此进行建模,该函数可以区分不同的个体,并使用给定的因子向量XL为候选人分配吸引力度量。因此,一名选民将投票给得分最高的候选人。在本文中,我们考虑线性得分函数。因此,如果向量Xl已知,则由选民n确定的候选人ld的得分slnoln=KXk=1wknXlk=wn·Xl,(11)给出。

25
能者818 在职认证  发表于 2022-6-10 15:33:21
权重{wkn}可以是正的,也可以是负的,大小取决于选民对某一问题的感受有多强烈。请记住,需要根据可用信息估计这些因素,选民n将选择候选人l而不是候选人lif,并且仅当kxk=1wkn时Et[Xlk]- Et[Xlk]> 0、(12)或更简洁的wn·(Et[Xl]- Et[Xl]>0。这里我们让Et[-] 表示有条件观察到时间t之前的信息过程{ηk,ls}的期望。考虑到政策因素Xl和xlkfork 6=k的独立性,可以按照前面描述的方法计算出条件期望Et[Xl]的每个组成部分。我们应合理假设独立因素的噪声项是独立的,并进一步简化假设,与独立因素相关的假新闻发布时间同样独立。选民群体可以通过提出权重向量{wn}上的分布来建模。通过从这个分布中随机抽样并计算,对于每个首选候选人的样本,人们可以建立投票模式和调查的总体水平图,尤其是假新闻的影响。实际上,这种分布可以通过向随机选择的选民询问一系列问题来获得,以便生成他们的权重向量的近似值。此外,大型互联网公司(如搜索引擎、社交网络和全球零售商)拥有的数据可能足够丰富,可以为个人用户合理估计这些权重。这使这些公司承担着巨大的责任。显然,权重向量{wn}的知识对于实施有针对性的运动非常有价值。

26
能者818 在职认证  发表于 2022-6-10 15:33:24
尤其令人担忧的是,如果此类有针对性的运动是由虚假新闻的发起者进行的,民主可能会面临风险。然而,下面的模拟研究支持这样一种观点,即MEREK承认流通中可能存在虚假新闻可能有助于消除虚假新闻的主要影响。九、 微观结构模型中的民意测验我们现在展示了在两名候选人的选举中,候选人由三个二元独立因素评估的情况下的模拟结果。具体来说,让我们假设这三个因素关系到候选人是自由派还是保守派;候选人是否健康;以及候选人的品行好坏。为了进行此模拟,让我们假设两个候选对象(此处标记为A和B)的隐藏特征为XA=1(候选对象A为自由基)和XB=-1(候选人B保守);XA=1(候选人A健康状况良好)和XB=-1(候选人B健康状况不佳);XA=1(候选人A具有良好的性格)和XB=-1(候选人B性格不好),姓名和数值为0.0 0.2 0.4 0.6 0.8 1.0倍0.4000.4250.4500.4750.5000.5250.5500.5750.600投票给候选人A超过1000 runsCategory ICategory iIIiIIIFIG的平均投票比例。3: 随着时间的推移,为候选人A投票的人口比例。这些曲线的平均值超过1000次。第一类选民是那些不知道虚假新闻存在的人;第三类选民能够完全消除虚假新闻,从而代表“正确”的估计。我们看到,旨在支持候选人B的假新闻,平均而言有着预期的效果,使候选人A应该赢得的选举更具竞争力。

27
kedemingshi 在职认证  发表于 2022-6-10 15:33:28
通过在信息处理过程中改变fakenews术语的参数,可以增强或减少这些影响。我们还认识到,第二类选民正在成功纠正假新闻的大部分影响。模拟中使用的参数为:σ=0.2、|u|=1.5、α=4、p=0.5和N=1M。假新闻发布之间的等待时间从速率参数为4的指数分布中为每次运行绘制一个区域。用于这些模拟的代码可在github上获得。com/dmmeier/FakeNews。选择用于说明。选民们试图根据他们掌握的信息来估计这些因素值。我们将投票者的数量取为N=100万,并根据以下公式对权重向量进行采样:我们从三维正态分布中提取55%投票者的权重向量,标准偏差为0.4,分布为1,中心为(1,1,1),但第二维度仅限于正值,第三维度仅限于区间[0,1]。截短反映了一个事实,即选民不太可能主动选择健康状况不佳或性格不好的候选人。这部分人倾向于选择性格开朗、健康的候选人。然后,我们从相同的截断正态分布(分布2)中提取剩余45%人口的权重向量,但集中在(-1、1、0),代表选民倾向于保守、健康的候选人,但与候选人的性格无关。选择这些分布纯粹是为了举例说明。很明显,候选人A的因子向量XA=(1,1,1)与代表55%人口的分布1的中心重合,在没有假新闻的情况下,倾向于赢得选举。

28
能者818 在职认证  发表于 2022-6-10 15:33:31
然而,我们现在假设,在选举前的准备阶段,发布了各种虚假消息,意在表明候选人Aare的健康和性格很差,候选人B的健康和性格很好,候选人A比看起来更保守,候选人B更自由。这些虚假新闻元素的潜在影响是显而易见的:将因素XAofcandidate A的感知向量移出分布中心1,同时将候选人B移向分布中心。显然,这增加了候选人B赢得选举的机会。为了在我们的模拟中隔离假新闻的影响,我们将所有六个随机变量{XAk,XBk}k=1,2,3的先验概率取为0.5,取为0.5-这意味着人口开始时处于完全不可知状态。为了模拟fakenews,我们采用了我们早期的模型,其中一条假新闻的影响最初几乎在时间上增长,但随后呈指数衰减。在图3中,我们显示了1000多个模拟的平均值,计算了每个选民类别随时间的投票比例。github提供了用于这些模拟的代码。com/dmmeier/假新闻。结果表明,在没有虚假新闻的情况下,候选人A平均在选举中获胜——相当可观——这与III类曲线相对应。然而,正如我们所预期的那样,上述类型的虚假新闻将不知道虚假新闻存在的Ivoters类别的相对投票比例推给了候选人B。这里可能最引人注目的是显示类别选民估计数的曲线。这些选民知道可能有虚假新闻在流传,但他们不知道有多少条虚假新闻被发布,或在什么时间发布。

29
mingdashike22 在职认证  发表于 2022-6-10 15:33:34
也就是说,他们只知道{Ft}的统计分布,或者等价地,先验分布f(u)。尽管如此,第二类选民能够通过对虚假新闻性质的统计理解并相应地更正他们的估计,显著减少虚假新闻的影响。此外,初步模拟研究表明,它们的性能对先验分布的适度误判具有鲁棒性。十、 讨论与展望我们提出了两种在选举和公民投票中模拟虚假新闻的方法:一种基于代表选民的想法,有助于定性了解虚假新闻的影响;另一种基于选举微观结构的想法,有助于在具体场景中的实际实施。在这两种情况下,结果都相当明确地说明了假新闻在选举和公民投票中的影响。我们已经证明,只要知道虚假新闻可能在流通,一个勤奋的人(第二类)就能够极大地降低虚假新闻的影响。这里介绍的模型需要在多个方向上进一步发展。例如,我们的模拟是基于随机抽取蛋糕新闻发布的等待时间。然而,在现实中,试图影响选举的恶意个人很可能会试图优化发布时间以最大化影响(例如,最大化赢得选举的机会)。在我们的模型中包含这样的最佳发布策略会很有趣。此外,如上所述,在我们的模拟中,第二类选民被要求知道虚假新闻术语的参数。这尤其包括假新闻漂移参数u和阻尼率α的值。

30
mingdashike22 在职认证  发表于 2022-6-10 15:33:39
模型的自然扩展将允许这些参数本身是随机的。最后,可以通过允许各种因素之间的依赖关系,或通过引入反映不同社会阶层新闻消费偏好的不同信息流程,进一步发展选举微观结构方法。这些概括将为研究开辟富有挑战性但有趣的新方向。无论如何,第二类选民的表现明显超出了本文作者的预期,这确实带来了一个充满希望的结论:即,通过确保选民意识到fakenews在他们消费的信息中的可能性和性质,决策者可能会在打击虚假新闻的黑暗势力方面取得成功。致谢作者感谢J.Armstrong、A.Macrina和B.K.Meister的评论,以及L。P、 Hughston多年来就基于信息的建模框架进行的对话。[1] Allcott,H.&Gentzkow,M.2017社交媒体和2016年选举中的虚假新闻。《经济展望杂志》,31211–236。[2] Amador,J.、Oehmichen,A.&Molina Solana,M.2017通过元数据描述政治假新闻intwitter。arXiv:1712.05999【3】Beibel,M.1996关于cusumprocedure极小极大性质的Ritov Bayes方法的注记。《统计年鉴》241804-1812。[4] Bovet,A.&Makse,H.A.2019年2016年美国总统大选期间推特上虚假新闻的影响。《自然通讯》10,7。[5] Brody,D.C.&Hughston,L.P.2006量子噪声和随机约化。《物理学杂志》A39833-876。[6] Brody,D.C.、Hughston,L.P.和Macrina,A.2007《超越风险率:信用风险建模的新框架》。《数学金融进展》(M.Fu、R.Jarrow、Ju-Yi Yen和R.Elliott,编辑,巴塞尔:Birkhauser)。[7] 布罗迪,D。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 11:11