楼主: mingdashike22
2066 67

[经济学] 网络内容传播中的情感 [推广有奖]

31
能者818 在职认证  发表于 2022-4-24 11:36:32
标准化使离散情绪的强度在零均值附近波动,并以1标准偏差量表(接近标准正态分布)进行测量(Bollen等人,2011年)。因此,如果一篇文章的焦虑强度得分为0.0,那么它包含的焦虑表达(情绪词和相关程度词)将比我们样本中约50%的文章多;1.0意味着超过84%;2.0意味着超过97.5%,以此类推。为简洁起见,以下我们将标准化强度分数称为强度分数。6.模型6。1.情绪表达工具嵌入文章中的情绪表达强度得分可能是内容差异结果的内在因素。例如,关于自然灾害的文章通常可能包含更高程度的焦虑,并且往往被广泛分享。为了解决内生性问题,并检查情绪表达和信息差异之间的因果关系,我们采用了一种工具变量方法,常用于估计在线内容特征的影响(Devet al.2019)。在我们的模型中,我们使用了两组工具变量:当前出版商当前文章之前最新文章中嵌入的情绪表达的强度分数(即滞后的情绪表达强度分数)和其他出版商在与当前文章相同的时期发布的文章中嵌入的情绪表达的平均强度分数。工具变量估计器也能很好地校正测量误差(Wooldridge 2002)。我们的两组工具变量可用于进一步缓解情绪表达强度得分中的测量误差,尽管测量因素在我们的识别中不应是一个重要问题。

32
mingdashike22 在职认证  发表于 2022-4-24 11:36:39
附录EC。2已经表明,该算法生成的测量值与人类编码人员开发的测量值在统计学上没有显著差异。鉴于测量误差不太可能是系统性的,我们可能会担心,同一出版商发布的最新文章和当前文章之间的时间差可能不够长,因此出版商在发布最新和当前文章时可能仍然面临相同的环境(作为模型识别中不可观察的混杂因素)。然而,我们发现,平均而言,出版商在发布其最新文章后的9.295天内不会发布新文章。因此,出版商在发布最新和最新文章时不太可能面临同样的环境。我们选择只使用最新文章的强度分数作为工具,而不使用更多历史文章的强度分数,因为如果时滞太长,历史文章和当前文章的强度分数之间的相关性将很弱,这可能会导致工具弱的问题。同期文章是指与当前文章相比,未提前或延迟发表超过七天的文章。Yu等人:在线内容中的情绪差异跨篇文章,焦点文章强度分数中的测量误差不太可能与我们的两组工具变量相关。由于这种正交性,测量结果不会对估计结果产生偏差(Wooldridge 2002,Chernozhukov等人,2018)。在第6.4节中,我们进行了弱仪器测试(Stock and Yogo 2005)和萨根测试(Sargan 1958),确认了我们仪器的有效性(即相关性和外源性)。此外,我们还实现了一个双机器学习框架(Chernozhukov等人。

33
大多数88 在职认证  发表于 2022-4-24 11:36:57
2018)估计部分线性工具变量规格。该规范使我们能够利用机器学习技术控制协变量的非线性效应,并保持结果(即级联特征)和感兴趣变量(即情绪强度分数)之间的线性关系,以便于解释。接下来,我们介绍两组工具变量。滞后自变量通常用作经济和营销研究中的工具变量(Villas Boas and Winer,1999)。因此,我们提出了我们的第一组工具变量,滞后情绪表达强度分数,以解决可能的内生性问题。当前出版商发布的最新文章(即当前文章之前的文章)中嵌入的情感表达强度分数可以作为有效工具,因为它们最终与当前文章中的情感表达存在关联,因为出版商的运动状态可以从一种情况普遍延续到下一种情况(Lerner等人,2004年,2015年)。然而,滞后的情绪表达分数不能直接影响当前文章的差异。他们可能与当前文章的分歧相关的唯一方式是与当前文章中的情感表达相关。继Nevo(2000)和Hausman and Bresnahan(2008)之后,我们提出了第二组工具变量,即其他出版商并发文章的平均情绪表达强度分数。这组变量是有效的工具。一方面,它们往往与本文中的情绪表达相关,因为有充分的证据表明,在社交媒体中,由于情绪传染,个人的情绪表达往往是同步的(例如,Hat Fieldet等人1993年、Barsade 2002年、Del Vicario等人2016年)。

34
mingdashike22 在职认证  发表于 2022-4-24 11:37:04
另一方面,读者很难观察到出版商之间的情感互动。读者是否分享这篇文章的决定只取决于当前文章的内容(包括情感表达)。因此,我们认为,在某些极端情况下,通过其他测量错误得出的并发文章的平均情绪表达强度分数可能会上升,例如,当我们的词典无法捕捉到一个非常不常用的情绪词时,或者当在一个特殊语境中,情绪词的强度与我们的词典中的情绪词的强度相差很大时。但如果这些情况没有系统地发生,测量误差就不会影响我们的估计。事实上,不同出版商或同一出版商在不同时间点发布的微信文章包含了各种各样的主题和背景。因此,与这些话题和背景相关的情感表达是多种多样的。事实上,我们在样本中发现了至少28969个独特的情感词。因此,我们不期望在大量的文章中系统地包含与特定情绪表达相关的测量误差。相反,我们认为将测量误差假设为独立的交叉粒子是合理的。Yu等人:在线内容差异出版商的情绪不能直接影响当前出版商文章的差异结果。这组工具变量可能仅通过影响当前出版商在文章中的情感表达,与当前出版商文章的差异结果相关。6.2. 消极情绪表达对级联结构特性的影响我们采用部分线性工具变量方法来估计情绪表达对级联维度的影响。

35
mingdashike22 在职认证  发表于 2022-4-24 11:37:10
模型如下所示:yij=β情绪j+g(articleij)+P publisheri+ij,(2a)emotionij=βzij+h(articleij)+ηij,(2b)zij=m(articleij)+uij,(2c)其中yijin表示第i个出版商出版的第j篇文章的四个级联结构属性之一,emotionij表示第i个出版商出版的第j篇文章的(离散)情绪强度分数,Articlei表示第i个出版商发布的jtharticle的文章级控制变量(即文章长度、嵌入文章的图像和视频数量、文章是否在周末发布、评论数量和文章的主题分布),P publisher表示出版商的固定影响,Zijin指出了我们纳入的工具变量(即,其他出版商同时发表的文章中的滞后情绪强度分数和平均情绪强度分数),这些变量只能通过改变第i出版商发表的第j篇文章中的情绪强度分数来影响级联的结构属性,这取决于文章特征。我们使用β捕捉情绪的影响,非线性函数GT捕捉文章特征如何影响级联维度,非线性函数hto捕捉文章特征如何影响情绪表达强度得分,非线性函数mto捕捉文章特征如何影响仪器变量。ij、ηij和uij是随机误差。zijcan只能通过一个有效的动作转移Yijt,以articleij为条件,但与ij。为了控制文章的特征,我们首先估计了潜在的狄利克莱分配(LDA)模型(Blei等人。

36
可人4 在职认证  发表于 2022-4-24 11:37:18
2003)基于所有抽样的文章,并通过30维向量控制文章的潜在主题分布(更多细节见附录EC.3和图EC.3.1)。我们还包括文章长度(对数转换的字符数)、文章中嵌入的图像和视频数量(媒体丰富度)、文章是否在周末发布(时间效应),以及模型中的评论数。为了捕捉可能对信息扩散产生影响的时不变因素,例如出版商特定的特征,我们将出版商固定的影响包括在内。Yu等人:在线内容中的情绪差异为了评估我们的部分线性工具变量方法,我们按照Chernozhukov等人(2018)开发的程序应用了双机学习框架。更具体地说,我们首先将等式2中的模型改写为以下残差形式:wij=βvij+P publisheri+ij,(3a)vij=βuij+ηij,(3b)wij=yij-k(articleij),vij=emotionij-l(articleij),uij=zij-m(第j条)。(3c)然后,双机器学习框架进行如下操作。首先,我们用^k、^l和^m估计方程3中描述的非线性函数k、l和mas,这相当于用机器学习技术预测yij、emotionij和zijusing。然而,天真地将机器学习模型训练为k、l和m,可能会导致有限样本估计的偏差非常大,因为估计值通常会小于1/√n收敛速度。Chernozhukov等人(2018年)得出的一个见解是,我们可以使用交叉拟合估计器来解决这个问题。特别是,我们在发布者级别对数据进行分组,并将数据分成大小均匀的折叠,其中包含不同的发布者。对于每个折叠d=1,2。。。,D、 我们在另一台计算机上运行机器学习模型-1数据折叠以估计函数k、l和m。

37
kedemingshi 在职认证  发表于 2022-4-24 11:37:24
估计的函数用^k表示(-d(i)),^l(-d(i))和^m(-d(i)),其中d(i)∈ {1,2,…,D}表示包含第i个出版商的折叠,以及-d(i)表示我们在训练机器学习模型并生成第i个发布者的预测值时排除了折叠d(i)。然后我们估算了残差^wij=yij-^k(-d(i)条,^vij=情感-^l(-d(i))(第ij条),以及^uij=zij- ^m(-d(i)条。在我们的模型中,我们选择XGBoost作为机器学习算法,该算法通常被认为是许多机器学习任务的最先进算法,并已被数据科学家和研究人员广泛采用(Chen和Guestrin,2016)。按照Chernozhukov等人(2018年)的做法,我们选择D=10。最后,我们通过对估计的残差进行两阶段最小二乘(2SLS)回归来估计β。具体而言,我们首先回归^vijon^uij,并获得预测值^vpredij。然后,我们通过回归^wijon^vpredijj和控制出版商固定效应来估计β。6.3. 负面情绪表达对级联的人口统计学和社会关系的影响基于主模型,我们进一步研究了负面情绪表达对级联中所有用户的人口统计学(即年龄、性别和网络程度)以及他们之间的社会关系的影响。正如我们在第7.2节中详细介绍的,我们测试了消极情绪表达对平均年龄、性别构成、年龄和性别的影响,平均网络度(由用户的平均网络度衡量)我们还使用20倍交叉拟合估计器运行了相同的模型,结果是一致的。Yu等人:在线内容中的情绪影响图2文章级联中嵌入的四种消极情绪表达的影响(A)深度,(B)大小,(C)最大宽度,(D)结构病毒性。注:x轴显示模型系数的大小。

38
mingdashike22 在职认证  发表于 2022-4-24 11:37:30
y轴显示四种负面情绪表达。区间中间的平方代表平均值。虚线覆盖的区间代表90%的置信区间。实线覆盖的区间代表平均值加上或减去其标准偏差的1个单位。朋友的平均数量)和社会关系(以弱关系的比例衡量)分别参与级联。我们使用相同的部分线性工具变量方法进行分析,其中,本分析中的益进方程2显示了用户人口统计数据及其与第i出版社发布的第j篇文章相关的社会关系。与我们分析负面情绪表达对级联结构特性的影响类似,我们还控制了文章中嵌入的正面情绪表达。6.4. 仪器变量测试为了解决我们对仪器有效性的担忧,我们实施了弱仪器测试(Stock and Yogo 2005)和萨根测试(Sargan 1958),以检查仪器的强度和外源性。弱仪器测试中F统计量的p值均小于0。001,这表明我们所有的仪器都是强大的仪器。此外,Sargan检验中J统计量的p值均大于0.950,这表明我们不能否认我们的工具变量(即其他出版商同时发表的文章的滞后情绪强度得分和平均情绪表达强度得分)是外生的假设。7.结果7。1.

39
nandehutu2022 在职认证  发表于 2022-4-24 11:37:36
负面情绪表达对cascade结构属性的影响我们采用部分线性工具变量方法来研究嵌入内容中的负面情绪表达与Yu等人的结构属性之间的关系:在线内容中的情绪差异文章的级联,遵循上一节详述的双机器学习框架。结果如表1和图2所示。如第3节所述,我们关注四种消极情绪表达(即愤怒、焦虑、厌恶和悲伤)的影响,并控制积极情绪表达的影响(详情见附录EC.4.1)。图2显示了三种消极情绪表达(即愤怒、焦虑和悲伤)在文章差异中起着重要作用。内容展中包含更高程度愤怒和悲伤的文章的预期级联大小显著降低(β大小=-0.049,p<0.05;β尺寸稳定性=-0.082,p<0.01),宽度(β宽度=-0.046,p<0.05;β宽度adness=-0.061,p<0.01)。相比之下,焦虑程度较高的人会导致预期级联深度(βdepthanxiety=0.015,p<0.01)、大小(βsizeanxiety=0.010,p<0.01)、宽度(βbreadhanxiety=0.007,p<0.01)和结构病毒性(βsvanxiety=0.009,p<0.01)显著增加。然而,厌恶对任何层面都没有显著影响。这些结果表明,焦虑强度分数增加1个单位(1个标准差)平均可导致大小增加1%,宽度增加0.7%,a0。深度增加了015个单位,结构病毒性增加了0.009个单位(这表明CASCADE包含更多的点对点共享和更少的广播结构)。

40
mingdashike22 在职认证  发表于 2022-4-24 11:37:42
此外,愤怒的1单位强度分数增加平均会导致大小减少4.9%,最大宽度减少4.6%,悲伤增加1单位会导致insize减少8.2%,最大宽度减少6.1%。这些结果与观察结果一致,即在我们的在线内容样本中,焦虑是表达最多的负面情绪,而愤怒和悲伤是表达最少的负面情绪(见图1(E))。平均而言,焦虑的强度得分为11。724,而愤怒和悲伤的强度得分分别为1.212和0.790。我们的结果与我们基于EASIframework(Van Kleef 2009)得出的理论预测一致,如第3节所示。研究结果并不支持觉醒增加社会传播的理论(Berger and Milkman 2012),因为我们证明了高觉醒情绪愤怒对级联的规模和广度有显著的负面影响。厌恶的影响是积极的,但并不显著,可能是因为厌恶的影响在不同类型的内容和用户群体中是异质的。具体而言,关于城市传说差异的研究表明,厌恶的影响是显著积极的(Heath等人,2001年),但对新闻文章的研究表明,这种影响并不显著(Berger and Milkman,2012年)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-3 23:20