楼主: mingdashike22
1963 67

[经济学] 网络内容传播中的情感 [推广有奖]

61
大多数88 在职认证  发表于 2022-4-24 11:39:54
2014)和weadd wi,jto P。第三,我们迭代扩展基本词汇L。我们定义了一个算法f(wi;L,θ),该算法将一个词映射到情绪强度向量vi=(e,e,…,e),其中∈ [0, 1]. 正如我们在后面详述的,f是以参数θ和词库L为条件的。对于每个单词wi∈ P,我们使用f-tomap表示一个情绪强度向量vi。如果vi至少有一个正强度值,我们将一个词强度对(wi,vi)添加到基本词汇中。在一次迭代之后,我们检查基本词汇中的单词数量是否增加。如果是这样,我们重复迭代,直到字数收敛。接下来,我们介绍算法f。f的基本原理来源于K-最近邻算法,但我们在任务中对其进行了定制,并引入超参数α来控制噪声。对于单词w,我们使用预先训练的单词向量来构造包含K个最相似单词的单词集。然后我们检查Swand情感词汇L的交叉点,表示为SLw。如果SLW为非空,我们使用SLW中情感词的情感强度的加权平均值,根据它们与w的相似性来确定w的情感强度。我们将低于α的情感强度压缩为零以减少噪声。参数θ=(K,α)被选为(5,0.15),这是Yu等人(2019)建议的最佳参数。我们使用样本外测试来验证该方法。在每次迭代i之后,我们得到一个扩展的词库Li。对于测试集Lte中的每个单词w,我们使用f(w;Li,θ)生成w的预测运动强度向量v。然后,我们使用平均绝对误差(MAE)来评估v和Quan和Ren(2010)提供的人类注释值向量v之间的误差。图EC。1.1说明了每次迭代的扩展字数和预测误差。当迭代次数为20次时,情感词的数量收敛。

62
nandehutu2022 在职认证  发表于 2022-4-24 11:40:02
在运行期间,预测误差略有变化,从0.0580到0.0620。低且稳定的predictionerror级别确保了整个迭代过程的有效性和词典的准确性。经过这一过程,共发现16921个新词。这一结果证实了构建特定领域词汇的必要性,如果不构建特定领域词汇,58.4%的独特情感词(28969个词中的16921个)将被忽略,也就是说,如果只使用基本词汇。欧共体。2.在前一个附录中,对样本外测试构建的词典进行评估,确保算法的估计与Quan和Ren(2010)注释的基本词典一致。然而,人们可能会担心,基本词汇在我们的语境中可能是无效的。更令人信服的评估将涉及我们的算法的估计与人类注释的比较。作者电子伴侣:在线内容差异中的情感EC3图EC。1.1迭代、单词扩展和测试错误。图中显示了每次迭代的扩展字数和预测错误。当迭代次数为20次时,情感词的数量趋于一致。在迭代过程中,预测误差略有变化,从0.0580到0.0620。低且稳定的预测误差水平确保了整个迭代过程的有效性和词典的准确性。通过这个过程总共发现了16921个新词。为此,首先,随机选择1200个新挖掘的情绪词作为测试集。第二,五名研究助理被要求对1200个单词中的每一个以及八个情绪类别中的每一个单独注释情绪强度。第三,我们对注释者提供的结果进行平均,这样结果就不会因为注释者的主观性而产生偏差。

63
nandehutu2022 在职认证  发表于 2022-4-24 11:40:09
然后,对于1200个单词中的8个情感类别,我们获得了9600个人类注释和9600个算法估计值。最后,我们进行了aStudent的t检验来比较这两个结果。我们发现人类注释和算法估计之间的差异并不显著(p=0.05,N=9600)。欧共体。3.主题建模的参数选择我们使用了潜在Dirichlet分配(LDA)主题模型(Blei et al.2003),并就文章标题和内容进行了培训。具体来说,首先,我们使用Python的中文分词库,将标题和内容切割成单词。其次,我们过滤掉了这些标题和内容中的所有情感词(在我们构建的词典中)。通过这样做,话题变量和情感变量由不同的语言特征构成。这降低了两组变量相互混淆的可能性。我们还过滤掉了低频词(即出现在少于0.1%文章中的词),以减少模型估计中的噪声。第三,我们培训了一个LDA模型,并指定了使模型困惑最小化的最佳主题数量(Blei等人,2003)。当主题数为30时,困惑最小化(图EC.3.1)。接下来,我们使用经过训练的LDA模型将每篇文章的标题和内容映射到一个30维向量astopic分布,每个元素表示文章属于相应主题类别的概率。ec4作者电子伴侣:在线内容中的情感差异配置EC。3.1潜在Dirichlet分配(LDA)模型估计在多个主题中的困惑。我们在图EC中展示了主题建模的参数选择结果。3.1. 困惑是为LDA模型选择最佳参数(即主题数量)的常用指标(Bleet al.2003)。困惑定义为exp(-1×对数似然/字)。

64
大多数88 在职认证  发表于 2022-4-24 11:40:15
主题的最佳数量应尽量减少模型的复杂性。因此,我们选择了30个主题。欧共体。4.积极情绪表达的影响。4.1. 当分析消极情绪表达对级联结构特性(即深度、大小、最大宽度和结构病毒性)的影响时,积极情绪表达对级联结构特性的影响受文章中嵌入的积极情绪表达的控制。我们的研究结果表明,快乐对社交规模有负面影响(βsizejoy=-0.003,p<0.1),而惊喜对级联最大暗带宽度有积极影响(β宽度surprise=0.017,p<0.05)。我们还发现,爱的程度越高的文章,级联深度(β深度=0.006,p<0.01)、大小(β大小=0.004,p<0.01)、最大宽度(β宽度=0.002,p<0.1)和结构病毒性(βsvlove=0.004,p<0.01)明显越高。欧共体。4.2. 积极情绪表达对级联人口统计学和社会关系的影响与我们对负面情绪表达对级联结构特性的影响的分析类似,在分析负面情绪表达对级联人口统计学和社会关系的影响时,我们还控制了文章中嵌入的积极情绪表达。我们的结果表明,预期和爱对参与级联的用户的平均年龄有显著的积极影响(β平均年龄=0.079,p<0.001,β平均年龄=0.042,p<0.001),而惊喜对用户的平均年龄有负面影响(β平均年龄=-0.081,p<0.05)。

65
mingdashike22 在职认证  发表于 2022-4-24 11:40:21
与作者同行的文章:在线内容差异EC5中的情绪具有更高程度的快乐和预期,导致参与级联反应的女性比例显著降低(βF女性比例快乐=-0.010,p<0.05,βF女性eP比例抑制=-0.013,p<0.1),而表达更多爱的文章会导致参与级联的男性用户比例显著增加(βF emal eP roportionlove=0.007,p<0.05)。最后,惊喜对参与社交活动的用户之间的弱联系比例有显著的积极影响(βW eakT ieP roportionsurprise=0.073,p<0.05)。ec6作者电子伴侣:在线内容中的情感差异。5.图表c。5.1. 图EC。5.1大型级联的示例。注:级联涉及7225个独特个体(由节点表示)。绿色边表示从publicaccount共享。红边和蓝边分别代表来自熟人的分享(弱关系)或来自一级朋友的分享(强关系)。这篇文章记录了一起涉及某些博客作者和记者的丑闻,他们非法贿赂了多家房地产公司。这些博客作者和记者威胁说,除非他们收到大笔报酬,否则他们将在网上传播有关这些公司的负面文章。作者电子伴侣:在线内容差异中的情感EC7图EC。5.2包含极端消极情绪表达的文章评论中表达的离散情绪:(A)愤怒,(B)焦虑,(C)悲伤,(D)厌恶。注:x轴表示情绪表达强度得分(标准化为标准正态分布后)。yaxis表示评论中的情绪类别。子情节的标题表示文章所包含的极端情绪类型。

66
大多数88 在职认证  发表于 2022-4-24 11:40:27
表达极端情绪的文章只有一篇情绪强度得分高于1.96,而其他文章低于1.96。虚线表示的间隔代表95%的置信区间。实线表示的间隔代表平均值加上或减去其标准偏差的1个单位。总体数据表明,评论中表达最多的情绪与文章中表达最多的情绪一致。欧共体。5.2. 表EC。5.1叶栅尺寸之间的相关性叶栅尺寸最大宽度结构病毒性叶栅尺寸1.000尺寸0.720 1.000最大宽度0.588 0.974 1.000结构病毒性叶栅尺寸0.921 0.743 0.616 1.000叶栅尺寸与最大宽度和深度呈正相关。结构病毒性与级联的深度、大小和最大宽度呈正相关。ec8作者电子伴侣:在线内容中的情感可区分电子商务。5.2负性情绪之间的相关性Sanger焦虑悲伤厌恶愤怒1.000焦虑0.190 1.000悲伤0.056 0.178 1.000厌恶0.435 0.358 0.058 1.000大多数相关性的绝对值低于0.435。

67
何人来此 在职认证  发表于 2022-4-24 11:40:33
结果表明这四种消极情绪是独立的。表EC。5.3结果:不包括包含视频和少量单词的文章超大型阅读变数-0.067* -0.047* -0.029* -0.034(0.039)(0.026)(0.013)(0.023)焦虑0.022*** 0.016*** 0.011*** 0.014***(0.006)(0.004)(0.003)(0.003)悲伤-0.03-0.044* -0.027* -0.023(0.054)(0.013)(0.010)(0.031)厌恶0.022** 0.009 0.002 0.011*(0.010)(0.006)(0.006)(0.006)(0.006)积极的情绪表达X文章水平特征X发表者固定效应X信号水平:*p<0.05,**p<0.01,***p<0.001鉴于大小和最大宽度的右偏分布,我们对这两个变量进行了对数变换。积极的情绪表达,即喜悦、爱、惊喜和期待,都受到控制。所有文章级别的变量(即文章长度、文章中嵌入的图像和视频数量、文章是否在周末发布、评论数量和文章的主题分布)都是受控的。SV表示结构病毒性。估计的标准误差。表EC。5.4结果:包括原始深度尺寸偏差-0.069-0.050* -0.039* -0.038(0.042)(0.026)(0.023)(0.025)焦虑0.017*** 0.013*** 0.009*** 0.009***(0.006)(0.004)(0.003)(0.003)悲伤-0.047-0.060* -0.042-0.037(0.052)(0.032)(0.029)(0.030)厌恶0.021** 0.008 0.004 0.012 **(0.010)(0.006)(0.005)(0.006)积极的情绪表达X文章水平特征X发表者固定效应X显著水平:*p<0.05,**p<0.01,***p<0.001鉴于大小和最大宽度的右偏分布,我们对这两个变量进行了对数变换。积极的情绪表达,即喜悦、爱、惊喜和期待,都受到控制。所有文章级变量(即。

68
能者818 在职认证  发表于 2022-4-24 11:40:34
文章长度、文章中嵌入的图像和视频数量、文章是否在周末发布、评论数量和文章的主题分布)都受到控制。创意也受到控制。SV表示结构病毒性。估计的标准误差。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 05:17