|
文章d的第k离散情绪强度表示为ek(d),确定如下:ek(d)=∑ni=1(-1) mi×DegVi×Ik(wi),(1)其中{wi}ni=1是d篇和我们的词典中的情感词。它表达了第k个谨慎的动议。如果n=0,则ek(d)将设置为零。Ik(wi)是指wi(k)的第k个离散情绪强度∈{1, 2, . . . , 8}). Mi是wi滑动窗口中出现的否定词总数。最后,DegVi是wi滑动窗口中出现的所有度词的平均度值。然后将每篇文章的情绪归纳为八维向量。我们使用同样的程序,分析了评论中的八种离散情绪。我们给出了文章层面上情感表达的平均强度。我们发现,在所有负面情绪中,焦虑的情绪强度最高(见图1(E))。此外,我们在表C中给出了四种离散负面情绪的相关矩阵。5.2检查他们的独立性。所有负面情绪对的相关性均低于0。44,而大多数相关性都低于0.20。结果表明,这四种消极情绪之间的相关性较低,表明这四种消极情绪是独立的。这些原始的离散情绪强度(八维向量中的元素)具有不同的特征(即,具有不同的总体均值和方差)。为了比较不同的情绪,我们将这些原始的离散情绪变量标准化为Z分数。z分数的计算方法是从单个原始分数中减去总体平均值,然后将差异除以总体标准偏差。
|