楼主: 可人4
798 25

[经济学] 基于Twitter数据的日本主观幸福感指标研究 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-5-16 17:47:58
表情符号的发展在日本很有特色,可以说起源于汉字文化,汉字作为图形符号代表一个想法或概念(这也适用于使用汉字的亚洲国家)。尽管表情符号非常丰富,但一项大型跨国研究似乎证明,无论文化如何,纵向和横向表情符号都传达了类似的概念(Park等人,2014)。不过,表情符号加上副词似乎比简单的表情符号更能预测a对短信的直观感知(Rzepka等人,2016年)。关于表情符号和动作之间关联的许多其他研究可以在文献中找到(例如Shoeb and de Melo,2020;Novak et al.,2015),但它们并不具体c到日语。与日本文化中通过非语言手段表达情感的方式有关,被称为ASCII艺术的失写设计在诸如2channel(最流行的在线公告板之一)等公告板中得到了相当广泛的使用。Kamijo等人(2016年)对日本Twitter账户的人格特质评估进行了研究。关于危机期间日语自动情感标注的大规模研究,见(Vo和Collier,2013)。关于speci的更多语言学分析c最近出现了与舒适和幸福相关的日文术语(kawaii see,例如Iio,2020)以及性别规范语言研究(Carpi和Iacus,2020年)。总之,目前的所有研究要么基于词典或语义规则,要么采用经典的Word2Vec方法(Mikolov等人,2013年)或标准NLP技术(例如Bengio等人,2003年)。

12
mingdashike22 在职认证  发表于 2022-5-16 17:48:03
在这项研究中,正如第5节所述,我们使用定性和定量相结合的方法,这一术语是“现在”和“预测”的缩写:它指的是实时收集有关某些数量或变量的信息的机会。考虑到幸福感维度的复杂性以及表达幸福感的语言。事实上,分析的重点并不是一条信息的特殊特征,而是一条推文中经过准确训练的全部词语。这些人都是日本母语,完全理解用于表达情感的自然语言的所有阴影。4数据收集本工作中使用的数据来自两个在两个di下收集的不同存储库但在这两种情况下都使用Twitter搜索API。这些日本推文仅使用语言=日语,国家=日本,意大利(意大利语和意大利)也是如此。值得一提的是,Twitter帖子不属于从实际人群中随机选择的个人(Baker等人,2013年;Murphy等人,2014年)。参考人群是在分析中选择的所有Twitter账户的帖子总数。此外,Twitter账户不能与个人唯一关联,有些账户比其他账户更活跃。基于这些原因,我们分析的重点是通过公共Twitter“搜索”和“流媒体”API收集的帖子总量(在报告期内,以日语书写)。阿斯珀在官方文档中,Twitter搜索API只提供了所有推文的10%样本,尽管该公司没有披露关于该样本在社交网络上发布的所有推文中的代表性的任何信息。

13
大多数88 在职认证  发表于 2022-5-16 17:48:09
然而,根据我们的个人经验,也可以Hino和Fahey(2019)在大规模实验中发现,主题和关键词的覆盖率相当准确,似乎是随机选择的:因此,我们将本研究中使用的Twitter数据视为Twitter上讨论内容的代表性样本。根据Statista的数据,意大利每天约有800万活跃账户,而日本约有5200万活跃账户,因此发布的推文数量不可比。尽管存在这些局限性,但使用Twitter数据的优势在于,数据的收集可以(几乎)连续进行,而且,由于第5节中所述的人工监督定性分析,可以直接从文本中捕捉幸福感的表达,而不是通过web表单询问。在意大利,最初的项目在2012年2月1日至2018年6月21日期间收集了约2.504亿条推文,平均每天5万条。对于日本来说,由于几个技术原因,我们每天能够收集最多5万条推文,在2015年8月24日/2018年12月31日期间总计约6080万条推文。表2报告了汇总统计数据。在同一表格中,我们还报告了SWB-I和SWB-J指数可用年份的新经济基金会(2016年)的快乐星球指数(HPI)和联合国开发计划署(2019年)的人类发展指数(HDI)。数据来自数据提供者全球经济,以及表1中列出的其他经济变量,主要来自世界银行、国际货币基金组织、联合国和世界经济论坛。我们还从OECD中收集了40岁男性的可变预期寿命,以捕捉衰老的感知和质量。

14
能者818 在职认证  发表于 2022-5-16 17:48:15
这是我们考虑的唯一年度变量,因为它在时间上的变化是非单调的,此外,它还与意大利的经济增长呈正相关(ρ=0.91),而与日本的经济增长呈负相关(ρ=-0.27).可变频率描述GDP增长季度实际GDP百分比变化同比消费增长季度百分比变化同比投资增长GDP季度百分比变化同比失业率月度劳动力百分比40岁男性预期寿命幸福星球指数年度人类发展指数年度表1:经济和环境第7节经济计量分析中使用的变量加上两个额外的油井指标。5如何从推特中提取主观幸福感SWB-J指数是一个多维幸福指数,其组成部分受新经济基金会智库为其幸福星球指数选择的维度启发(新经济基金会,2016)。总之,SWB-J模拟了之前为意大利制造的相同指示器SWB-I(Iacus等人,20192020B,a),由八个维度组成,涉及三个di不同的幸福领域:个人幸福、社会幸福和工作幸福。更多细节:1。

15
kedemingshi 在职认证  发表于 2022-5-16 17:48:21
个人幸福感:o情绪幸福感:体验积极情绪和消极情绪的频率之间的总体平衡,高分表明积极情绪比消极情绪(emo)更容易感受到;应用程序设计facehttps://statista.comTheGlobalEconomy.comhttps://data.oecd.org/healthstat/o满意的生活:对自己的整体生活(sat)有积极的评估活力:精力充沛,感觉得到充分休息和健康,同时也保持体力活动(vit)韧性和自尊:衡量个人心理资源、乐观精神和应对生活压力的能力积极的功能:自由选择并有机会去做;能够利用个人技能,同时感到专注和免费参与日常活动(乐趣);2.社会幸福感:o信任和归属感:信任他人,在体验归属感(tru)的同时感觉受到公平和尊重关系:与家人、朋友和其他提供支持的人建立密切关系的互动程度和质量(rel);3.工作幸福感:o工作质量:感到满足与工作打交道,体验工作与生活平衡的满意度,评估工作和工作条件(wor)的情感体验。众所周知,与美国(Kitayama et al.,2000;Ford et al.,2015)和最近的中国(Wonget al.,2020)相比,日本的个人幸福感与社会幸福感和工作幸福感密切相关。鉴于日本社会的集体主义性质,基于包括社会福利和工作福利在内的多个维度来衡量主观幸福感是有意义的。

16
大多数88 在职认证  发表于 2022-5-16 17:48:28
亚洲国家的主观幸福感得分较低(Diener等人,1995年),但很少有研究试图用社交媒体数据来衡量主观幸福感水平。由于该指数的多维性,人们可以更好地理解和阐明主观幸福感的内在机制。为了从推文中提取语义含义,在本研究中,我们使用了监督情绪分析,尤其是iSA(综合情绪分析)算法(Ceron等人,2016),该算法也被用于从推文数据中捕捉幸福感和幸福感的各个方面(Curini等人,2015)。iSA是一种人工监督的机器学习方法,其中包含一个文本样本(训练集)rst读取并手动分类由人类编码人员进行编码,然后语料库(测试集)的其余部分自动分类这个算法使我感到困惑。监督部分至关重要,因为这是一个步骤,可以从文本中提取定性信息,而不依赖字典或特殊语义,而是依赖文化、心理和情感解释。基于用户需求的其他方法有一些词典,但主要关注幸福的概念(Bollen等人,2011年;Zhao等人,2019年)。与其他机器学习技术相比,iSA的优势在于,它旨在直接估计意见的总体分布(例如,正面、负面、中性),而无需通过单独的分类测试集中的帖子类别。这种方法大大减少了估计误差。此外,作为一种顺序方法,在高噪声数据的情况下,达到其他方法相同精度所需的训练集的大小通常要小10到20倍。读者可以参考Ceron等人。

17
nandehutu2022 在职认证  发表于 2022-5-16 17:48:34
(2016)获取该方法的技术解释。请注意,在讨论日本社会的幸福感概念时,熊野(2018)区分了两种类型的幸福感:什叶派幸福感或享乐型幸福感,以及池井幸福感或eudaimonic幸福感。很明显,我们的分析中捕捉到了bothare,但没有进行区分,因为这将是未来工作的范围。训练集的数据是根据筛选关键字在附录的表10、11、12、13、14、15和16中列出。请注意,即使训练集是由对数据进行过滤,整个统计分析是在收集的推文的完整存储库中完成的。在培训集classi的定性步骤中例如,编码规则已分发给人类编码人员:orst的一般规则是适当地标记/标记/编码主题外的帖子。在这个阶段,机器学习算法将理解噪声第二条规则是:如果你对一篇文章的语义上下文没有完全信服,不要对它进行分类,直接跳过它,转到下一条。这些都不是离题的,让算法尝试为您分类可以将RT(重新推文)归类为来自账户的原始推文。这是一种情感/观点转移的假设,我们假设这与用户直接表达的情感/观点相同。当然,其他研究人员可能不同意这个假设因为每条推文都是经典的沿着一个或多个维度,始终尝试考虑对所有类别进行并行编码,并保留那些不适用于给定类别的未回答/未标记。编码规则和真实推文示例classi阳离子在附录中给出。一旦训练集完全手工编码,iSA算法将应用于日常测试数据集。每个估计分布将包含积极、中立、消极和离题条目。

18
可人4 在职认证  发表于 2022-5-16 17:48:39
OffTopiccategory代表数据中的日常噪音,其余代表信号。对于指数的每个组成部分,例如emo,在d天,指数的计算如下:emod:=%正%正+%负∈ [0,1](1)公式(1)背后的基本原理是,目的是捕捉表达或判断,这就是为什么命令不表达任何问题、判断等,即如为中性,则从计算中删除。日期d很容易从推特数据的时间戳中提取出来,推特数据总是出现在推特的元数据中。最后,SWB-J指数是八个分量emo、sat、vit、res、fun、tru rel和WOR的简单平均值。虽然它不属于本研究的范围,但是c为了获得针对特定人群的幸福指数,可以考虑各成分的加权平均值c.生命维度。6 SWB-I和SWB-J指数的初步分析显示,自2012年以来,意大利的SWB-I和SWB-J年平均值,自2015年以来,日本的SWB-I和SWB-J年平均值。我们注意到的是,日本指标在[52.5,54.5]范围内表现出较高的中期稳定性。相反,在非营利组织的情况下,中期变化更大——年值范围为[48.7,57.7],在某些年份,SWB-I的值显著高于显著地降低或显著地另一方面,这两个指标的标准差表明(图1的检查证明)SWB-J的短期波动率为这些结果显示,日本Twitter用户对日常事件和情绪的反应更为积极,而他们对生活质量的评价平均来说是稳定的,大致相当令人满意。

19
kedemingshi 在职认证  发表于 2022-5-16 17:48:45
更准确地说,意大利指标显示了一个高变化期,基本上与意大利组织和主办2015年世博会的年份一致:这是一个异常的时间框架,当意大利公众舆论中出现严重负面情绪(由于对活动筹备延迟的争议,以及对一些组织者行贿的指控)和强烈的积极情绪(由于活动的欣赏和成功)时,意大利公众舆论迅速发生变化。表4中SWB-J单组分的检查日本主观幸福感的稳定性——以及轻微下降。A.rst悖论出现在对社会关系的幸福感知上:评估家庭关系和友谊(rel)质量的子成分的突出价值在某种程度上是,在信任和归属感(tru)方面与感知到的幸福感不一致:这可能表明,对家人和朋友培养的积极情感并没有推广到社会的其他部分。与其他与个人幸福感相关的维度一样,SWB-J的情绪子维度与全球指标一致:略高于我们的平均水平功能成分,关于做和选择的机会,以及日常活动的参与度和满意度;略低于健康和身体活力(vit)的自我认知。

20
mingdashike22 在职认证  发表于 2022-5-16 17:48:51
此外,工作中的主观幸福感(wor)严格符合平均SWB-J:这与意大利的情况(见表3)相反,在意大利,wor成分最不稳定,与SWB-I的总体值没有很强的相关性,并且可能记录了强烈的识别日本人在工作满意度和整体幸福感之间,或者在工作中没有表达出对文化的担忧,这是意料之中的。看看SWB-J(和SWB-I)和两个众所周知的幸福指数之间的相关性可能会引起一些担忧。表5显示了SWB-J与幸福行星指数(HPI)的高度相关性,该指数是为2006年首次由新经济基金会(2016年)主办。HPI旨在给出可持续幸福感的衡量标准:它比较了地的古代居民不同的国家都在利用自然资源来实现长寿、幸福的生活。另一方面,SWB-J呈负相关(相关指数等于-联合国开发计划署(UNDP)自1990年以来根据阿马蒂亚·森(Amartya Sen)的幸福能力方法制定的人类发展指数启动和评估(Robeyns,2006年)。在衡量幸福感时,人类发展指数考虑了三个方面:健康、教育和生活物质标准。可以注意到,意大利的SWB-I与这两个指标都呈正相关:与HPI呈弱相关,与HDI呈强相关。所有这些都应该提醒我们,目前可用的过多幸福指数很少给出同一变量的衡量标准:每个指标都针对一个特定的变量德Well being的定义以及所有这些定义之间的关系定义有时是不明确和模棱两可的。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 08:10