楼主: dzp8848
316 0

[经管数据集] 【社会责任关注度LDA】社会责任关注度LDA数据2001-2023年 [推广有奖]

  • 0关注
  • 8粉丝

已卖:343份资源

副教授

47%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
15.7649
学术水平
13 点
热心指数
13 点
信用等级
13 点
经验
11284 点
帖子
355
精华
0
在线时间
409 小时
注册时间
2024-10-2
最后登录
2026-4-22

20周年荣誉勋章

楼主
dzp8848 发表于 2025-1-26 17:09:48 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
【社会责任关注度LDA】股东责任关注度、其他利益相关者责任关注度、对象型社会责任关注度、泛社会责任主体关注度 python处理(2001-2023年)


复刻
        首先,文本预处理是关键的一步。将社会责任报告文本拆分为长句,以便更好地进行主题建模。这种处理方式有助于克服行业信息对主题分类的干扰。文本经过清洗,去除标点符号和停用词,确保数据的纯净性。接着,使用结巴分词工具对文本进行分词,生成LDA模型的训练数据。
       在主题分析中,利用Python的sklearn库进行LDA建模。该算法采用变分推断EM算法来求解文档的主题分布和主题中词的分布。通过经验设置LDA的参数α和β为0.1和0.01,确保模型的稳定性。
        确定主题数量是LDA分析的关键步骤。通过困惑度(Perplexity)指标和可视化分析,结合实际主题分类结果,确定最佳的主题数量。困惑度是衡量模型聚类效果的指标,数值越低,模型效果越好。在0到5的主题数量范围内,困惑度逐渐趋于平缓,最终确定6个主题。
        在此基础上,利用LDAvis工具对主题分类结果进行可视化。图中圆圈大小表示主题的频率分布,圆圈之间的距离表示主题相似度。当主题数量为6时,主题相对分布均匀,分类效果较好。进一步分析每个主题下的前25个关键词,能够较好地分类出文本研究的利益相关者主题。
         表1展示了6个主题的关键词,帮助识别文本中的主要主题。最后,通过公式计算每个主题在文本中的篇幅占比,衡量不同主题的关注程度。公式中,Zi表示第i个主题的篇幅,word_sen_i表示第i个主题的句子字数,word_doc表示该文档总字数。通过这种方式,深入分析了文本主题的分布情况。

一、数据介绍
数据名称:社会责任关注度
数据范围:A股上市公司
数据年份:2006-2023年
样本数量:14206条
数据整理:权威数据库,有需要可告知
更新时间:2024年12月
数据处理软件:python

二、指标说明
四种关注度
没有对象型社会责任行动表现这个数据

3.png


三、参考文献
  • 李四海,马文琪.共同富裕目标下企业社会责任响应策略——基于社会责任报告的LDA主题分析[J].经济管理,2023,45(08):184-208.


社会责任关注度LDA.zip (2.93 MB, 需要: RMB 39 元)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:社会责任 LDA Python处理 python 数据处理软件

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-4-24 20:43