楼主: 千里鸟数据
160 0

[经管数据集] 上市公司企业情感语调数据上市公司年报情感语调数据(2010–2024年) [推广有奖]

已卖:5760份资源
好评率:99%
商家信誉:一般

大师

29%

还不是VIP/贵宾

-

威望
1
论坛币
382 个
通用积分
401.6256
学术水平
10 点
热心指数
11 点
信用等级
11 点
经验
144298 点
帖子
4841
精华
0
在线时间
6916 小时
注册时间
2022-4-5
最后登录
2026-2-4

楼主
千里鸟数据 在职认证  发表于 2025-7-17 22:11:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

上市公司企业情感语调数据上市公司年报情感语调数据(2010–2024年)



一、数据介绍
  • 数据名称:上市公司企业情感语调数据(2010–2024年)

  • 数据年份2010–2024年

  • 数据范围:中国A股上市公司(覆盖4,815家企业)

  • 数据格式:面板数据,Excel文件

  • 数据来源:基于上市公司年报文本,参考《财经研究》等学术成果,结合自然语言处理技术(NLP)处理与构建



上市公司企业情感语调数据(2010–2024年).zip (5.73 MB, 需要: RMB 22 元)

二、数据指标

该数据集基于企业年报文本语料,通过情感词典识别和文本分词提取以下主要字段:

字段名称

字段说明

Symbol

股票代码

stkcd

公司代码(标准Wind代码)

year

年份

ShortName

公司简称

IndustryCode

行业分类代码(证监会行业分类)

IndustryName

行业名称

正面词汇数量

年报中识别的积极情绪词数量

负面词汇数量

年报中识别的消极情绪词数量

总词汇数量

全部有效词汇数量

句子数量

文本中句子总数

文字数量

年报文字总字符数

情感语调1

正面词汇数 ÷ 总词汇数

情感语调2

(正面词汇数 − 负面词汇数)÷(正面词汇数 + 负面词汇数)

三、计算方法

情感语调指标来源于对年报文本的词汇层级分析,主要参考钟凯等(2021)方法,构建以下两个核心量化指标:

  • 情感语调1 = 正面词汇数 ÷ 总词汇数

  • 情感语调2 =(正面词汇数 − 负面词汇数)÷(正面词汇数 + 负面词汇数)


文本情绪词提取基于中文财经情感词典,语料处理使用了分句、分词、词性标注、去除停用词等预处理步骤,确保情绪量化指标的稳定性和解释力。

四、参考文献

钟凯, 董晓丹, 彭雯, 等. 一叶知秋:情感语调信息具有同业溢出效应吗?——来自业绩说明会文本分析的证据[J]. 财经研究, 2021, 47(09): 48–62.


五、数据概览
WechatIMG3448.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上市公司年报 上市公司 公司年报 上市公 Industry

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-4 14:16