正文
上市公司年报是资本市场重要的信息披露途径,其中文字内容常能反映企业管理层态度与市场预期。借助对年报文本的情感剖析,可量化企业语言中的积极或消极倾向,为投资者解读非结构化信息提供补充视角。
本数据集收集了4815家上市公司自2010年至2024年的年报文本,运用自然语言处理技术提取情感词汇,最终获得5w+条情感语调数据,涵盖正负面词汇数量、句子数、总词汇数等多项指标。
一、数据介绍数据名称:上市公司年报情感语调数据数据范围:上市公司数据年份:2010-2024年数据格式:面板数据,excel数据来源:xx社区用户
二、数据指标
[td]字段名称 | 字段说明 |
| Symbol | 股票代码 |
| stkcd | 公司代码 |
| year | 年份 |
| ShortName | 公司简称 |
| IndustryCode | 行业分类代码 |
| IndustryName | 行业名称 |
| 正面词汇数量 | 年报中积极词汇的数量 |
| 负面词汇数量 | 年报中消极词汇的数量 |
| 总词汇数量 | 词汇总量 |
| 句子数量 | 年报句子数量 |
| 文字数量 | 年报中文字总数 |
| 情感语调1 | 正面词汇数 / 总词汇数 |
| 情感语调2 | (正面词汇数 - 负面词汇数) / (正面词汇数 + 负面词汇数) |
三、计算方式参考《财经研究》期刊中钟凯等(2021)的研究方法,基于文本情感分析理论构建两个核心指标:情感语调1 = 正面词汇数 / 总词汇数情感语调2 =(正面词汇数−负面词汇数)/(正面词汇数+负面词汇数)
四、参考文献钟凯, 董晓丹, 彭雯, 等. 一叶知秋:情感语调信息具有同业溢出效应吗?——来自业绩说明会文本分析的证据[J]. 财经研究, 2021, 47(09): 48-62.
五、数据概览2010-2024年上市公司年报情感语调数据概览图
中国上市公司情感语调数据研究(2010-2024)
(76 Bytes, 需要: RMB 23 元)


雷达卡




京公网安备 11010802022788号







