楼主: freestyle2003
25 2

[实证分析] 2007-2024年上市公司年报语气/积极语调/消极语调指标整理 含原始数据和Stata代码 [推广有奖]

已卖:5166份资源

学科带头人

43%

还不是VIP/贵宾

-

威望
1
论坛币
40792 个
通用积分
1197.2978
学术水平
574 点
热心指数
544 点
信用等级
538 点
经验
50469 点
帖子
1626
精华
0
在线时间
1163 小时
注册时间
2017-8-9
最后登录
2026-2-19

初级热心勋章 初级信用勋章

楼主
freestyle2003 企业认证  发表于 昨天 12:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

上市公司年报语气/积极语调/消极语调指标

持续更新,后续关注我后免费获取更新版本
不管什么时候毕业或者发期刊用到,都能用到最新的数据

【原创整理,严禁转载,转载必究】


参考文献

[1]曾庆生,周波,张程,等.年报语调与内部人交易:“表里如一”还是“口是心非”?[J].管理世界,2018,34(09):143-160.
[2]王华杰,王克敏.应计操纵与年报文本信息语气操纵研究[J].会计研究,2018,(04):45-51.

计算说明


1)参照曾庆生等(2018)的研究,以Loughran 和Mcdonald(2011)提供的金融情感英文词汇列表为基础,依据有道词典和金山词霸对所有的英文词汇进行了翻译,如果一个英文词汇对应多个中文单词,都予以了保留,确保词汇能够最大限度涵盖中文财务报告中的语调情感词汇,最终词汇列表包括 22549 个消极词、5934 个积
极词以及1363个停用词(停用词为“的”等无意义或者无情感词汇)。创建中文词汇列表之后,采用分
词包围 Python 开放源“结巴”中文分词模块对年报全文文本进行自动分词,然后进行词频统计(统计
时考虑到语意反转现象,若积极词前紧跟着否定词,则统计为消极词,反之亦然)。
构建指标:

tone                该年报内积极词汇数与消极词汇数之差占年报总词汇数的比例
postone        积极语调:该年报内积极词汇数占年报总词汇数的比例
negtone        消极语调:该年报内消极词汇数占年报总词汇数的比例
tone_2        (积极词汇数-消极词汇数)/(积极词汇数+消极词汇数)



2)参照王华杰和王克敏(2018)的研究,使用台湾大学制作的《中文情感极性词典》,将诸如积极、进步、高效等积极属性词语集作为积极情绪词语列表;将诸如低迷、暗淡、不利等消极属性词语集作为消极情绪词语列表。构建指标:

tone                该年报内积极词汇数与消极词汇数之差占年报总词汇数的比例
postone        积极语调:该年报内积极词汇数占年报总词汇数的比例
negtone        消极语调:该年报内消极词汇数占年报总词汇数的比例
tone_2        (积极词汇数-消极词汇数)/(积极词汇数+消极词汇数)




数据说明

样本选择:全部A股2007-2024年数据

包含两个版本:一份未剔除、一份剔除金融和ST、*ST或PT

注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可

并对连续型变量进行了1%和99%分位数的缩尾处理

每个压缩包都附有初始数据,计算代码,参考文献和最终数据




赠送超值上市基本信息:证券代码、统计截止日期、上市公司ID、证券简称、ABH股交叉码、行业名称、行业代码、中文全称、公司成立日期、首次上市日期、法人代表、注册资本、公司网址、经营范围、主营业务、上市状态、注册具体地址、注册地址所属省份、注册地址所属城市、注册地经度(E)、注册地纬度(N)、公司办公地址、办公地址经度、办公地址纬度、办公地址邮政编码等。
再额外赠送超值上市常用分组指标:是否 ST或PT、是否金融业、资产负债率是否大于1、是否沪深A股、
是否北京A股、行业名称、行业代码、所属省份代码、所属省份、所属城市代码、所属城市、分东部地区、中部地区、西部地区、是否高科技行业、是否重污染行业



原创申明

作为长期扎根于此的原创数据提供方,我们始终秉持严谨的治学态度。遗憾的是,近期发现部分投机账号对本团队的心血进行像素级抄袭(包括数据及计算文案说明)。

在此郑重提醒广大同仁:学术研究,数据为基。抄袭者可以复制文字,却无法复制数据背后的清洗逻辑与学术洞察。若使用来源不明的盗版数据,可能因数据缺失、错误而导致研究偏误,影响实证结论的可靠性。请务必认准官方唯一渠道,确保您的研究建立在扎实的数据基础之上。


数据可靠,多轮审核

本套数据集并非简单的镜像导出,而是我们课题组在深度科研过程中沉淀下来的“干货”:

  • 深度溯源以主流上市公司数据库为基准,对核心指标进行了跨平台的手工比对与补缺。

  • 专家背书数据处理方案经过导师指导,并由多位应用经济学在读博士、硕士进行多轮逻辑交叉校对,确保符合实证论文的投稿要求。

  • 工匠精神整理成本(时间、专业知识)远超目前的分享定价,旨在服务真正有科研需求的学友。






数据截图

QQ截图20260219121359.jpg

分年份数据量统计
QQ截图20260219121344.jpg

缩尾后的描述性统计

QQ截图20260219121501.jpg

QQ截图20260219121546.jpg

2007-2024年上市公司年报语气积极语调消极语调指标整理 含原始数据和Stata代码.zip (47.12 MB, 需要: RMB 59 元)




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上市公司年报 Stata 原始数据 上市公司 公司年报

沙发
freestyle2003(未真实交易用户) 企业认证  发表于 昨天 12:17

整理所花费时间远超成本价

藤椅
freestyle2003(未真实交易用户) 企业认证  发表于 昨天 12:17
本人经济学博士毕业,如过您有具体的数据需要定制,可以私信联系,提供数据查找、整理数据以及实证分析服务!提供售后服务,所有私信和评论都会及时回复,有任何疑问可随时联系!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-20 13:02