上市公司年报语气/积极语调/消极语调指标 持续更新,后续关注我后免费获取更新版本 不管什么时候毕业或者发期刊用到,都能用到最新的数据 【原创整理,严禁转载,转载必究】 参考文献 [1]曾庆生,周波,张程,等.年报语调与内部人交易:“表里如一”还是“口是心非”?[J].管理世界,2018,34(09):143-160. [2]王华杰,王克敏.应计操纵与年报文本信息语气操纵研究[J].会计研究,2018,(04):45-51. 计算说明 1)参照曾庆生等(2018)的研究,以Loughran 和Mcdonald(2011)提供的金融情感英文词汇列表为基础,依据有道词典和金山词霸对所有的英文词汇进行了翻译,如果一个英文词汇对应多个中文单词,都予以了保留,确保词汇能够最大限度涵盖中文财务报告中的语调情感词汇,最终词汇列表包括 22549 个消极词、5934 个积 极词以及1363个停用词(停用词为“的”等无意义或者无情感词汇)。创建中文词汇列表之后,采用分 词包围 Python 开放源“结巴”中文分词模块对年报全文文本进行自动分词,然后进行词频统计(统计 时考虑到语意反转现象,若积极词前紧跟着否定词,则统计为消极词,反之亦然)。 构建指标: tone 该年报内积极词汇数与消极词汇数之差占年报总词汇数的比例 postone 积极语调:该年报内积极词汇数占年报总词汇数的比例 negtone 消极语调:该年报内消极词汇数占年报总词汇数的比例 tone_2 (积极词汇数-消极词汇数)/(积极词汇数+消极词汇数) 2)参照王华杰和王克敏(2018)的研究,使用台湾大学制作的《中文情感极性词典》,将诸如积极、进步、高效等积极属性词语集作为积极情绪词语列表;将诸如低迷、暗淡、不利等消极属性词语集作为消极情绪词语列表。构建指标: tone 该年报内积极词汇数与消极词汇数之差占年报总词汇数的比例 postone 积极语调:该年报内积极词汇数占年报总词汇数的比例 negtone 消极语调:该年报内消极词汇数占年报总词汇数的比例 tone_2 (积极词汇数-消极词汇数)/(积极词汇数+消极词汇数) 数据说明 样本选择:全部A股2007-2024年数据 包含两个版本:一份未剔除、一份剔除金融和ST、*ST或PT 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可 并对连续型变量进行了1%和99%分位数的缩尾处理 每个压缩包都附有初始数据,计算代码,参考文献和最终数据 赠送超值上市基本信息:证券代码、统计截止日期、上市公司ID、证券简称、ABH股交叉码、行业名称、行业代码、中文全称、公司成立日期、首次上市日期、法人代表、注册资本、公司网址、经营范围、主营业务、上市状态、注册具体地址、注册地址所属省份、注册地址所属城市、注册地经度(E)、注册地纬度(N)、公司办公地址、办公地址经度、办公地址纬度、办公地址邮政编码等。 再额外赠送超值上市常用分组指标:是否 ST或PT、是否金融业、资产负债率是否大于1、是否沪深A股、 是否北京A股、行业名称、行业代码、所属省份代码、所属省份、所属城市代码、所属城市、分东部地区、中部地区、西部地区、是否高科技行业、是否重污染行业 原创申明作为长期扎根于此的原创数据提供方,我们始终秉持严谨的治学态度。遗憾的是,近期发现部分投机账号对本团队的心血进行像素级抄袭(包括数据及计算文案说明)。 在此郑重提醒广大同仁:学术研究,数据为基。抄袭者可以复制文字,却无法复制数据背后的清洗逻辑与学术洞察。若使用来源不明的盗版数据,可能因数据缺失、错误而导致研究偏误,影响实证结论的可靠性。请务必认准官方唯一渠道,确保您的研究建立在扎实的数据基础之上。 数据可靠,多轮审核本套数据集并非简单的镜像导出,而是我们课题组在深度科研过程中沉淀下来的“干货”:
数据截图
分年份数据量统计
缩尾后的描述性统计
2007-2024年上市公司年报语气积极语调消极语调指标整理 含原始数据和Stata代码.zip
(47.12 MB, 需要: RMB 59 元)
|


雷达卡




原创申明
数据可靠,多轮审核
京公网安备 11010802022788号







