楼主: 素业不言钱
165 1

[数据集] 会计信息质量数据大汇总 [分享]

  • 0关注
  • 10粉丝

博士生

59%

还不是VIP/贵宾

-

威望
0
论坛币
4661 个
通用积分
5.0341
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
779 点
帖子
42
精华
0
在线时间
530 小时
注册时间
2016-5-4
最后登录
2020-8-7

素业不言钱 学生认证  发表于 2020-8-1 17:12:51 |显示全部楼层
常用会计信息质量指标汇总
度量指标1:上交所与深交所考评 信息披露质量.xlsx (274.91 KB, 需要: RMB 11 元)
Scode[股票代码]-上市公司股票代码
Eyear[考评年度]-上市公司考评结果所对应的考评年度
Evalrst[考评结果]-上交所及深交所对上市公司在各个年度中的表现所作出的工作评价。其中:2001-2010年采用的是“优秀、良好、合格、不合格”;2011以后的采用的是“A、B、C、D”
数据期间:2001-2017
观测数20985
屏幕快照 2020-08-01 下午4.51.50.png


度量指标2:盈余质量 盈余质量.xlsx (3 MB, 需要: RMB 15 元)
Scode[股票代码]-上市公司股票代码 Year
真实盈余管理Bl与应计管理(修正琼斯模型mjm、DD模型、kothari模型)计算出的盈余管理程度

数据期间:2001-2018
观测数量:42876
屏幕快照 2020-08-01 下午5.01.19.png

度量指标3:年报语气 年报文本语气.xlsx (2.1 MB, 需要: RMB 26 元)
Scode[股票代码]-上市公司股票代码
Year[会计年度]-年报所属会计年度
WordNum[年报字数]-年报全文总字数
VocabularyNum[年报词汇数]-年报文本词汇数量
SentenceNum[年报句子数]-年报文本句子数量
LM_positive[LM词典积极词汇数]-基于LM词典计算年报文本中的积极词汇数
LM_negative[LM词典消极词汇数]-基于LM词典计算年报文本中的消极词汇数
Ntusd_Positive[台大词典积极词汇数]-基于台湾大学《中文情感极性词典》计算年报文本中的积极词汇数
Ntusd_Negative[台大词典消极词汇数]-基于台湾大学《中文情感极性词典》计算年报文本中的消极词汇数
LM_Tone1[基于LM词典的TONE1]-LM_TONE1=(积极词汇数-消极词汇数)/年报词汇数,LM_TONE1值越大,表示年报文本信息语气越积极
LM_Tone2[基于LM词典的TONE2]-LM_TONE2=(积极词汇数-消极词汇数)/(积极词汇数+消极词汇数),LM_TONE2值越大,表示年报文本信息语气越积极
Ntusd_Tone[基于台大词典的TONE]-NTUSD_TONE=(积极词汇数量-消极词汇数量)/(积极词汇数量+消极词汇数量),NTUSD_TONE值越大,表示年报文本信息语气越积极

数据期间:2007-2018
观测数量:29532

屏幕快照 2020-08-01 下午5.05.31.png

度量指标4:非标准审计意见 审计单位及审计意见.xlsx (1.19 MB, 需要: RMB 11 元)
SCode[股票代码]-上市公司股票代码
Year[会计年度]-会计师事务所对被审计单位进行审计的会计年度
AccFirm[会计师事务所]-对公司进行审计的会计师事务所名称
Auditor[审计师]-对公司进行审计的签字注册会计师姓名
AudOp[审计意见]-审计师对鉴证对象是否符合鉴证标准而发表的意见,分为标准无保留意见、带强调事项段的无保留意见、无法表示意见、保留意见、保留意见加说明段
AudExp[审计费用]-注册会计师在提供审计服务后,向被审计单位收取的费用。单位:元

数据期间:1992-2018
观测数量:42116
屏幕快照 2020-08-01 下午5.08.41.png



stata SPSS
15521004328 学生认证  发表于 2020-8-1 19:12:39 来自手机 |显示全部楼层
素业不言钱 发表于 2020-8-1 17:12
常用会计信息质量指标汇总
度量指标1:上交所与深交所考评
Scode[股票代码]-上市公司股票代码
请问年报语气可以提供情感分析代码吗
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2020-8-7 20:02