该贴是在https://bbs.pinggu.org/thread-6715476-1-1.html的基础上做的一个拓展,数据同样来自于香港中文大学的报刊新闻量化舆情数据库。几点说明如下:
1、数据为A股和B股2012-2017年的数据,共计17482个公司年观测(B股:stkcd以2或9开头的股票)。
2、数据中包含了新闻id号及股票代码。3、数据中的中文变量为每家媒体报道的简单加总,中文变量名称包括“负面句子数、中性句子数、正面句子数、首尾段负面句子数、首尾段中性句子数、首尾段正面句子数、段首尾负面句子数、段首尾中性句子数、段首尾正面句子数、新闻标题情感倾向性、正文情感评分、正文情感评分1、整体情感评分和整体情感评分1”(变量解释详见附件中的《字段说明》)。
4、数据格式为.dta,用stata14.0打开即可。
5、数据费了不少精力,一般的作者也不会给予共享,所以价格(你懂的)。