空气污染、情感与分析师预测数据 空气污染、情感与分析师预测数据 空气污染、情感与分析师预测数据
这份数据很不容易收集得到,供大家作进一步的实证研究之用。
具体的变量描述在表格中我都详细地用中文逐一写出来了。整理的方法也粘贴在下面,供大家参考。为了大家使用方便,我还把表格转换为Excel格式,把变量都整理好,直接用就可以了。
这份数据用于分析空气污染、空气质量、CEO乐观度、分析师乐观度和分析师预测等都相当好用,而且也相当高档,用得好的话发《经济研究》、《管理世界》和《世界经济》等国内权威期刊都没有问题,甚至可以尝试投到SSCI中。
祝大家科研顺利!
我们通过收集在深圳证券交易所交易的所有公司的现场访问信息来开始我们的样本构建。在2009-2015年期间,我们获得了22200份这样的新闻稿,覆盖了1481家公司(包括股票分析师、个人投资者、共同/对冲基金经理和记者在内的67443位访问者)。基于这个初始数据集,我们使用以下七个步骤来组装我们的最终数据集。
第1步:由于我们主要对提供每股收益(EPS)预测的卖方分析师感兴趣,因此我们只保留卖方分析师在访问后30天内至少发布一份预测报告的观察结果。
第2步:然后我们将空气质量指数和天气信息合并到主数据集中。其中,有486个观察值被删去,因为我们没有相应的空气质量指数信息。
第3步:由于我们需要使用已实现的每股收益数据来计算预测乐观度,因此我们删除了两个预测财年晚于2016年(即我们数据的最后一年)的观测结果。
第4步:448个观测值(4.5%)与拜访前年份的财务数据不匹配,因此删除。在这些匹配的观察值中,有843个观察值缺少关于总资产、市账比、无形资产占比、股票周转率、年度股票回报和每日波动率的财务信息(均在第1年),因此删除。
第5步:然后我们合并特定分析师的信息,包括分析师跟踪的公司的数量,以及分析师生成的预测报告的数量。
第6步:为了控制天气的影响,我们将参观日期的天气信息合并在一起,包括日照时数、温度、湿度、降水和风速。我们还进一步删除了47个缺少天气变量值的观测值(这些值被气象站记录为“缺失”,并归因于设备故障或人为错误)。
第7步:最后,我们合并了每个分析师在访问前三个月的工作城市的信息,并最终得到5108个观察值。