根据任晓松、孙莎、马茜(2024)提出的方法体系,投资者情绪指标的构建遵循以下系统化流程:
步骤一 数据获取:定向采集2007至2024年间财经网络社区(包括股票主题贴吧及行业论坛)发布的全部股票相关帖子,提取发帖人标识、发布时间、标题文本、阅读量等结构化信息。
步骤二 文本预处理:对采集的原始文本实施系列净化操作:首先过滤无效及重复内容,随后采用jieba分词工具进行中文分词处理,剔除通用及领域特定停用词,最终通过TF-IDF算法将文本数据转换为机器可识别的数值向量。
步骤三 情感分类与日度情绪计算:采用朴素贝叶斯分类模型将帖子划分为乐观、中性、悲观三类情感倾向。针对上市企业i,依据第n日乐观帖子数(posi,n)与悲观帖子数(negi,n)构建情绪因子:sm(i,n) = ln((1+posi,n)/(1+negi,n))。该公式通过加1平滑处理保障数值稳定性,对数变换实现数据分布规范化。
步骤四 年度情绪指标构建:以自然年为观测周期,对周期内所有交易日的情绪因子sm(i,n)进行算术平均,形成衡量企业i在第t年投资者情绪水平的综合指标sent(i,t),有效捕捉市场参与者的中长期情感特征。
该指标体系通过整合网络文本大数据与机器学习技术,为量化分析投资者心理偏差对资本市场的影响提供可操作的测量工具。
投资者情绪是金融市场中反映投资者心理预期和群体情感倾向的综合指标。投资者情绪通过市场交易行为(如交易量、股价波动)和舆论(如网络讨论热度)反映对特定企业或行业的集体乐观或悲观预期。高涨情绪往往预示市场信心充足,可能吸引资本流入;低迷情绪则加剧市场避险倾向,抑制投资活力。行为金融学认为,非理性情绪会引导资本流向热点领域。高涨情绪可能引发投资者“跟风”行为,促使管理层迎合市场偏好调整资源配置(如增加绿色研发投入),加速政策效果传导。反之,情绪低落时,企业即使获得政策支持也可能面临融资效率折扣。综上,投资者情绪既是市场心理的晴雨表,也是衔接宏观政策与微观企业行为的关键纽带,对优化资本配置、强化政策效能具有现实意义。本团队参考任晓松、孙莎、马茜(2024)的文章,按照如下步骤得出投资者情绪:

数据介绍
数据名称:上市公司-投资者情绪数据
数据范围:中国A股上市公司
时间范围:2007-2024年
数据来源:财经网络社区(股票主题贴吧及行业论坛)
数据用途:该数据可用于研究投资者情绪对股票收益、企业投资决策、市场波动、资产定价等方面的影响,支持行为金融学、市场微观结构等领域的实证研究。
数据指标
股票代码:上市公司股票代码
年份:统计年份
s_in:日度情绪因子,基于当日乐观帖子数与悲观帖子数计算
sent_(i,t):年度投资者情绪指标,为该企业当年所有交易日情绪因子的算术平均值
参考文献
[1] 任晓松, 孙莎, 马茜. 投资者情绪指标构建方法研究[J]. 2024.
投资者情绪(2007-2024).zip
(913.85 KB, 需要: RMB 29 元)


雷达卡



京公网安备 11010802022788号







