楼主: dengdengbin
3 0

[经管数据集] 【面板数据】上市公司投资者情绪数据(2007-2024年) [推广有奖]

  • 0关注
  • 1粉丝

已卖:234份资源

博士生

56%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
4.3016
学术水平
4 点
热心指数
0 点
信用等级
0 点
经验
2593 点
帖子
117
精华
0
在线时间
181 小时
注册时间
2024-1-21
最后登录
2026-1-7

楼主
dengdengbin 在职认证  发表于 2026-1-26 21:59:46 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据简介:根据任晓松、孙莎、马茜(2024)提出的方法体系,投资者情绪指标的构建可遵循以下系统化流程:

步骤一数据获取:定向采集2007至2024年间财经网络社区(包括股票主题贴吧及行业论坛)发布的全部股票相关帖子,提取发帖人标识、发布时间、标题文本、阅读量等结构化信息。

步骤二文本预处理:对采集的原始文本实施系列净化操作:首先过滤无效及重复内容,随后采用jieba分词工具进行中文分词处理,剔除通用及领域特定停用词,最终通过TF-IDF算法将文本数据转换为机器可识别的数值向量。

步骤三情感分类与日度情绪计算:采用朴素贝叶斯分类模型将帖子划分为乐观、中性、悲观三类情感倾向。针对上市企业i,依据第n日乐观帖子数(posi,n​)与悲观帖子数(negi,n​)构建情绪因子:

smi,n​​=ln(1+negi,n​1+posi,n​​)

该公式通过加1平滑处理保障数值稳定性,对数变换实现数据分布规范化。

步骤四年度情绪指标构建:以自然年为观测周期,对周期内所有交易日的情绪因子smi,n​​进行算术平均,形成衡量企业i在第t年投资者情绪水平的综合指标senti,t​,有效捕捉市场参与者的中长期情感特征。

该指标体系通过整合网络文本大数据与机器学习技术,为量化分析投资者心理偏差对资本市场的影响提供可操作的测量工具。


数据来源:2007至2024年间财经网络社区(包括股票主题贴吧及行业论坛)

时间范围:2007-2024年

包含指标:股票代码、年份、 s_in、sent_(i,t)

样例数据:
图1.png 图2.png

下载链接: 【面板数据】上市公司投资者情绪数据(2007-2024年) (76 Bytes, 需要: RMB 15 元)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:投资者情绪 面板数据 上市公司 上市公 投资者

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-30 06:04