在大数据时代,越来越多金融研究者开始关注上市公司年报、新闻媒体报道和投资者社交媒体发帖等文本中所蕴含的语调与情绪,并藉此展开相关分析。此类研究前提是构建情绪词典,它是测度和构建语调及情绪指标基础,现有研究使用的情绪词典普遍存在如下问题,例如:使用通用型语言词典而非专业金融情绪词典,这可能导致关键金融情绪词存在遗漏;使用人工判别方法构建基于小样本金融情绪词典,其可能导致情绪词判断标准不统一和样本偏差,直接使用翻译后英文金融情绪词典,这可能无法捕捉不同语言对同一种情绪不同表达习惯;使用单一类文本样本构造词典,其可能导致无法同时兼容正式金融文件(如新闻、公告、年报等)和非正式网络(如股吧、论坛等)这两大类文本所传达的相同情绪。
1、数据说明:
本数据分析两篇有代表性的金融领域中文情绪词典的构建方法及其词典数据,学者如需使用数据请引用原文。
一、姚加权,冯绪,王赞钧,纪荣嵘,张维.语调、情绪及市场影响:基于金融情绪词典,管理科学学报,2021.24(5),26-46
通过词典重组和深度学习算法构建了适用于正式文本与非正式文本的金融领域中文情绪词典,并基于词典构建了上市公司的年报语调和社交媒体情绪指标. 构建的年报语调指标和社交媒体情绪指标能有效地预测上市公司股票的收益率、成交量、波动率和非预期盈余等市场因素,并优于基于其他广泛使用情绪词典构建的指标. 此外, 年报语调指标和社交媒体情绪指标对上市公司的股价崩盘风险具有显著的预测作用. 为文本大数据在金融市场的应用提供了分析工具,也为大数据时代的金融市场预测和监管等活动提供了决策支持。
二、Bian S , Jia D , Li F ,et al.A New Chinese Financial Sentiment Dictionary for Textual Analysis in Accounting and Finance[J].Social Science Electronic Publishing [2024-03-06]. DOI:10.2139/ssrn.3446388.
使用HOWNET、DLUTSD、NTUSD三种词典作为初始词典,并搜集了在线路演纪要(online roadshow transcripts)、业绩说明电话会议纪要(earnings conference call transcripts)、IPO招股报告(lPO prspectus)及公司年报构建了基础语料库。基于算法和人工判断,使用多阶段剔除法来构建“中文金融情感词典CFSD”。
2、数据预览:
中英文会计&金融词汇情绪词典-负面词典正面词典.zip
(3 MB, 需要: RMB 29 元)


雷达卡




京公网安备 11010802022788号







