时间:2005-2024年
数据量:53104条
范围:沪深A股上市公司
包含剔除金融stpt、未剔除版本
包含原始数据、处理代码(stata)、最终结果
指标构建:基于上市公司年报文本进行文本分析和词频统计,将管理者短视主义关键词在年报 MDA 中的词频占比*100作为衡量管理者短视主义的代理指标。首先整理上市公司年报,并通过Python 的 Java PDFbox 库提取所有文本内容,并进一步筛选出 MDA 部分,以此作为后续特征词筛选的数据基础。搜集文本后,使用Python 中的jieba 分词将 MDA 部分进行分词处理,生成MDA 整体词频,最后提取管理者短视主必关键词在年报-MIDA中的词频,计算管理者短视主义关键词在年报MDA 中的词频占比*100即结果。
管理者短视关键词如下:严峻考验、之时、之际、关头、前夕、即刻、压力、双重压力、困境、在即、天内、契机、尽快、年内、恰逢、数天、数月、日内、最晚、最迟、来临之际、正逢、立刻、考验、适逢、通胀压力、遇止、随即、难度、马上。
参考文献:(词频参考)管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习_胡楠


雷达卡






京公网安备 11010802022788号







