企业数字化转型-MD&A词频统计数据(2001-2024年)
一、数据介绍
数据名称:企业数字化转型-MD&A报告词频、文本统计
数据范围:5706家上市公司
数据年份:2001-2024年
样本数量:65483条,345个变量
数据来源:上市公司“管理层讨论与分析”文本
数据说明:内含数字化转型314个词频、各维度水平、文本统计面板
二、整理说明
➤爬取2001-2024年上市公司年报
➤将MD&A报告文本整理为面板数据
➤统计年报全文的文本长度
➤统计全文中,中英文部分的文本长度
➤构建数字化术语词典,将词汇扩充到python的jieba库
➤去除停顿词,统计精确词汇数目
➤计算数字化转型词频和、各维度水平词频和
➤计算3种方式下的数字化转型水平
三、指标说明
类别 年份 股票代码
code 股票简称 行业名称
行业代码 MD&A文本总长度 MD&A中英文文本总长度
数字化转型程度-A 数字化转型程度-B 数字化转型程度-C
。。。等指标


雷达卡



京公网安备 11010802022788号







