数据名称:2001-2024年上市公司人工智能-MD&A报告73个词频、文本统计
一、数据介绍
数据名称:上市公司人工智能-MD&A报告73个词频、文本统计
数据范围:A股上市公司
数据年份:2001-2024年
样本数量:65483条,83个变量
数据来源:上市公司“管理层讨论与分析”文本
数据说明:内含人工智能73个词频、精确和扩展词汇两种方式
更新时间:2025年5月
二、整理说明
➤爬取2001-2024年上市公司年报,提取MD&A文本内容
➤将MD&A报告文本整理为面板数据
➤统计MD&A报告文本的文本长度
➤统计MD&A文本中,中英文部分的文本长度
➤构建人工智能术语词典,将词汇扩充到python的jieba库
➤去除停顿词,统计精确词汇、扩展词汇数目
➤计算两种方式下的人工智能水平
来源:上市公司MD&A报告
注:2025年5月更新,本次数据为MD&A报告统计,统计数据更新至2024年
在前文,利用上市公司年报全文,对人工智能的相关词频进行了统计。在本期附赠数据中,进一步对MD&A文本进行人工智能词频统计
参考《管理世界》中姚加权(2024)的做法,根据上市年报MD&A文本内容,对73个人工智能的相关词频进行统计,并计算上市公司-人工智能水平,包括精确词汇、扩展词汇两种方式
MD&A文本筛选:2014年及以前主要在“董事会报告”中筛选,2015年主要在“管理层讨论与分析”中筛选,2016年及往后主要从“经营情况讨论与分析”中筛选,2021-2024年主要在“管理层讨论与分析”中提取
数据名称:2001-2024年上市公司人工智能-MD&A报告73个词频、文本统计
(76 Bytes, 需要: RMB 25 元)


雷达卡


京公网安备 11010802022788号







