--------------------------------------------------------------------------------
借鉴乔朋华等(2025)《生成式人工智能如何提升制造业企业韧性?》一文中对生成式
人工智能文本词频的做法,团队根据上市公司年报MD&A文本内容,对79个生成式人工
智能的相关词频进行统计,并计算上市公司生成式人工智能水平。数据包括精确词汇、
扩展词汇两种统计方式。
二、MD&A文本筛选说明
--------------------------------------------------------------------------------
不同年份的MD&A文本来源有所差异:
年份区间 文本来源
─────────────────────────────────────────────────────
2014年及以前 董事会报告
2015年 管理层讨论与分析
2016-2020年 经营情况讨论与分析
2021-2024年 管理层讨论与分析
三、数据概览
--------------------------------------------------------------------------------
数据名称:生成式人工智能水平-MD&A报告统计
数据范围:A股上市公司
时间范围:2001-2024年
样本数量:65484条
变量数量:93个
数据来源:管理层讨论与分析(MD&A)文本
数据格式:Excel版、Stata版
四、数据指标
--------------------------------------------------------------------------------
【基本信息】
· 类别
· 年份
· 股票代码
· code
· 股票简称
· 行业名称
· 行业代码
【文本信息】
· MD&A文本-文本总长度
· MD&A文本仅中英文-文本总长度
【生成式人工智能水平】
· 生成式人工智能水平
· 生成式人工智能词频总数
【三层分类汇总】
· 概念基础层
· 主要技术层
· 模型生态层
五、生成式人工智能关键词词表(79个)
--------------------------------------------------------------------------------
【概念基础层】
生成式人工智能、Generative AI、生成式AI、Large model、AIGC、预训练模型、
Pretrained Model、大语言模型、人工智能基础模型、LLM、自然语言处理、NLP、
知识图谱
【主要技术层】
┌─ 基础架构 ─────────────────────────────────────────────
│ Transformer架构、TensorFlow、pytorch、Keras、Caffe、MXNet、
│ PaddlePaddle、胶囊网络
│
├─ 生成模型 ─────────────────────────────────────────────
│ 生成对抗网络、扩散模型、Diffusion Models、GAN、VAEs、变分自编码器、
│ 自回归模型、Autoregressive、流模型、Flow-based、多模态生成架构
│
└─ 深度学习框架 ─────────────────────────────────────────
Torch、Horovod、Caffe2、DGL
【模型生态层】
┌─ 国际大模型 ───────────────────────────────────────────
│ DALL-E、Bert、GPT、ChatGPT、XLM、ERINE、Vit、Lenet、AlexNet、
│ ResNet、Mobilenet、Catalyst、TFX、EfficientNet、transformers、
│ Luminous、DETR、GRU、Bloom、CTRL、GLM、LSTM、CPM、Pythia、
│ LLaMA、T5、CPT、OPT、MPT、OpenFlamingo、mPLUG-Owl、KOSMOS-2、
│ ImageBind
│
└─ 国产大模型 ───────────────────────────────────────────
讯飞星火大模型、通义千问、文心一言、盘古大模型、混元大模型、百川大模型
六、相关数据
--------------------------------------------------------------------------------
· 生成式人工智能词频数据
· 人工智能词频数据
· 人工智能招聘数据
· 管理层讨论与分析文本
七、文件清单
--------------------------------------------------------------------------------
生成式人工智能水平-MD&A报告统计(2001-2024年)/
├── 生成式人工智能水平-MD&A报告统计(2001-2024年).xlsx # Excel版
└── 生成式人工智能水平-MD&A报告统计(2001-2024年).dta # Stata版
生成式人工智能水平MD&A词频统计-Excel版

生成式人工智能水平MD&A词频统计-Stata版

八、使用说明
--------------------------------------------------------------------------------
1. 数据基于MD&A文本进行词频统计,反映企业对生成式人工智能的关注与应用程度
2. 词频按三层分类(概念基础层、主要技术层、模型生态层)进行汇总
3. 可根据研究需要选择精确词汇或扩展词汇的统计结果
4. 不同年份MD&A文本来源有差异,跨年比较时需注意口径一致性
5. 数据提供Excel和Stata两种格式,便于不同软件用户使用
九、参考文献
--------------------------------------------------------------------------------
[1] 乔朋华等.生成式人工智能如何提升制造业企业韧性?[J].2025.
生成式人工智能水平-MD&A报告统计(2001-2024年).zip
(16.92 MB, 需要: RMB 34 元)


雷达卡



京公网安备 11010802022788号







