本数据基于中国A股上市公司年度报告的文本挖掘,统计年报中数智
化相关关键词(涵盖"B2B"至"语义搜索"等数十个核心词汇,覆盖
数字经济、人工智能、大数据、云计算、物联网、区块链等领域)的
出现频次,并通过对数变换构建企业数智化程度指标 LnDig,全面衡
量A股上市公司的数字化与智能化发展水平。该指标构建方法参考袁淳
等(2021)、吴非等(2021)的研究思路,已被广泛应用于企业数字
化转型与全要素生产率、创新能力、ESG表现等领域的学术研究。
【指标构建方法】
计算公式:
数智化关键词词频 = 年报中所有数智化相关关键词出现频次之和
企业数智化程度 LnDig = ln(数智化关键词词频 + 1)
关键词范围:覆盖数字经济、人工智能、大数据、云计算、物联网、
区块链、机器学习等数智化领域核心词汇,从"B2B"至"语义搜索"
共数十个关键词
【计算结果核心指标】
- 证券代码、证券简称、stkcd、year
- 企业数智化程度LnDig(核心指标,值越大数智化程度越高)
- 数智化关键词词频(原始词频汇总值)
- 行业代码、行业名称(证监会行业分类标准)
- 所属省份、所属省份代码、所属城市、所属城市代码
- 公司名称、上市日期、成立日期、注册资本、经营范围等基本信息
【输出文件版本说明】
1. 计算结果未剔除未缩尾版本
保留全样本(含金融业、ST/PT公司),未做缩尾处理
2. 计算结果已剔除金融STPT未缩尾版本
剔除金融业(行业代码J类)及ST、PT公司
3. 计算结果已剔除金融STPT已缩尾版本
在剔除基础上对LnDig及词频按前后1%缩尾处理
【原始数据文件】
1. 上市公司年报数智化关键词词频数据.dta / .xlsx
各公司年报中每个数智化关键词的出现频次原始数据
2. 上市公司基本信息数据.dta
上市公司基本注册信息(公司名称、行业、上市日期等)
3. 上市公司行业与地区信息数据.dta
上市公司逐年行业分类及省份、城市归属信息
【代码文件】
- 上市公司数智化程度数据计算代码.do / .py
Stata 与 Python 双版本计算代码,可复现全部结果
- 上市公司数智化程度数据评估代码.do / .py
数据描述性统计与质量评估代码
【参考文献】
- 企业数智化与量化预算目标信息披露行为(详见文件夹内PDF)
- 袁淳, 肖土盛, 耿春晓, 等. 数字化转型与企业分工:专业化
还是纵向一体化[J]. 中国工业经济, 2021(09)
- 吴非, 胡慧芷, 林慧妍, 等. 企业数字化转型与资本市场表现
——来自股票流动性的经验证据[J]. 管理世界, 2021(07)
【数据基本信息】
数据名称:上市公司数智化程度数据
数据范围:A股上市公司
时间范围:2000-2024年
数据来源:上市公司年度报告文本挖掘 +权威数据库
更新时间:2026年
数据质量评估报告_20260225.zip
(1.35 MB)
上市公司数智化程度数据2000-2024年含do-python代码和excel-dta格式数据.zip
(59.01 MB, 需要: RMB 32 元)


雷达卡



京公网安备 11010802022788号







