一、数据说明:
主要参考李玉花等(2024)在《中国工业经济》的研究框架,复刻其基准回归模型。
人工智能水平测算方法借鉴姚加权等(2024)的文本分析与专利识别技术,包括年报词频对数化和专利关键词匹配
二、数据来源:
主要基于上市公司年报文本、专利数据及财务信息,结合机器学习方法生成AI词典,量化企业AI技术应用水平
三、数据范围:
包含2007-2023年A股上市公司,样本包含约3.3万条观测值
四、原始数据指标:
| 股票代码 |
| 股票简称 |
| 年份 |
| 省份 |
| 城市 |
| 区县 |
| 省份代码 |
| 城市代码 |
| 区县代码 |
| 行业代码 |
| 行业名称 |
| 企业上市年龄_年 |
| 是否ST或金融类 |
| 总资产_万元 |
| 营业收入增长率_% |
| 资产负债率_% |
| 总资产收益率_% |
| 研发投入占营业收入比例_% |
| 人工智能词频和 |
| 人工智能词频和加1取对数 |
| 企业发明专利申请量 |
| 人工智能MD&A词频和 |
| 人工智能MD&A词频和加1取对数 |
五、数据预览:
2007-2023年A股上市公司人工智能技术对企业创新的影响(原始数据+do代码+结果).zip
(8.78 MB, 需要: RMB 19 元)
原始数据:
do代码:
结果:


雷达卡




京公网安备 11010802022788号







