- 年份:2000-2023
- 范围:A股上市公司
- 三个版本:人工智能技术&应用(未缩尾未剔除)、人工智能技术&应用(已缩尾未剔除)、人工智能技术&应用(已缩尾已剔除金融STPT)
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
- 行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
- 代码格式:do文件(Stata 14/15/16/17/18)
计算说明:
首先,使用Python软件编写代码,搜集上市公司年报,并将年报格式转换为 txt 文本格式。借鉴研究内容,将人工智能分为人工智能技术和人工智能应用两大类,前者侧重于人工智能软硬件基础设施及技术,后者更关注人工智能场景应用。根据研究选取人工智能技术和人工智能应用相关的关键词,利用Python软件和人工处理,分别建立关键词词库。最后借助Python软件的jieba分词功能,从上市公司年报中提取关键词,按照人工智能技术和人工智能应用分别计算关键词出现的次数并加总。
人工智能技术关键词:大数据、云计算、机器学习、深度学习、语义搜索、生物识别技术、身份验证、自然语言处理物联网、数字技术、自动控制会人工智能应用关键词:无人驾驶、无人零售、人机交互、智能机器人、智能穿戴、智能医疗、智能家居智能交通、智能客服、智能投顾、智能营销、智能控制、智能物流、智能制造、智能仓储、智能网联、智能生产、智能管理
私
处理软件:原始数据为使用Python 对上市公司年报进行文本分析后获得jieba分词,停用词表使用哈工大停用词表),后续使用Stata 进行整理,最终形成面板数据形式
参考文献
- 何勤,李鑫悦.人工智能对企业收入分配的非线性影响——基于2007—2022年上市公司数据的检验[J].人口与经济,2024,(03):111-128.
代码:
数据量:
描述性统计:
结果数据
【更新至2023】上市公司人工智能技术&应用2023-2000年报词频Stata Dta+Excel
(76 Bytes, 需要: RMB 36 元)


雷达卡




京公网安备 11010802022788号







