【方法概述】
采用jieba分词对对上市公司年报进行文本分析,提取上市公司年报中人工智能关键词数量加1的自然对数作为企业人工智能指标。此外,还基于上市公司年报管理层讨论与分析(MD&A)部分构建企业人工智能的替代指标:
人工智能词典包含共计73个中文词+2个英文同义词,附件主要内容包括以下4个:
①年报人工智能关键词词频
②上市公司年报中人工智能关键词数量加1取自然对数
③年报MD&A部分人工智能关键词词频
④上市公司年报MD&A部分中人工智能关键词数量加1取自然对数
人工智能词典详情(选取关键词)如下图所示:

【理论基础】
①参考陈和斯里尼瓦桑(2020)提供的人工智能相关词语的中文翻译版、平安证券发布的《科创板系列——AI产业链全景图》、中商产业研究院编制的《2019年中国人工智能行业市场前景研究报告》、深圳前瞻产业研究院发布的《2019年人工智能行业现状与发展趋势报告》等业界研究报告以及世界知识产权组织(World Intellectual Property Organization,WIPO)提供的人工智能词表,选取“人工智能”“机器学习”“物联网”“云计算”等 52 个词语作为种子词(Seed Words)
②参考李等(2021),使用Word2vec(米科洛夫等,2013)技术,采用 Skip-gram 模型,将年报和专利文本材料中的词语作为语料进行训练。根据种子词与输出词语之间的余弦相似度,针对每个种子词筛选出10个与该种子词语义程度最相近的词语。
③将重复词语、与人工智能不相关的词语以及词频过低的词语剔除,最终获得上图词典中的73个词语。
【参考文献】
[1]姚加权,张锟澎,郭李鹏,等.人工智能如何提升企业生产效率?——基于劳动力技能结构调整的视角[J].管理世界,2024,40(02):101-116+133+117-122.
[2]吴非,胡慧芷,林慧妍,等.企业数字化转型与资本市场表现——来自股票流动性的经验证据[J].管理世界,2021,37(07):130-144+10.
上市公司人工智能词频数据2000-2024年.zip
(28.49 MB, 需要: RMB 32 元)


雷达卡



京公网安备 11010802022788号







