【顶刊核心变量】2023-2001年上市公司企业数字创新数据(数字产品、流程、业务模式创新)
含原始数据、计算代码、计算结果、参考文献
1.资料名称:2023-2001年上市公司企业数字创新数据
2.测算方式:参考《系统工程理论与实践》郑攀攀(2024)老师的做法,本文基于上市公司年报文本, 结合文本分析和机器学习方法, 测度了企业数字创新(DI) . 具体的测度步骤如下:
①确定企业年报中关于数字创新表述的种子词集. 本文紧扣相关文献对数字创新的定义[2-4,6], 从《中小企业数字化赋能专项行动方案》、《2020 年数字化转型趋势报告》等官方文件中选取种子词集[45], 包括人工智能、数据挖掘、电子商务等 45 个词组.
②基于机器学习方法扩充种子词集. 鉴于同一概念或事物的表达, 往往可以采用多个语义相似的词汇, 本文采用机器学习算法扩充关键词词集. 具体地, 使用海量财经文本训练 Word2vec 神经网络相似词算法, 取每个种子词组的前 30 个相似关键词, 去除重复词汇和部分低频词汇, 由三名专业人员根据 Fichman 等[3]提出的定义进行词汇分类筛选以及核验工作, 最终得到 99 个关键词词集, 如表 2 所示.
③测度企业数字创新. 本文对企业年报中关于数字创新的关键词进行抓取, 将数字产品创新 DI_prod、数字流程创新 DI_proc、数字商业模式创新 DI_buss 三个维度词频之和占年报全文总词数比重作为企业的整体数字创新 DI. 为了避免数据量纲过小, 对上述指标作出乘以 100 的处理;
3.资料范围:6.1万个样本,5598家企业,包括原始数据词频和最终计算结果,大家可以验证一下确保准确性!
4.参考文献
郑攀攀,庄子银.知识产权司法保护专门化与企业数字创新[J].系统工程理论与实践,2024,44(05):1501-1521.
测度企业数字创新. 本文对企业年报中关于数字创新的关键词进行抓取,将数字产品创
新、数字流程创新、数字商业模式创新,三个维度词频之和占年报全文总词数比重作为
企业的整体数字创新,为了避免数据量纲过小,对该指标作出乘以100的处理。
数字产品创新关键词:物联网、智能家居、人工智能、应用程序、软件程序、软件平台、
软件系统、智能终端、智能硬件、智能穿戴、移动医疗、移动支付、智能安防、智能服
务、智能交通、智能设备、智能手机、智能驾驶、智能汽车、生物识别、图像识
拟现实、人脸识别、人机交互、无人驾驶、机器人、语义理解、智能电视、
在线教育、智能手表、智慧社区、智能电网、操作系统、应用系统。
数字流程创新关键词:智能化、自动化、集成化、系统化、数据挖掘、机器学习、神经
网络、智能算法、智能技术、数字仿真、智能制造、区块链、供应链、信息管理、信息
系统、管理系统、技术平台、云技术、云计算、管理平台、仿真技术、系统管理、数据
管理、一体化、模块化、无人化、自动控制、信息服务、智慧化、控制系统。
数字商业模式创新关键词:数字化、电子化、网络化、信息化、云服务、云端、云平台、
大数据、数据资源、信息资源、数据平台、商业智能云战略、云应用、云架构、云建
设、云迁移、云化、平台化、服务平台、电子商务、网络营销、互联网+、海量数据、
用户画像、现代化、网络平台、三网融合、虚拟化、商业模式、网上商城、电子交易、
互联网化、运营平台。
企业数字创新=企业数字创新-数字产品创新词频+数字流程创新词频+数字商业模式
创新词频)*100/年报总词数
证券代码 证券简称 年份 stkcd year 企业数字创新 年报总词数 数字产品创新词频 数字流程创新词频 数字商业模式创新词频 行业代码 行业名称 所属省份 所属省份代码 所属城市 所属城市代码
上市公司企业数字创新词频统计2023-2001数字产品业务流程商业模式创新行业名称省份城市.zip
(38.5 MB, 需要: RMB 39 元)


雷达卡




京公网安备 11010802022788号







