一、数据介绍
数据范围:2016-2024年
样本数量:73w+条
数据来源:上市公司年报等文本数据统计
数据维度:年度数据,面板数据
二、数据内容概述
本数据集系统性地收录了我国上市公司在数据要素开发利用方面的详细信息,涵盖2016年至2024年共9个年度的面板数据。数据集通过对上市公司年报等公开文本信息的深度挖掘与统计分析,构建了多维度的数据要素开发利用测度体系。
数据集包含以下核心指标体系:
(一)数据要素关键词识别指标
数据集收录了数据要素相关的关键词信息,包括具体的数据要素关键词内容、数据要素关键词类型分类、是否属于企业数据要素开发利用指数关键词的判定标识,以及企业数据要素开发利用指数关键词的分类编码。这些指标为识别和分类企业数据要素实践提供了基础依据。
(二)文本特征统计指标
数据集提供了详细的文本统计信息,包括关键词词频统计、关键词句频统计、关键词所在句子的字数统计。同时,数据集还包含了年报文本的整体特征,如报告总字数、报告总词频、报告总句数等宏观指标,为后续的文本分析和内容挖掘奠定基础。
(三)数据要素强度测度指标
数据集构建了三个核心的相对强度指标:数据要素关键词总词频占比(%)、数据要素关键词总句子数占比(%)、数据要素关键词所在句子字数占比(%)。这些占比指标能够有效反映企业在年报披露中对数据要素内容的重视程度和实践深度,为量化评估企业数据要素开发利用水平提供了可比较的标准化测度。
(四)数据要素内容描述
数据集还包含了数据要素主要内容的详细描述信息,为研究者深入理解企业数据要素实践的具体形式和应用场景提供了质性材料支撑。
三、数据价值与应用前景
本数据集的学术价值和应用前景体现在以下几个方面:
(一)填补研究空白
该数据集通过系统化的文本挖掘和量化处理,首次在企业层面构建了数据要素开发利用的多维测度体系。这填补了现有研究中企业数据要素实践量化分析的空白,为学术界提供了一个可观测、可对比、可追踪的企业数据要素实践数据库。
(二)支撑实证研究
数据集通过关键词特征、频次占比、文本结构占比等多维度量化指标,全面刻画了上市公司数据要素开发利用的具体实践状态。这些精细化的测度指标为研究数据要素与企业发展之间的关联性提供了坚实的实证基础,使得研究者能够从多个角度检验数据要素对企业绩效、创新能力、竞争优势等方面的影响机制。
(三)促进政策研究
基于本数据集,研究者可以深入分析我国上市公司数据要素开发利用的现状特征、行业差异、时间演变趋势等问题,为政府部门制定数据要素市场培育政策、完善数据要素治理体系提供决策参考。同时,数据集也为评估现有数据要素相关政策的实施效果提供了客观依据。
(四)指导企业实践
通过对比分析不同企业的数据要素开发利用水平,企业管理者可以识别自身在数据要素实践中的优势与不足,学习行业标杆企业的先进经验,从而优化企业数据战略,提升数据要素的开发利用效率。
(五)推动理论创新
本数据集为数据要素相关理论研究提供了丰富的经验素材。研究者可以基于该数据集开展数据要素价值创造机制、数据要素与传统生产要素的协同效应、数据要素市场化配置等前沿理论问题的探索,推动数据经济理论体系的完善与发展。
四、相关文献
[1] 蔡跃洲, 马文君. 数据要素对高质量发展影响与数据流动制约[J]. 数量经济技术经济研究, 2021, 38(03): 64-83. DOI: 10.13653/j.cnki.jqte.2021.03.002.
[2] 洪银兴, 任保平. 数字经济与实体经济深度融合的内涵和途径[J]. 中国工业经济, 2023, (02): 5-16. DOI: 10.19581/j.cnki.ciejournal.2023.02.001.
[3] 唐要家, 王钰, 唐春晖. 数字经济、市场结构与创新绩效[J]. 中国工业经济, 2022, (10): 62-80. DOI: 10.19581/j.cnki.ciejournal.2022.10.004.
上市公司数据要素开发利用情况.zip
(23.61 MB, 需要: RMB 28 元)


雷达卡



京公网安备 11010802022788号







