数据简介:从2010-2023年上市公司年报文本数据出发,提取出上市公司年报中的管理层分析与讨论(MD&A)部分;接着,本文对相关部分的文本内容进行分词处理,并根据理论分析构建了与“新质生产力”相关的关键词词典,并基于这一词典,根据语义统计出公司年报管理层分析与讨论(MD&A)部分中的新质生产力的词频数、句频数,并以此构建新质生产力指标评价体系。其中,新质生产力句频,指包含新质生产力关键词的句子在公司年报管理层分析与讨论(MD&A)部分中出现的频数;新质生产力词频,指新质生产力关键词在公司年报管理层分析与讨论(MD&A)部分中出现的频数。由于政策试点企业的年报规模可能因为政策支持加强、产业导向性提高而存在字数规模上的提升,这一提升也可能干扰文章的识别结果,故本文统计了上市公司每年年报中管理层分析与讨论(MD&A)部分的总词数和总句数,用新质生产力词频或句频分别除以管理层分析讨论的总词数或总句数,以此对新质生产力词频与句频进行标准化,构建出标准化句频和标准化词频,以此作为新质生产力的补充测度。新质生产力包含新劳动力、新劳动资料、新劳动对象等诸多要素(任保平,2024),依靠要素及其组合的不断优化、耦合关联和相互作用实现生产力的跨越式发展。因此,本文围绕新劳动力、新劳动资料、新劳动对象三个核心要素构建新质生产力指标。狭义上,新质生产力既包括“劳动关系、以人为本、劳动合同、就业、社会保障、社保、员工福利、合法权益、基本权利、人才”等反映劳动力特征、劳动力就业、劳动力保护的新劳动力指标,又包括“创新驱动、技术革新、科技创新、重大突破”等在劳动过程中借以改变劳动对象的新劳动资料特征,也涵盖“
人工智能、新能源、前沿技术、尖端技术”等新劳动对象及其实现结果。广义上,“高效率、高性能、高效能、新经济、高产出”等词频反映了新劳动资料和新质劳动对象对产业升级和企业竞争力提升的实质性作用,这些新质生产力的发展成果也应涵盖入新质生产力度量指标中。
数据来源:上市公司年报
时间跨度:2010-2023年
区域跨度:上市公司
数据形式:Excel形式
包含指标:
| 证券代码 | 年份 | total_sentence_count | key_sentence_count | total_word_count | key_word_count | 劳动关系 | 以人为本 | 劳动合同 | 就业 | 社会保障 | 社保 | 员工福利 | 合法权益 | 基本权利 | 人才 | 前沿技术 | 创新驱动 | 技术革新 | 科技创新 | 重大突破 | 人工智能 | 新能源 | 前沿技术.1 | 尖端技术 |
样例数据:广义:
狭义:
参考文献:[1]陈晓宇,王正位,陈娟.制造业转型升级与新质生产力发展——来自企业“管理层分析与讨论”文本的证据[J/OL].产业经济评论.
下载链接:
新质生产力_词频统计.xlsx
(15.11 MB, 需要: RMB 9 元)