楼主: のgmの
373 0

[经管数据集] 【数据】上市公司创新活跃度数据(2008-2023) [推广有奖]

  • 1关注
  • 16粉丝

已卖:1631份资源
好评率:99%
商家信誉:极好

院士

15%

还不是VIP/贵宾

-

威望
1
论坛币
5091 个
通用积分
91.9956
学术水平
628 点
热心指数
633 点
信用等级
631 点
经验
17651 点
帖子
1060
精华
0
在线时间
2028 小时
注册时间
2023-8-10
最后登录
2026-4-7

初级信用勋章 初级热心勋章 20周年荣誉勋章 中级热心勋章 高级热心勋章

楼主
のgmの 发表于 2025-4-1 10:57:45 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据简介

《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》强调“坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑”;党的二十届三中全会进一步明确要求“激发全社会内生动力和创新活力”。对于企业而言,创新在企业短期利益和长期发展潜力的评估方面也同样发挥着核心作用,对其经营绩效、未来增长等均具有显著的正向影响。上市公司通常在年报中的“管理层讨论与分析”(MD&A)部分对企业的经营状况、未来发展规划等内容进行详细描述和披露,为外部投资者提供重要信息。


本数据参考谢佳松等(2025),基于上市公司年报中的MD&A部分,建立了适用于描述企业创新活动相关词语的词典,继而基于该词典构建能够较为全面反映上市企业创新活动的文本指标。参考谢佳松等(2025)的做法,筛选出36个词频高于100次的企业创新相关词汇,构成基准创新词典,如下图表所示。

第二步,对MD&A文本进行分词和预处理。利用Python爬取2008-2009年全部A股上市公司企业年报,并转换为txt文本格式,获取各个上市公司年报中的MD&A部分,使用jieba分词库对其进行中文分词。剔除数字、英文表达、中英文标点和常见停用词,删除年报文本常见但无具体含义的词语,对MD&A文本中有明显错误(如拼写错误或分词有误)词语进行人工核对和替换,尽可能避免分词错误带来的测度误差。



数据指标

股票代码

公司简称

年份

全文总词数

关键词词频数

关键词词频数的自然对数




数据展示



参考文献

谢佳松,樊嘉诚,林建浩.我国上市公司创新活动的测度——基于文本分析的方法[J].统计研究,2025,42(02):70-83.


【数据】上市公司创新活跃度(2008-2023) (76 Bytes, 需要: RMB 29 元)



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上市公司 上市公 活跃度 中华人民共和国 上市公司年报
相关内容:上市公司创新数据

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-4-23 13:55