楼主: cennavi_lc
245 0

[经管数据集] 【工具变量】上市公司创新活跃度(2008-2023年) [推广有奖]

  • 0关注
  • 14粉丝

已卖:2031份资源
好评率:99%
商家信誉:优秀

教授

34%

还不是VIP/贵宾

-

威望
0
论坛币
90 个
通用积分
47.1439
学术水平
4 点
热心指数
7 点
信用等级
4 点
经验
16573 点
帖子
519
精华
0
在线时间
686 小时
注册时间
2022-7-23
最后登录
2026-2-28

楼主
cennavi_lc 在职认证  发表于 2025-3-31 13:57:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据简介

《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》强调“坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑”;党的二十届三中全会进一步明确要求“激发全社会内生动力和创新活力”。对于企业而言,创新在企业短期利益和长期发展潜力的评估方面也同样发挥着核心作用,对其经营绩效、未来增长等均具有显著的正向影响。上市公司通常在年报中的“管理层讨论与分析”(MD&A)部分对企业的经营状况、未来发展规划等内容进行详细描述和披露,为外部投资者提供重要信息。

本数据参考谢佳松等(2025),基于上市公司年报中的MD&A部分,建立了适用于描述企业创新活动相关词语的词典,继而基于该词典构建能够较为全面反映上市企业创新活动的文本指标。参考谢佳松等(2025)的做法,筛选出36个词频高于100次的企业创新相关词汇,构成基准创新词典,如下图表所示。

图1.png


第二步,对MD&A文本进行分词和预处理。利用Python爬取2008-2009年全部A股上市公司企业年报,并转换为txt文本格式,获取各个上市公司年报中的MD&A部分,使用jieba分词库对其进行中文分词。剔除数字、英文表达、中英文标点和常见停用词,删除年报文本常见但无具体含义的词语,对MD&A文本中有明显错误(如拼写错误或分词有误)词语进行人工核对和替换,尽可能避免分词错误带来的测度误差。 图2.png
时间范围:2008-2023年
数据范围:中国A股上市公司
数据格式:Excel
包含指标
股票代码公司简称年份全文总词数关键词词频数关键词词频数的自然对数研发开发创新研究升级转型改革新能源专利新型创造新材料新技术新兴高新技术知识产权研制变革新品新一代更新新工艺全新产学研新模式发明迭代革新新业态原创首创革命推陈出新科技攻关新途径独创create
样例数据 图3.png
参考文献:谢佳松,樊嘉诚,林建浩.我国上市公司创新活动的测度——基于文本分析的方法[J].统计研究,2025,42(02):70-83.
下载链接 【工具变量】上市公司创新活跃度(2008-2023年) (76 Bytes, 需要: RMB 9 元)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上市公司 工具变量 活跃度 上市公 中华人民共和国

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-1 16:49