一、指标介绍:
Inno_Disc为被解释变量,即企业创新信息披露水平,具体地,本文按照以下三个步骤测量:①确定创新相关的“种子词集”。参考胡楠等(2018),本文将种子词集确定为“技术创新”“研究”“开发”“研发”“专利”“发明”。②对年报相关语段进行文本分析。使用Word2vec神经网络相似词算法对上市公司年报进行文本分析,并在已确定的种子词集基础上进行词汇扩充,最终统计得到401个与创新信息相关的关键词集1。③构建创新文本信息披露指标。将年报中披露的创新文本信息关键词集的词频数之和占年报全文总词数的比例作为企业创新信息披露指标(Inno_Disc)。为了更加清晰地描述企业的创新信息披露水平,本文将Inno_Disc指数乘以100处理,其取值越高,表示企业创新信息披露水平越高。
二、指标区间:
上市公司描述性创新/创新信息披露数据,2001-2022年,
三、数据来源:
①a股上市公司年报,管理层讨论与分析词频统计;数据包括:年报描述性创新数据、管理层讨论与分析描述性创新数据、年报到22年,管理层讨论分析到21年
②变量定义:创新关键词词频除以总词数
四、参考文献:
[1]周泽将,汪顺,张悦.知识产权保护与企业创新信息困境[J].中国工业经济,2022,(06):136-154.DOI:10.19581/j.cnki.ciejournal.2022.06.020.
五、数据截图:
链接:点击此处 https://bukostudy.usells.com/p/hywVv6