专利被引用次数是指一件专利被后来申请专利的申请人或审查员所引用,表明该项专利对后来的专利具有启示作用。
引用其他专利次数是指一件专利在申请时,申请人或审查员引用以前专利的数量,表明该项专利对以前专利的借鉴水平。
本数据是本人根据现有的中国工业企业原始数据,做了数据清理,只保留制造业企业样本,并删除了开业年份、行业门类、员工数、资产总额以及销售额小于等于0或者缺失的企业样本,以及员工数少于8人,销售产值小于500万且企业年龄大于100的企业样本。然后根据CnOpenData平台公布的专利引用数据库,匹配得到发明、实用新型、外观设计三个类别的授权专利的引用和被引用情况,将未匹配的企业的指标都赋值为0。数据年份是2001、2002、2003、2004、2005、2006、2007、2008、2009、2010、2011、2012、2013、2014(1998、1999、2000自己论文没用到,就没处理了)。指标主要是企业名称、年份、发明授权_专利被引用次数、发明授权_引用其他专利次数、实用新型_专利被引用次数、实用新型_引用其他专利次数、外观设计_专利被引用次数、外观设计_引用其他专利次数(见附图)。
本人做了清理后,共得到3575884个样本。目前公布的2001-2014年的中国工业企业原始数据大概是423多万,本文的样本量涵盖了近85%,覆盖的样本都是剔除异常后的正常样本,可以直接用来做实证分析。
大家下载下去,可以直接根据企业名称与相应的数据匹配,进行后续的研究
自己也是近期写论文用到,花了较长时间整理出来的,这个数据还是面板的形式,没有乱码和格式错乱,直接用stata16打开就能使用(建议用stata16打开,样本量太大,低版本stata未必能打开)


雷达卡






京公网安备 11010802022788号







