楼主: 可人4
1311 55

[量化金融] 科学素质与发明价值 [推广有奖]

21
何人来此 在职认证  发表于 2022-6-14 07:11:28
艾伦(1977)和布鲁克斯(1994)特别描述了这一迄今为止关于科学和技术之间关系的经典观点。科学最初被理解为两个不同且独立的领域,现在被视为直接促进新知识的应用(Stokes,2011),科学和技术可能遵循共同进化的过程(Murray,2002)。科学也被描述为设计新技术过程中使用的一种地图(Fleming和Sorenson,2004)。这一新观点承认,科学和商业技术发展领域相互重叠,它们之间的关系不一定是线性的。虽然大学主要产生知识,但他们也会申请专利并许可知识产权。企业实体大多寻求新产品和服务的商业化,但也从事与产品开发无关的基础研究和研究成果的发布。SNPL参考文献作为知识投入的衡量标准,我们使用科学出版物(SNPL)的非专利文献参考文献作为技术相关性的指标,如专利中所述,与科学出版物中所报告的科学贡献相关。许多研究建议将专利引用作为知识流动的指标(Jaffe,1986,1989)。虽然一些作者对这种方法在一般专利引用中的有效性表示担忧(Thompson和Fox Kean,2005;Alcacer和Gittelman,2006),但与其他类型的引用相比,SNPL引用始终与实际知识流相关(Roach和Cohen,2013)。

22
何人来此 在职认证  发表于 2022-6-14 07:11:31
在我们的研究背景下,没有必要将SNPLreferences解释为知识流动的直接指标:我们更广泛地假设,引用的科学家包含理解和开发技术的相关信息。SNPL匹配方法我们用于将专利与引用的科学出版物链接的数据集是DOCDB专利数据与WoS中包含的书目信息的完全匹配。匹配过程详细记录在Knaus和Palzenberger(2018)中。这里,我们简要概述一下。匹配包括目标选择、搜索和质量控制三个步骤。在目标选择步骤中,执行清理步骤以排除非科学条款或不在可用WoS数据范围内的不良贷款串。对于其余条目,使用搜索引擎在完整WoS或Scopus内容的全文索引中查找NPL全文字符串。搜索引擎将返回匹配候选人的排名列表。在质量控制阶段,将检查最重要的条件,并根据基于场地的评分来判断比赛质量。只有高质量的匹配才被视为最终数据集的有效匹配。匹配程序适用于第一组约3700万不良贷款参考。2700万(71.8%)个条目被选为潜在目标,并与WoS条目相关联。然而,在考虑到比赛质量后,并非所有这些都构成有效的比赛。amatch的质量由六个质量指标(年、卷、页、第一作者、期刊标题、文章标题)来判断。如果匹配的科学文章中的信息可以在非专利文献引用字符串中找到,则每个指标都等于1。

23
能者818 在职认证  发表于 2022-6-14 07:11:34
质量分数是指标的总和,范围从零到六。为了验证匹配质量,抽取了1000个NPL参考文献的随机子样本。如果可以使用手动搜索在WoS中找到NPL字符串,则将其视为有效目标。图S-F1绘制了精度和召回率,其中精度计算为算法提供的所有匹配中正确匹配的份额。召回是指能够成功覆盖的所有目标的份额。该图显示,当接受三个或更多高质量匹配的质量分数时,可以获得0.99的精度分数和0.96(EPO)和0.92(USPTO)的召回分数。表S-T2显示了最终达到的质量。因此,我们将样本限制为质量等于或高于三个的匹配。在作为有效目标保留的2700万份参考文献中,1300万份(47.1%)满足了这一质量要求。我们的分析单位是DOCDB专利系列,通常包括多个引用。虽然准确率和召回率都很高,但它们只参考了本可以匹配的内容——科学网的内容。显然,本数据库中并没有涵盖所有可供参考的科学出版物。我们评估了这一问题的程度,并考虑了与WoS不匹配的NPLreferences子集。我们尝试与覆盖范围更大的另一个publicationdatabase Scopus进行匹配。该练习为1996-2016年出版年份的49254个Scopus项目生成了113340个额外的SNPLlinks。

24
可人4 在职认证  发表于 2022-6-14 07:11:37
考虑到这还不到总数的2%,为简单起见,我们在分析中忽略了这些联系。我们的最终样本包含952932个DOCDB专利系列,其中至少有一个授权公告和至少一个在此处考虑的任何专利中匹配的SNPL参考。与之前的数据集相比,这是一个很好的比较,总体而言,构成了比之前现有研究中确定的更多的观察结果。Ahmadpoor和Jones(2017)在1976年至2015年间独家使用美国专利商标局的专利数据,发现759000项专利通过不良贷款参考与WoS中至少一项科学出版物直接相关。Jefferson等人(2018年)在1980年至2015年间发表了1180万份科学出版物,其中约120万份引用于690000个专利家族(110万项专利)。Marx和Fuegi(2019)将1926-2018年的美国专利与1800-2018年的科学论文联系起来,确定了140万项专利与290万篇论文之间的约1570万条关联。相比之下,我们的数据集将1985-2017年间的952932个专利系列链接到1980-2016年间的2229658篇不同的科学文章。当质量截止值为4时,准确度会进一步提高,但召回会受到更大程度的影响,因此在将精度和召回同等重视时,最好将质量截止值设置为3。表S-T2:Match qualityOf fice Precision RecallEPO 0.99 0.96USPTO 0.99 0.92WIPO 0.99 0.97注:根据Knaus和Palzenberger(2018)报告的1000个不良贷款参考的手动验证练习。Precision是正确的NPL引用匹配的份额。

25
能者818 在职认证  发表于 2022-6-14 07:11:40
召回是指,在考虑所有可能匹配的不良贷款参考时,正确匹配的份额。SNPL自我引用我们将SNPL引用到科学出版物中,其中至少有一位作者也是专利的发明人,并且其中一个SNPL引用与专利中的申请人列表重叠。我们将这些类别分别称为SNPL inventor自引用和应用程序自引用。这种类型的SNPL引用揭示了来自同一组织或同一个人或两者的专利和科学出版物之间的联系。第一次分析依赖于SNPL参考文献的完整样本。我们分别给出这些类别的结果,并在稍后阶段排除它们。我们认为SNPL发明人自我引用指的是科学出版物,其中至少有一位作者与专利上的发明人同名。我们认为SNPL申请者自己引用的是科学出版物,其中至少有一个附件与专利中的申请人列表重叠。为了将申请人与af filiations进行匹配,我们使用了一系列手动消除歧义的组织(学术机构和企业),这些组织来自多个来源:全球研究识别数据库(GRID)、ORBIS数据库和欧洲大学计分卡数据库。我们使用基于训练数据的概率匹配算法,将专利和科学出版物中的专利申请人分别合并到这些列表中。当申请人和附属机构与列表中的同一实体匹配时,我们认为他们是相同的。请注意,这两类自引用可能重叠。关于SNPL参考文献的相关文献我们简要总结了迄今为止讨论了SNPL参考文献的特征及其与专利价值的关系的文献。Hicks等人。

26
mingdashike22 在职认证  发表于 2022-6-14 07:11:43
(2000)查看1993年至1995年间发表在《科学引文索引》(SCI)期刊上的所有科学文章,其中至少有一位美国作者。他们发现,1997年美国发明专利中引用了约6600份此类出版物。出版物被引用为SNPL的可能性不仅取决于出版物的研究领域,还取决于其科学影响。Ifa出版物属于引用率最高的1%的出版物,被美国专利引用的可能性大约是随机选择的美国出版物的9倍。同样,Popp(2017)发现图S-F5a提供了相关的描述性统计数据。在绿色能源技术领域,其他文章经常引用的科学文章也更有可能被专利引用。Breschi和Catalini(2010)分析了1990年至2003年期间在三个技术领域(激光、半导体和生物技术)注册的欧洲专利(EPO)的所有专利申请,发现约44000项专利,共18000项SNPL参考文献。与半导体相比,生物技术和激光领域的SNPL参考更为频繁,这可能是因为半导体技术领域与科学之间的距离更大。Harhoff等人(2003)是最早分析此类专利价值与潜在科学贡献的科学影响之间关系的人之一。他们记录了专利价值与不良贷款参考文献数量之间的正相关关系。这种关系在化学品和制药技术领域尤为密切。其他几位作者探讨了不良贷款参考文献作为专利价值潜在决定因素的作用。Branstetter(2005)使用了1983-86年间30000项美国专利的随机样本,其中约4300项包括SNPL。

27
可人4 在职认证  发表于 2022-6-14 07:11:46
引用科学文章的专利比没有引用的专利质量要高得多(更多的主张和转发引用)。Sorenson和Fleming(2004)将1990年的约17300项专利与约16700项非专利参考文献联系起来。在这里,引用非专利文献的专利比其他专利获得更多的引用,引用速度更快。他们认为,前向引用和给定专利的科学强度之间的这种积极关系是由于知识通过学术出版物传播的结果。Gittelman和Kogut(2003)在生物技术领域明确提出“好的科学会带来有价值的知识吗?”他们建议“(……)选择有价值的科学出版物和有价值的专利的进化逻辑是不同的,因此,与其他出版物相比,有价值的出版物不太可能产生有价值的专利。“他们利用116家生物技术公司的专利和出版组合数据,获得的结果基本上证实了他们的假设。铃木(2011)认为专利发明可根据其货币或技术质量进行评估。引用科学出版物对技术价值有强烈的积极影响,但对专利的商业价值有微弱的负面影响。作者还指出,技术领域存在着相当大的异质性。Fischerand Leidinger(2014)利用2006年至2009年间Ocean Tomo拍卖的数据,将交易价格近似为可观测价值相关函数。他们只发现不良贷款参考数量的影响很弱且估计不准确。正如他们指出的那样,在Ocean Tomoauctions上交易的专利并不具有代表性,而且大多在IT和IT相关的技术领域。

28
mingdashike22 在职认证  发表于 2022-6-14 07:11:49
Zahringer等人(2017年)构建了一个年轻生命科学公司的样本,并发现更高质量的学术科学与专利引用相关。这种关系由各自公司的研究活动调节。Veugelers和Wang(2019)使用了2001年发表的所有科学杂志文章和PATSTAT的所有专利(2013b版)。他们发现,只有大约10%的文章成为SNPL。未来,小说出版物更有可能被专利引用,尤其是高达1%的小说科学出版物。他们进一步发现,获得更多科学引文的出版物也会获得更多的专利引文。Sapsalis等人(2006年)使用了155个专利族的数据,这些专利族的申请日期在1985年至1999年之间,以模拟专利引用与基础科学特征之间的关系。他们发现,NPL对科学文献的自我引用(即发明人也是被引用的科学出版物的作者)与专利的正向引用增加相关。作者认为,在这种高价值专利的情况下,“发明人掌握(并贡献)相关的科学基础(由他们自己的出版物见证),并决定将他们的隐性知识编入技术发明”(Sapsalis等人,2006年,第1640页)。在Fleming和Sorenson(2004)的观点中,本发明被解释为寻找新的和有用的技术组件配置的过程。科学作为amap,向发明家指出组件的特别有用的配置。或者,科学允许发明家避免搜索生产率较低的解决方案。然而,这些影响并不适用于所有技术。

29
可人4 在职认证  发表于 2022-6-14 07:11:52
当发明家使用高度独立的组件时,求助于科学可能没有什么帮助,但当潜在的发明问题特别困难时,应该会产生高回报。利用美国专利商标局于1990年5月和6月授予的专利总数(排除442项没有任何参考的专利后,n=16822),他们发现这些专利中只有2919项参考了科学出版物。在实证分析中,作者指出,引用科学出版物会增加专利的前向引用,弹性约为10%。虽然这里讨论的研究结果很有趣,但它们通常是从相对较小的样本中获得的,这些样本特别适合各自的研究。Ahmadpoor和Jones(2017)最近的研究是一个例外,他们分析了美国专利网络CitingDirector或间接SNPL引用。他们在此引入到科学前沿的距离,作为科学技术强度的度量。Watzinger和Schnitzer(2018)借用了这一指标,并提供了科学技术强度与专利价值之间的相关性。Mukherjeet al.(2017)强调了参考文献年龄结构的重要性。作者(单独)研究WoS数据库中的科学出版物和专利,但他们没有将不良贷款参考与WoS条目联系起来。对于出版物和专利,他们都发现了一个由年龄结构(向后引用)定义的“热点”这与出版物或专利获得的引文增加有关。S-2.2科学质量的衡量科学引用感兴趣的主要变量是专利引用出版物的科学质量。我们使用基于出版物前向引用次数的科学质量衡量标准。这是一个公认的科学质量文献计量指标。

30
mingdashike22 在职认证  发表于 2022-6-14 07:11:55
引用的使用基于这样一个概念,即他们认为科学出版物对自己的研究有影响。因此,可以假设高引用率的出版物对后续研究有更大的影响,并代表了对其科学质量的一个有意义的衡量。对于给定的出版物,我们计算出版后三年内的引用次数。这就提出了一个问题,其中一些引用可能会晚于引用专利的截止日期。在这种情况下,出版物收到的引文数量可能与专利本身无关。在我们的主要规范中,为简单起见,我们假设出版物的引用次数确实与专利引用无关。在稳健性分析中,我们验证了在排除专利发布前三年出版的专利引用时,核心结果仍然相同。期刊影响因素科学质量的另一种衡量标准是发表相关出版物的期刊的影响因素(JIF)。在任何给定年份,期刊的影响系数是该年收到的该期刊前两年发表的文章数量除以前两年该期刊发表的文章总数。我们使用《煽动期刊引文报告》提供的JIF指标。这一措施的一个缺点是,由于缺乏必要信息的完整性,数据只能在1997年之后提供。此外,JIF是对期刊质量的一种回顾性测量,忽略了同一期刊内以及一段时间内出版物质量可能存在的高差异。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 16:36