楼主: 可人4
1311 55

[量化金融] 科学素质与发明价值 [推广有奖]

31
mingdashike22 在职认证  发表于 2022-6-14 07:11:58
另一方面,JIF的优点是在发布出版物时就已预先确定,因此它不必担心截短和与专利价值测量的机械相关性。SNPL参考文献的专利级聚合在我们的样本中,对于具有SNPL的专利,平均每个专利有7.4个SNPL参考文献,64.2%的比例相当可观,涉及多个不同的科学出版物。在我们的主要分析中,我们将SNPL科学质量定义为专利中SNPL参考文献中所有出版物的最高科学质量。这是基于科学转载引文的分布高度倾斜的概念。因此,引用率最高的出版物或JIF最高的期刊的科学影响可能比所有出版物的平均水平更能说明SNPL的整体科学质量。对于鲁棒性,我们还估计了其他聚合操作符。第S-2.2节对此进行了进一步讨论。我们采用一致的标准在专利层面上聚合有关存在自引用的信息:如果SNPL引用中科学质量最高的科学出版物是自引用,我们将其视为具有自引用。我们在表S-T6中使用JIF作为感兴趣的变量,以显示我们的结果对替代科学质量度量的稳健性。表S-T7显示了相应的结果。S-2.3专利价值的衡量专利引用的主要因变量是专利价值。在我们的主要规范中,我们用专利收到的转发引用数来代理专利价值。

32
mingdashike22 在职认证  发表于 2022-6-14 07:12:01
引用次数是一个公认的、或许是使用最广泛的专利价值衡量指标,它与专利技术和经济价值的其他指标高度相关(Harhoff等人,2003年;Fischer和Leidinger,2014年;Moser等人,2018年)。专利引用与科学文献中的引用有很大不同。科学引文是对科学家以往贡献对其自身工作的相关性的认可。相比之下,专利引用,尤其是对其他专利的引用,在评估其新颖性和可专利性的范围内,履行记录专利与现有现有技术的技术相关性的法律功能(Michel和Bettels,2001;Roach和Cohen,2013)。由于不同的法律要求,EPO和USPTO的引文有很大不同。EPO专利往往引用对记录发明的新颖性(或缺乏新颖性)和可专利性至关重要的专利;尤其是申请人,无需提供任何引文。美国专利商标局的申请人预计将报告所有可能相关专利的最广泛引用列表,审查员将补充该列表。因此,我们提供分析,分别统计EPO和USPTO引文。在我们的主要规范中,我们使用USPTO引文。我们构建了自第一个日期起5年内美国专利商标局(USPTO)对专利的引用计数。在稳健性分析中,我们使用了自第一个日期起5年内EPO的引文计数。对于EPO引文测量,只考虑考官提供的引文。专利范围作为专利价值的替代指标,我们采用了一种衡量专利范围的方法。专利权的价值与其对特定技术的保护范围成比例。保护范围越窄,其价值越低。

33
mingdashike22 在职认证  发表于 2022-6-14 07:12:04
对于高度特殊和狭义的专利保护,专利权利要求的文本往往较长。换言之,对所要求发明的更长描述与更具体的特征相关,这些特征实际上是专利保护的对象(Kuhnand Thompson,2019)。我们的度量定义为专利中独立权利要求中字数的对数。事实上,EPO专利通常没有初始参考文献,而且,如果存在,申请人引入参考文献可以说比其他司法管辖区更具战略性。选择科学和专利引用数量的时间窗口主要是出于务实考虑:我们希望确保足够的时间,以便引用数量实际反映我们感兴趣的基础结构,但我们希望限制截断。科学出版物和专利所考虑的窗口之间的差异也是因为专利申请不会在发布后立即发布,因此通常在第一年内很少被引用,而科学出版物往往在发布后立即被评判。表S-T5和S-T6显示了相应的结果。主要出版物中提供了描述性统计数据。货币价值的衡量标准专利引用和专利申请长度需要理解为仅仅是对专利经济价值的间接衡量标准。此外,引用次数有时也被认为是对专利的技术和社会价值的捕获(Trajtenberg,1990),这可能不同于专利所有者的私人价值。获取专利货币私人价值的直接指标是一项具有挑战性的任务。关于专利价值这一维度的数据覆盖面有限。为了补充这方面的专利价值指标,我们采用了两种数据来源。

34
何人来此 在职认证  发表于 2022-6-14 07:12:07
首先,我们使用Kogan等人(2017)提供的数据,该数据基于授予专利的估计股票市场回报,作为专利授予私人价值的代理。Kogan值仅适用于拥有美国专利成员的专利家族,其中至少有一名申请人是公开上市的美国公司。这些数据仅涵盖1029987个专利族,其中230389个包含SNPL参考文献。其次,我们使用研究项目PatVal(Giuri et al.,2007)中基于调查的专利价值评估。这是11061个专利家族的子样本,其中至少有一个EPpatent成员,其中2579个拥有SNPL参考,第一年主要在2003-2005年。主要出版物中提供了描述性统计数据。S-3回归分析S-3.1回归模型将科学出版物选择为SNPL参考在第一组分析中,我们考虑了科学出版物在SNPL参考中出现的概率和频率,作为其科学质量的函数。回归采用以下形式:yi=βci tciti+XftβftSF fi* T fi+εi(S-3.1)因变量和相关预测值:oyi:因变量是对SNPL参考文献中出现的科学出版物的概率(或频率)的度量。该变量分别是二进制或count变量。计数变量使用偏移量1进行日志转换。给定大型数据集,S-T5和S-T6显示了相应的结果。Kogan等人(2017年)自发表以来,专利价值计量一直在广泛使用,但在我们的背景下,它们存在着重大缺陷。这项技术的大部分私人价值已经纳入了股价,因为之前的专利出版物和其他专利系统的授权对投资者来说都是有益的。

35
mingdashike22 在职认证  发表于 2022-6-14 07:12:10
该价值仅体现了美国专利体系中授予的专利的附加价值。专利揭示的与公司技术能力相关的任何信息都不会纳入该衡量标准。另一方面,Giuri et al.(2007)的衡量标准基于一项调查,但确切的措辞更准确地衡量了私人专利价值的概念:“假设在申请这项专利的那天,申请人和你拥有今天关于这项专利和相关专利价值的所有信息。如果申请人的潜在竞争对手有兴趣购买整套专利(专利系列包括由此产生的所有国家专利),申请人应该要求的最低价格(欧元)是多少?”。而对于大量的有限元群,非线性(count)模型则没有考虑。我们采用了这些变量的几种变体花旗:主要自变量是衡量科学质量的指标。我们在出版水平上衡量科学性,即从出版开始的三年内收到的引文数量(见S-2.2节)。FEs:oSF* T fi:这些FEs对应于科学领域和出版年份的组合。这些FEs可以灵活地控制不同科学领域和每个科学领域内随时间变化的科学质量和SNPLfrequency的机械差异。科学网总共提供了252个科学领域代码。科学质量和专利价值:剩余变量自然,SNPL参考文献的使用以及引用的SNPL的质量在技术领域以及随着时间的推移有很大的不同。在下面的回归模型中,FE控制变量明确考虑了这一点。

36
能者818 在职认证  发表于 2022-6-14 07:12:13
在所有与专利和科学质量相关的图表中,我们都采用了二元化,使图形显示与回归输出一致。为此,我们对全套技术领域×第一年FEs的SNPL科学质量变量和专利价值变量进行回归。形式模型为yi=PftβftF fi* Tti+εi。这是在有无SNPL参考的完整专利样本中完成的。然后,我们计算残余变化为^εi≡ 易-^yi=yi-Pft^βftF fi* Tti,其中^ε、^y和^β是估计值。实际上,εi=yi-“yft,其中”yft是技术领域×第一年组内的平均值。因此,E[εi]=0,包括整体和每个ft组内。图中绘制的值为^εi+’y,其中‘y’是y的全样本平均值。这将使绝对水平返回到上下文预期和可解释的水平。简单地说,该策略通过减去组内的平均y来消除技术领域×第一年组内的水平效应。通过添加总体y平均值来保留总体水平。y变量被转换。之前,它是与组内平均值的偏差。之后,它偏离了总体平均值。科学质量与专利价值:回归模型在实证分析中,我们研究了专利中引用的科学出版物的存在与质量与专利价值之间的关系。回归形式如下:yi=βhasSNPLhasSNPLi+βsnplqsnlpqi+XftβftT F* Tti+XaβaAai+XnβnNni+XrβrRri+XpβpPpi+εi(S-3.2)因变量和相关预测因子:oyi:因变量是专利价值的度量。在主要规范和图表中,我们使用了美国专利商标局发布后前5年内的引用次数。

37
大多数88 在职认证  发表于 2022-6-14 07:12:16
在替代规范中,我们使用:来自EPO的引用计数;货币价值指标;以第一项独立权利要求的长度衡量的专利范围(参见第S2.3节)。所有因变量均为对数项,偏移量为1。鉴于大数据集和大量FE组,无法考虑非线性(计数)模型hasSNPLi:如果一项专利至少有一次引用科学出版物,则等于1的虚拟值。snplQi:衡量SNPL科学质量的指标。我们在科学出版水平上衡量科学质量,即从出版之日起三年内收到的引文数量。我们将SNPL科学质量定义为当存在多个SNPL参考文献时,SNPL参考文献中的最大科学质量。FEs:o财政部* Tti:这些FEs对应于技术等级和第一年的组合。这些FEs可以灵活地控制不同技术领域和每个技术领域内随时间变化的专利价值的机械差异Aai:这些是专利申请人的FEs。oNni:这些是专利上列出的不同数量的发明人的FEsRri:这些是专利引用数量的FEs。我们对每一个引用数量(最多95%)使用单独的FEs,并为所有引用数量较高的专利分配一个假人Ppi:这些是科学出版物专利引用数量的FEs。我们对每个参考文献数量使用一个单独的FE,最多对应于95%的数量,并在一个参考文献数量较高的FEs专利中聚合。

38
大多数88 在职认证  发表于 2022-6-14 07:12:19
请注意,HASSNPLIS共线,因此在使用这组FEs时会被删除。S-3.2回归结果选择SNPL参考文献中的科学出版物我们给出了第一个回归结果,即科学出版物作为其科学质量的函数出现在SNPL参考文献中的概率。在第一个主要规范表S-T3第1列和第2列中,我们考虑了所有SNPL参考。其次,在第3列和第4列中,我们只考虑自出版之年起五年内的SNPLreferences。第三,在第5列和第6列中,我们只考虑五年内的参考文献,如果它们是科学性最高的SNPL参考文献。在第四种变体第7列和第8列中,我们只考虑了在我们测试结果对替代聚合标准的稳健性时引用的SNPL参考(见表S-T7)。在涉及PatVal(EUR)值的回归中,可用观测值的数量大大减少。在这里,我们在估计扩展规范时仅包括反向专利引用的对数转换计数。第一次由申请人进行,因此每个专利申请人的科学出版物对在mostonce进行计数(每个申请人一个)。最后,在表S-T4中,我们提供了不包括学术专利以及各种类型的自参考的回归结果。图S-F3a和S-F3b也以图形方式显示了排除SNPL自参考与结果无关。总的来说,我们始终发现科学质量对将科学文章选择为SNPLreferences具有积极和显著的影响。主要回归结果:SNPL科学质量和专利价值表S-T5给出了我们核心发现的回归结果。它显示了SNPL科学质量的主要衡量指标和作为因变量的专利价值的每一个替代衡量指标的弹性估计。

39
大多数88 在职认证  发表于 2022-6-14 07:12:22
我们逐步加入了一系列要求更高的控件。所有模型都包含变量hasSNPLias,这是一种控制至少有一个SNPL参考的水平效应的控件。在第1列至第6列中,我们展示了基线规范的结果,其中我们专门控制技术领域和年份对FEs。在第7列至第12列中,我们包括了上述S-3.1节中详述的所有专利级别控制。在第13至18列中,我们添加了申请人FEs。图S-F4A进一步突出了有无SNPL引用的专利在专利引用总体分布上的显著差异。SNPL科学质量的替代测量作为这些规范的第一个变量,我们测试结果对SNPL科学质量替代测量的稳健性。在表S-T6中,我们使用基于轴颈影响系数的测量值,而非汽蚀。由于《影响因素》杂志仅从1998年起提供给我们,因此观察次数较少。总体而言,我们发现非常相似的结果。在表S-T7中,当一项专利的NPLreferences中出现多个科学出版物时,我们使用了SNPL科学质量的替代性度量,这些度量源自多个科学出版物在专利水平上的不同聚合标准。当ci是SNPL参考文献i的引用计数时,在我们的主要模型中,我们考虑最大值。或者,我们还考虑平方和的和(Pici)、平均值(nPici)和平方根(qPici)。无论采用何种聚合标准,我们都发现了类似的结果。图S-F4b以图形方式显示了结果。自参考图S-F5a显示了自参考的发生频率:所有专利家族中有5%到10%包含自参考。大多数自引用是发明家自引用(5-10%),而有效自引用的频率较低,为2-4%。

40
nandehutu2022 在职认证  发表于 2022-6-14 07:12:25
自我参照的频率随着SNPL科学质量的提高而降低(尽管不是单调的);这种趋势在高层最为明显。唯一的例外是美元价值的结果,前两个规格(第5列和第11列)的结果不稳定,但在我们最后一个也是最完整的规格中仍然是积极和显著的。在本文中,我们考虑了自我参照驱动结果的可能性。一方面,从理论的角度来看,考虑高质量的科学是否会在其所在组织的范围内或范围外带来高价值的技术,这是一个有趣的问题。另一方面,我们希望确保成果不是由同时从事科学和技术活动的高产组织和个人推动的。图S-F5b复制了论文中报告的结果,分离了不同类别的自参考。不同的自引用组的行为非常相似。表S-T8分别提供了仅由具有自参考的专利和不包括具有自参考的Gall专利组成的样本的回归估计。虽然自参考样本的幅度较大,但估计的弹性在所有规范中均为正且显著。我们可以得出这样的结论:自我参照并不能驱动整体效果。技术领域、专利申请年份和申请国我们分析了估计值的异质性,首先是跨专利技术领域的异质性。在表-T9中,我们按技术主要领域进行单独回归。与之前的文献(例如,Harhoff等人,2003年)一致,我们发现,化学中的影响尤其强烈。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 16:36