楼主: mingdashike22
578 15

[量化金融] 杂交玉米的粮食生产率趋势:统计分析 [推广有奖]

11
何人来此 在职认证  发表于 2022-6-23 16:27:32
继这项工作之后,我们还研究了有关单个杂交玉米品种的微观观点,以确定引文变量是否与特定种子品种的表现比相关(类似于Moser等人提到的发明步骤),通过一项基于1986年至2015年间授予的70项杂交玉米专利样本的研究。3、数据3.1专利数据库我们建立了一个数据库,其中包含美国专利与商标局(USPTO)子类800/320.1的所有专利,该子类对应于杂交玉米(也称为玉米),从1985年1月1日开始授予专利,即公司开始为杂交玉米种子授予专利的那一年,到5月26日,2015年(已停止在Patentsview数据库中报告USPC)。该数据库包含2935项专利,报告了每项专利、专利号、自动提取的杂交品种名称、受让人名称(专利公司或品牌)、授予年份以及美国转发引用和索赔的数量。这些数据是通过Patentsview工具从美国专利商标局网站收集的,该工具提供了大约40年来美国专利活动的数据,包括每周更新。我们首先使用基于Patentsview请求说明的特定查询下载一个html文件,该文件包含我们需要的所有信息(专利号、标题、公司、引文……)在html标记中。

12
kedemingshi 在职认证  发表于 2022-6-23 16:27:35
随后,pandas(一个Python数据分析库)被用来提取html文件中包含的信息,并将其保存到Anteir的作品中(尚未出版),并于2016年7月在蒙特利尔国际空间站会议上发表,被称为“Triulzi和Magee(2016),通过挖掘专利数据预测技术性能”有关更多信息,请联系Giorgio Triulzi(gtriulzi@mit.edu).Moser等人将“发明性步骤”一词用于提高单一专利杂交玉米种子的产量。我们将看到,对于杂交玉米来说,这并不容易衡量,但目前还没有其他领域可以做出合理的尝试。excel文件。最后,我们使用python代码读取excel文件,清理数据(例如,通过删除表值中无用的字符串值),从日期格式中提取重要信息,如授予年份和申请年份,然后将最终输出保存到包含每个专利、编号、授予和申请年份、品牌、标题、,专利收到和作出的引文数量,最重要的是受专利保护的品种名称。为了获得品种的名称,我们首先分析了数据的结构,并注意到在大多数情况下,品种的名称包含在标题中,但在深入研究后,碰巧有50多种不同的结构用于标题。我们报告了所有这些可能的标题语法,并应用代码仅从标题中提取这些可能语法的变体名称,然后检查输出,并针对某些特定情况进行一些手动更正(有关更多详细信息,请参阅代码)。附录中提供了所用脚本的摘录。图3显示了处理前初始原始数据的提取,以及作为代码输出的最终清理数据库。

13
可人4 在职认证  发表于 2022-6-23 16:27:40
图3:左侧和右侧最终数据库中的初始原始数据摘录杂交玉米专利文件包含与专利品种相关的信息,特别是专利品种的产量、水分和其他特征。该信息在专利内的表格中报告,并与其他杂交品种值进行比较,一般为3或更多。杂交种的产量(以蒲式耳/英亩为单位)取决于田间试验,这意味着专利品种的产量取决于比较品种和试验条件。表3举例说明了如何报告专利文件的测试,其中专利品种已针对三种不同的品种进行了测试。表示测试中专利品种的价值 和 比较值,对照品种C中的试验数. 在下面的示例中,A、B和C是针对专利种子在3次不同测试中测试的不同品种。专利文件中报告的值可以参考产量、水分或其他变量。请注意,如果X的产量高于Y,而水分较低,则认为品种X在产量方面优于品种Y。我们注意到,大多数专利品种的产量都比对照品种好,但水分不一定较低。杂交\\试验1试验2试验3专利品种对照品种表2:专利文件中报告的试验值说明我们通过手动报告谷歌专利数据库中专利PDF文件中的产量和水分值,构建了杂交玉米专利数据的excel文件。

14
何人来此 在职认证  发表于 2022-6-23 16:27:43
该数据库包含从1985年(杂交玉米首次获得专利的年份)到2014年提交的70项杂交品种(非自交系)专利样本,包括1995年之前提交的所有杂交玉米专利,以及2010年之前每年至少提交的两项专利。通过使用该数据库,我们计算了几个变量,用于分析与引文的相关性,并拟合杂交玉米的表现趋势。公式如下所述,其中N是在一份专利文件中进行的试验次数,即比较次数,每次比较对应于给定专利的不同对照品种  和 分别为试验中专利品种和对照品种的产量.        -   所有试验中专利品种的平均产量     -  专利品种的最佳产量  m    -  与对照品种相比,专利种子的平均相对表现(产量)    -   给定年份的最高产量 在当年申请的所有专利品种中,这等于当年申请的所有品种的最大产量B值。 这些数值用于比较单个种子在专利文件中报告的平均产量值与同一品种在不同州测试时获得的平均产量。 将计算1985年至2014年(专利申请年)之间的所有年份,以拟合性能趋势并获得杂交玉米领域的改善率,因为它是指给定年份专利中报告的最佳值。

15
大多数88 在职认证  发表于 2022-6-23 16:27:46
下面的图5显示了excel文件的快照,以说明如何在excel文件中报告专利品种数据,以及不同测试的平均值,以获得每个专利种子的平均产量值。左侧的表格显示了专利文件数据的结构(不同对比品种的平均值),右侧的表格显示了伊利诺伊州实地测试数据库的结构(其中平均值和标准偏差是在不同地区获得的),链接www.google。com/patents并搜索美国专利号图4:excel文件快照,其中包含来自专利和田间试验的专利种子产量。在进一步研究之前,我们需要澄清自交系和杂交品种之间的差异,因为USPTO子类800/320.1(玉米)中约50%的专利实际上是自交系,而不是纯杂交系。自花授粉是指花粉粒从花药花沉积到同一植物的柱头上,在异花授粉中,花粉粒转移到另一朵花上。自交系是通过同一植株经过几代自花授粉获得的。由于缺乏遗传多样性,它们失去了活力,在每一代都变得更小更均匀,但可以为以后的杂交提供有趣的输入。事实上,杂交品种是两个不同自交系(非自花授粉)异花授粉的结果。由于两种不同基因的混合,杂交种的植株比双亲更大,活力更强。大多数杂种都是单交杂种,但也有双交杂种,它们是由两个单交杂种(四个亲本)和三个亲本组成的三元杂交杂种杂交而成的【40】。

16
何人来此 在职认证  发表于 2022-6-23 16:27:50
图5:自交系和杂交系之间的差异我们知道这两类品种之间的差异,需要注意的是,玉米和玉米是同义词,代表着同一事物。在下文中,当我们提到“杂交玉米专利”时,我们仅指标题中包含“杂交玉米”或“杂交玉米”或“玉米品种”或“玉米品种”的专利,当我们使用术语“自交系专利”时,我们指的是专利标题中包含“自交系”或“系”的专利数据集。3.2州实地测试数据授予土地的大学是美国与一些地区(一般为州)相关的机构,从莫里尔法案中受益。它们最初是为了提供农业科学和工程领域的高等教育,以迎接工业革命:这一体系已经演变,其中大多数已成为公立州立大学。许多这样的大学每年都会发布在其领土上出售的所有杂交玉米品种的田间试验报告。这些田间试验是本研究的一个重要数据源,因为我们的主要目的是量化杂交玉米的生产率提高率,这些数据包含给定状态下任何田间试验的所有品种的蒲式耳/英亩产量。我们还将使用专利文件中报告的数据,因为它们是该领域创新的重要指标,也是微观研究调查的主要输入数据。然而,该州的实地试验涉及更多的数据,因此仍然至关重要。各州的数据也有局限性:这些测试的年覆盖率因州而异,并非所有测试都可以访问或下载。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-20 23:05