楼主: mingdashike22
724 42

[量化金融] 美国专利分类体系的长期动态 [推广有奖]

21
能者818 在职认证  发表于 2022-6-8 15:50:14
调查完整的层次结构可以增加重要的洞察力,例如通过对比分类树的“垂直”和“水平”生长,或者利用系统的不同层在搜索中扮演不同角色的事实(USPTO 2005)。其次,为了简单起见,我们将调查限制在主要(“OR”)类。多重分类确实非常有趣,因此需要进行完整的独立研究。显然,可以使用多种分类这一事实是当前USPC的一个基本特征。事实上,这是其演变的一个关键特征:如上所述,“交叉标注”在某些时期很常见,而在其他时期则不存在,最近一个新类别的例子——纳米技术——恰好是一个仅限XR的类别(即,仅用作二级分类)。这里我们选择只使用OR类,因为它允许我们以相对简单的方式显示主要模式。当然,我们的一些结果,尤其是第6节的结果,都会受到这一选择的影响,需要进一步的研究来评估我们结果的稳健性。也就是说,在专利申请中使用分类来确定最合适的审查部门(Falasco 2002b)无疑是最重要的。第三,如第3节开头所述,我们的调查仅限于美国邮政公司。我们有充分的理由在这项研究中选择USPC,其目的是给出一个长期的图景。然而,为了研究再分类模式的细节并将再分类和分类系统的变化确定为新的有用的技术变化指标,未来的研究需要在IPC或PCC中建立类似的模式。由于这些选择,我们的目标是建立一个数据库,包括1)USPCS主要类别的演变,以及2)专利从一个类别重新分类到另一个类别。

22
nandehutu2022 在职认证  发表于 2022-6-8 15:50:17
要做到这一点,我们依赖于几个来源。首先,我们最原始的数据收集工作涉及历史类数。有关我们的数据,请访问https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/ZJCDCEearly年我们的主要资料来源是Bailey(1946)和Rotkin等人(1999),再加上Reingold(1960)和《分类手册》,这是1908年至1923年间的5年。在20世纪50-60年代,我们主要使用了一个名为“关于专利的一般信息”的特定年份来源,其中包含一句话,如“专利被划分为x类”。不幸的是,从1969年开始,这句话变成了“专利被划分为310多个类别”。因此,我们切换到另一个名为“美国专利局发布的专利索引”的来源,其中包含类别列表。从1963年开始,它在一个单独的页面上列出了课程的名称和编号。1985年,我们使用了一份关于专利和商标的技术评估和预测办公室(OTAF 1985)的报告。从2001年到2013年,我们从互联网档案馆收集数据。截至2016年2月,共有440个公用设施类别(包括杂项001和“信息存储”G9B(成立于2008年)),33个设计类别,第二,为了获得重新分类数据,我们匹配了几个文件。我们从主分类文件(mcfpat1506版)中获得了截至2015年6月底授予的专利的“当前”分类。我们将其与专利授权文件(20160130版)进行了匹配获得授予年限。为了获得分类,我们必须做出一些假设。

23
nandehutu2022 在职认证  发表于 2022-6-8 15:50:20
20世纪60年代,设计被细分为“工业艺术”和“家居、个人和精细艺术”,因此我们假设设计课程的数量为2个,直到1977年,设计课程的名称和编号才出现。我们隐含地假设,在1977年之前,设计类实际上都是子类,因为1977年有39个设计类,而1976年用于设计专利的(子)类的数量超过60个。应该注意的是,根据确定的日期,当前的一些设计类别是在60年代后期创建的。另一个问题是,1976年的有机化合物类别的数量不清楚——我们假设是6个,如1977年所列。最后,由于来源相互矛盾或来源指的是不同的月份,同一年我们有时会有两个略有不同的值。https://archive.org/index.php我们可以从中发现url的演变http://www.uspto.gov/web/patents/classification/selectnumwithtitle.htm.将“001”类添加到伯爵。有日期的课程列表包含476个课程,但不包含001个,其中包括364、389和395个已经废除的课程。我们废除了被废除的阶级,对于图1和图2,weassumed 001成立于1899年。我们首先删除了303项没有主要(或)分类的专利,然后删除了1800年1月1日的92项专利。Webirth,我们使用了USPTO提供的文件“专利授权书目(首页)文本数据(1976年1月至2015年12月)”,我们还从中收集了引文数据。4类数和堆数定律的动态我们的第一个结果涉及到类数的增长(图1),我们使用三种不同的方法计算了类数。首先,我们使用从第3.3节中提到的历史来源收集的原始数据。

24
nandehutu2022 在职认证  发表于 2022-6-8 15:50:23
同样令人意外的是,数据显示出一种线性增长,有明显的波动,主要是由于1872年引入了一种全新的系统,1977年设计了课程(见脚注)。灰线显示了线性t,估计范围为2.41(s.e.0.06)和Rof 0.96(我们将没有数据的年份作为NA处理,但用上一个观察年份的数据填充它们不会显著影响结果)。其次,我们使用2015年6月的主分类文件计算了截至t年授予的专利被分类的不同类别的数量(黑线)。为此,我们使用了所有专利分类类别(即包括交叉引用类别)。增长模式与历史数据截然不同。如果我们只考虑1836年后的数据,班级数量的增长是次线性的——每年引入的班级越来越少。1836年之前,趋势是线性的,或者是指数型的,这使得整个画面呈现出不对称的S形。第三,我们根据所有CurrentClass建立的日期(蓝线)计算了类别数量的增长。

25
大多数88 在职认证  发表于 2022-6-8 15:50:28
根据这一衡量标准,第一类发明于1899年,保留了所有类型的专利。在https://bulkdata.uspto.gov/(访问日期:2018年1月7日)如果我们只考虑基本类,则类的(重建)数量略低,因为有些类仅用作交叉引用,而不是主要类。这些类别包括902:电子资金转账,903:混合动力电动汽车,901:机器人,930:肽或蛋白质序列,977:纳米技术,976:核技术,968:钟表学,987:含有bi、sb、as或p原子或含有周期系统第6至第8组金属原子的有机化合物,984:乐器,G9B:基于记录载体和传感器之间相对运动的信息存储。收集自https://www.uspto.gov,第USPCSdates页,分类重组开始时,成立了分类部门。图2以对数-对数比例显示了类别数与专利数的对比。在许多系统中,发现类别的数量随着其分类项目数量的幂律而增长,这一结果被称为“堆”定律(例如,基于分类系统-主题主题标题-而非语言,见Petersen et al.(2016))。在此,我们发现,使用2015年的分类,明显违反了Heaps法则。利用历史数据,希普斯定律似乎是一个合理的近似值。我们估计堆的指数为0.378,标准误差为0.010,R=0.95。图2右下角的插图显示,最近几年,Heaps定律失败了:对于最近的200万项专利(约占总数的20%),几乎没有创建任何类别。

26
何人来此 在职认证  发表于 2022-6-8 15:50:31
我们不知道课程引入的放缓是由于激进创新的放缓,还是由于更制度化的原因,例如由于预期的专利合作分类的转变,美国专利公司缺乏投资。由于联合分类系统于2010年10月25日首次发布(Blackman 2011),我们将该日期(更准确地说,是26日发布的专利号7818817)作为一个提示性指标(插图中的虚线)。另一个需要考虑的问题是,系统可能会变得更“垂直”,即子类的层数——不幸的是,这里我们必须关注类,所以我们无法对此进行测试。5尺寸分布和年龄-尺寸关系在创建和重组技术类别时,我们对它们的增长和相对尺寸感兴趣。更广泛地说,我们的工作是受熊彼特主义思想的推动,即经济通过引入新颖性不断重塑自身(Dopfer et al.2004,Saviotti&Pyka2004)。技术领域的增长在技术经济学中受到了深入的审查,“扣子、纽扣、扣环等”是一个早期以稍微不同的名称创建的类别的例子(根据Simmons(2014),参见Bailey(1946)了解详细信息,1872),但“确定日期”较晚(根据USPTO,1904)。另一个例子是“屠宰”。通过将fi限制在最新的时期,可以获得一个好的fit,但是这是任意的,并且给出了非常低的堆指数,使得绝大多数类的创建无法解释。1800 1850 1900 1950 2000010200300400班级数量●●●●●●●●● ●●●●●●●●●●●●●●●●●●●历史资料Bailey(1946)Stafford(1952)分类手册Rotkin等人。

27
大多数88 在职认证  发表于 2022-6-8 15:50:34
(1999)OTAF(1985)Internet archiveGeneral info。基于当前分类的专利索引:首次专利日期基于基于当前分类的历史数据:建立日期图1:不同类别数量的演变。1e+00 1e+02 1e+04 1e+0612510205010200500累计专利数类别数●●●●●●●●●●●●●●●●●●●●●●●●●7e+06 8e+06 9e+06 1e+07460470480490500● ●●● ●●●● ● ● ● ● ●●1800 1900 20001e+001e+021e+041e+06累计专利数图2:堆定律。NIC变化与发展(熊彼特1934、多西1982、帕西内蒂1983、帕维特1984、弗里曼和索特1997、萨维奥蒂1996、马勒巴2002)。本文献中反复出现的一个主题是部门之间的高度异质性。当行业或技术领域以不同的速度增长时,就会发生结构变化:不同领域的相对规模会发生变化。要以节约的方式研究这个问题,可以选择中尺度方法,即研究类别的规模分布。我们在这里的工作与Carnabuci(2013)最直接相关,他首先在1963-1999年的数据中显示,班级的规模分布呈指数分布。这是一个有趣且首次令人惊讶的发现,因为基于所有域以相同平均速率增长的假设,随机增长模型如Gibrat(1931)或Yule(1925)预测了对数正态分布或帕累托分布,这更容易发胖。相反,我们没有看到相对非常大的领域的出现,这可能最重要的是,较老的行业没有像较年轻的行业那样保持快速增长,这可能是由于技术生命周期(Vernon 1966、Klepper 1997、Andersen1999)。

28
何人来此 在职认证  发表于 2022-6-8 15:50:37
然而,正如我们将要讨论的那样,我们能够通过保持Gibrat定律来解释指数大小分布,但假设类别是随机分裂的。5.1类别的大小分布在本节中,我们研究类别的大小分布,其中大小是2015年的专利数量,类别是使用当前的分类系统定义的。我们只使用初级分类,因此我们只有464个类。图3显示了aclass的大小与其秩的对数之间的线性关系,即类大小呈指数分布。要看到这一点,letp(k)是大小k的概率密度。如果它是指数,则p(k)=λe-λk。根据定义,一类大小k的秩r(k)与简单性不同,我们使用(连续)指数分布,而不是更合适的(离散)几何分布,但这与我们的观点没有区别。我们没有严格检验是否可以拒绝指数假设,因为属性假设是几何的,而经典的检验统计量(如Kolmogorov-Smirnov)不容易应用于离散分布。在5%水平上解释的似然比检验表明,使用扩展指数/几何分布的两个参数分布,即Weibull分布和负二项式分布,可以获得更好的拟合,尤其是在去除两个最小的分类后,这两个分类是异常值(包含4项和6项专利),并且是更大系列(532和520)的一部分。具有较大大小的类的数量,其中r(k)=NR∞kλe-λxdx=Ne-λk,其中N是类数。这相当于排名对数中的sizebeing线性。我们用最大似然法估计参数λ,得到^λ=4.71×10-5标准误差0.22×10-注意,^λ是平均尺寸21223上的一个。我们使用该估计值绘制图。

29
能者818 在职认证  发表于 2022-6-8 15:50:40
3.●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0 20000 60000 1000012510205010200500sizerank图3:排名大小关系。发现指数分布很有趣,因为人们可能期望幂律,这是一种非常常见的尺寸分布,并且经常出现在堆定律中(Lüet al.2010,Petersen et al.2016)。由于指数分布是数据的良好表示,因此值得寻找一种生成此分布的简单机制,我们将在第7节中进行介绍。但是,由于许多模型可以生成指数分布,我们首先需要提供额外的经验证据,以便区分不同的候选模型。5.2年龄-规模关系为了确定较老的类别是否比较年轻的类别包含更多的专利,我们首先需要注意,有两种测量年龄的方法:类别成立的正式日期和授予其第一项专利的年份。预计,classis成立的年份总是晚于其第一项专利的日期。除了532级。我们通过手动搜索USPTO网站证实了这一点。

30
nandehutu2022 在职认证  发表于 2022-6-8 15:50:45
532是OrganizeSize的一部分:2015年的专利数量●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●1900 1940 19801e+01 1e+02 1e+03 1e+04 1e+05成立年份类别大小●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●1800 1850 1900 1950 20001e+01 1e+02 1e+03 1e+04 1e+05首次专利分类年份图4:年龄-规模关系。由于这两种测量年龄的方法可能非常不同,我们在图4中显示了两者的年龄大小(或rathersize出生日期)关系。如果没有重新分类的随机增长模型是有效的,我们会观察到一个负斜率,也就是说,较新的类别应该拥有较少的专利,因为它们有较少的时间从随机增长中积累。相反,我们没有发现明确的关系。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 16:54