楼主: kedemingshi
1864 25

[量化金融] 展开国家发展创新体系: [推广有奖]

11
kedemingshi 在职认证  发表于 2022-6-2 14:40:50
该分析在中等程度上进行了分解:技术分为子类(~600),分类科学(~300)和4位数级别的产品(~1000). 黑色虚线表示噪声级Φ=1%,因为我们考虑99%置信区间的重要链接。对于技术产品(b)和技术科学(c)之间的关系,报告了具有更长时间框架的相同分析。[13] G.Cimini、A.Gabrielli和F.Sylos Labini,《公共科学图书馆综合》第9期,e113470(2014)。[14] C.A.Hidalgo、B.Klinger、A.-L.Barab\'asi和R.Hausmann,《科学》317482(2007)。[15] A.Zaccaria、M.Cristelli、A.Taccella和L.Pietroniro,《公共科学图书馆综合》第9期,e113770(2014年)。[16] P.Klimek、R.Hausmann和S.Thurner,《公共科学图书馆综合》第7期,e38924(2012年)。[17] S.Boccaletti、G.Bianconi、R.Criado、C.I.Del Genio、J.G’omez Gardens、M.Roman、I.Sendina Nadal、Z.Wang和M。Zanin,《物理报告》544,1(2014)。[18] F.Saracco、R.Di Clemente、A.Gabrielli和T.Squartini,《科学报告》510595(2015)。[19] S.Gualdi、G.Cimini、K.Primicerio、R.Di Clemente和D.Challet,《科学报告》639467(2016)。[20] F.Saracco、M.J.Straka、R.Di Clemente、A.Gabrielli、G.Caldarelli和T.Squartini,《新物理杂志》19,053022(2017)。【21】L.Waltman,《信息计量学杂志》第10365页(2016年)。[22]E.Archambault、D.Campbell、Y.Gingras和V.Larivi\'ere,《美国信息科学与技术学会杂志》第60期,第1320页(2009年)。【23】J.Li、M.Sanderson、P.Willett、M.Norris和C.Oppenheim,《信息计量学杂志》4554(2010)。[24]D.W.Aksnes、J.W.Schneider和M.Gunnarsson,《信息计量学杂志》第6期,第36期(2012年)。【25】A.J.Nederhof,《科学计量学》66,81(2006)。【26】G.Sivertsen和B。

12
大多数88 在职认证  发表于 2022-6-2 14:40:53
Larsen,《科学计量学》91567(2012)。[27]“EPO全球专利统计数据库数据目录”(2014年)。[28]“经合组织科学、技术和工业记分牌2001:迈向知识经济”(2001年)。【29】G.Gaulier和S.Zignago,BACI:产品层面的国际贸易数据库,工作文件2010-23(CEPIIresearch center,2010)。【30】B.Balassa,《曼彻斯特学校》(The Manchester School)第33、99页(1965年)。【31】H.P.Bowen,《世界银行档案》(Weltwirtschaftliches Archiv)119464(1983)。【32】L.L.Soete,《世界经济评论》117,638(1981)。【33】T.L.Vollrath,《世界银行档案》(Weltwirtschaftliches Archiv)127265(1991)。【34】D.Archibugi和M.Pianta,《研究政策》21,79(1992)。【35】P.Patel和K.Pavitt,《工业和企业变革》3759(1994)。【36】S.Kim,《经济学季刊》110,881(1995)。【37】A.舒伯特、W.格兰泽尔和T.布劳恩,《科学计量学》16,3(1989)。【38】A.Costinot、D.Donaldson和I.Komunjer,《经济研究评论》79581(2012)。【39】G.Cimini、A.Zaccaria和A.Gabrielli,《信息计量学杂志》10200(2016)。【40】M.R.Guevara、D.Hartmann、M.Aristar\'an、M.Mendoza和C.A.Hidalgo,《科学计量学》109,1695(2016)。【41】M.Medo、G.Cimini和S.Gualdi,《物理评论快报》107、238701(2011)。【42】T.Zhou,J.Ren,M.Medo和Y.-C.Zhang,《物理评论》E 76046115(2007)。【43】Y.A.Rozanov,《马尔可夫随机场》(Springer Science&Business Media,2012)。[44]K.Zweig和M.Kaufmann,《社会网络分析与挖掘》,第1187页(2011年)。【45】Z.Neal,《社交网络》39、84(2014)。【46】J.Park和M.E.J.Newman,《物理评论》E 70066117(2004)。[47]K.Huang,《统计力学》(Wiley,1987)。补充信息数据集科学我们使用从SciVal平台(www.SciVal.com)收集的有关各国科学生产力和影响的数据,这是一种新的API,汇集了来自Scopus(www.Scopus.com,由Elsevier所有)的数据。

13
可人4 在职认证  发表于 2022-6-2 14:40:58
该数据库包括期刊、商业出版物、丛书、会议记录和书籍。请注意,尽管Scopus的覆盖范围比科学网更广,分类系统也比Google Scholar更可靠【21】,但基于这两个数据库的分析通常会产生非常相似的结果,尤其是在国家层面进行的分析【22,23】。收集的数据涵盖1996年至2013年的年份,并引用了科学出版物语料库中的引文,每个出版物都属于特定的科学部门(或子部门)。然后在国家一级汇总数据,因此WSC,s(y)是国家c科学部门s在y年内编制的科学文件获得的总文献计量引文数。请注意,这些值是使用International Lyco撰写的论文的完整计数方法计算的[21],这可能会导致对国际化程度高的小国的偏见,从而损害独立大国的利益[24]。英语国家在社会科学和人文学科方面也会产生偏见,因为用其他语言编写并在国家期刊上发表的文件,尤其是在这些领域中很重要,但这些文件并没有全部涵盖[25,26]。然而,据推测,这些部门与专利和生产活动的联系较少,因此不会妨碍我们的分析结果。技术我们使用PATSTAT(www.epo.org/searching for patents/business/PATSTAT)中包含的专利数据来衡量各国的技术能力[27]。PATSTAT收集了全世界不同专利机构(近100家)的所有专利(约1亿)。从19世纪中叶到今天,时间跨度极为广阔。专利办公室通过使用国际专利分类(IPC)中的一个或多个代码标记每个专利来组织知识。

14
可人4 在职认证  发表于 2022-6-2 14:41:01
IPC代码定义了由六个级别(节、小节、类、子类、组、子组)组成的层次分类,范围在8到7万多个代码之间。PATSTAT还记录了每项专利申请人(通常为公司)的原产国。最后,PATSTAT根据其中的主要引用文献[28]定义了专利的“系列”,即具有共同优先权的所有专利。事实上,多个专利可以被称为同一项创新,例如,因为同一公司适用于不同的专利机构,以将其专利保护扩展到更广阔的市场,或者因为特定专利机构对一项专利的限制有不同的监管。特别是我们在以下INPADOC系列或扩展系列中使用,它收集由一个或多个优先级直接或间接链接的所有文档。因此,观察的基本单位是专利族。每个家族通过家族中专利申请人的来源和一个或多个技术代码与一个或多个国家相关。当然,技术代码取决于所使用的聚合。在构造矩阵时,我们假设每个族都是一个单位,因此在矩阵中具有相应的权重。因此,对于给定年份数据集中发现的每个家庭,我们在所有技术代码及其映射到的所有国家中平均分配其权重单位。考虑到这一点,我们将WTc,t(y)定义为位于c国的一家公司在y年申请的领域中的专利族数量,或此类专利族的归属部分。P产品代表经济生产,我们使用联合国商品贸易统计局(UN COMTRADE)记录的BACI出口数据(https://comtrade.un.org/)并由CEPII处理【29】。原始数据库报告了各国之间的进出口流量,数据跨度为20年,从1995年到2014年。

15
kedemingshi 在职认证  发表于 2022-6-2 14:41:04
该数据库包括约5000种根据世界海关组织《2007年协调制度》分类的产品,这些产品用一组以分层方式组织的6位数代码表示。给定的代码分为三个两位数的部分,每个部分指定层次结构的一个级别。因此,第一部分指出了最广泛的类别,如“活动物和动物产品”(01xxxx)或“塑料及其制品”(39xxxx)。后两位数字说明了每个类别的进一步区别,如“活猪”(0103xx)或“活牛”(0102xx),而后两位数字则更为具体。贸易流量以千美元为单位。经过数据清理程序后,获得了一个国家产品矩阵,其通用元素WPc,p(y)表示y年期间c国产品p总出口的货币价值。方法在原始矩阵{WL(y)}中揭示了L∈ {S、T、P}对于上述章节所述的不同年份y,第一项任务是确定给定国家c在活动a(属于layerL)中是否显示出相对于其他国家以及其他同类活动的比较优势。这是通过公布的比较优势(RCA)[30]实现的,这是一个密集的指标,计算为c活动篮子中活动a的权重与世界总活动中活动a的权重之间的比率。如果RCA>1,则显示出比较优势,我们对原始矩阵进行二值化,以获得新矩阵{ML(y)}:MLc,a(y)=1个ifWLc、a(y)PaWLc、a(y)、PcWLc、a(y)Pc、aWLc、a(y)≥ 否则为1,0。(1) 在科学、技术和经济活动的研究中,经常使用类似RCA的指标【31–40】。在不同的层面上使用相同的RCA公式主要是因为有一种连贯的方法来构建它们。

16
能者818 在职认证  发表于 2022-6-2 14:41:07
请注意,RCA在科学层面也进行了适当的规范化,以消除对畅销论文的偏见,因为这些论文比最近的论文有更多的时间吸引引文[41]。多层空间一旦二元矩阵{ML(y)}被定义,我们就建立了连接生产、技术和科学活动的多层空间,其灵感来自于【14,15】中提出的一般思想。给定一对层(L,L)∈ {P、T、S},以评估在活动a中是否具有比较优势的国家∈ 林年更有可能在活动a中取得优势∈ 在y年,我们必须在国家维度(即国家集C)上用ML(y)适当收缩ML(y),并取元素(a,a)。构建辅助矩阵的详细规定源自所谓的概率扩展方法【42】。让我们考虑位于L层的一般活动上的一些信息。我们旨在描述这些信息如何传播到L层的活动。作为第一步,信息根据ML(y)的连接模式跳转到国家:信息位从给定国家的转移概率为ρL→加利福尼亚州→c(y)=MLc,a(y)/uLa(y),其中uLa(y)=Pc∈CMLc,a(y)是ain Lforyear y的普遍性(或程度)。因此,我们假设在a中具有比较优势的国家具有相同的转移概率,这是基于最大不确定性原则,因为我们不想在过程中引入偏差。第二步,位于国家的信息跳转到L层中的活动,现在遵循ML(y)的连接模式。

17
能者818 在职认证  发表于 2022-6-2 14:41:11
再次假设最大不确定性,信息位从c到给定活动ain层的转移概率Lisρc→信用证→a(y)=MLc,a(y)/dLc(y),其中dLc(y)=PaMLc,a(y)是第y年第l层中国家c的多样性(或程度)。将这两个步骤放在一起,信息位从活动a跳跃的概率∈ Lto活动a∈ 最后显示:Xc∈CρL→加利福尼亚州→c(y)ρc→信用证→a(y)=uLa(y)Xc∈CMLc、a(y)MLc、a(y)dLc(y)≡ 基本法→洛杉矶→a(y,y)。(2) 上述方程定义了土地L层之间的二分网络,可解释为林年活动到林年活动的信息流量(即,在给定时间之后)。该解释基于以下考虑:与一般活动相关的信息(诀窍)通过a.中具有比较优势的国家转移到l中的各种活动中,以说明国家发展动态(无论是科学、技术还是经济)的高度竞争性,我们很自然地可以假设,从ato的任何活动中转让专有技术对所有国家都不方便。特别是,一个特定的活跃于a的国家c将对这种转移产生影响,这与拥有其活动篮子的国家数量成反比。因此,c国利用ais提供的信息的概率如下所示:P r(c | a;y)≡ ρL→加利福尼亚州→c(y)。(3) o当一个国家c在L转让其在ato活动中的专有技术时,很自然地会假设选择特定活动的概率与独联体国家在Lin的活动数量成反比。这一假设源自每个国家为活动转移提供的有限和固定数量的资源。

18
mingdashike22 在职认证  发表于 2022-6-2 14:41:15
因此,给定国家从活动a转移专有技术的条件概率c为:P r(a;y | c;a;y)=P r(a;y | c)≡ ρC→信用证→a(y)。(4) 后一个等式源自这样的假设,即向ais的转移效应独立于启动活动a(以及y)。换句话说,我们将所描述的随机跳跃建模为马尔可夫过程:以系统的当前状态为条件,其未来和过去状态是独立的【43】。最后,概率合成公式用于评估从活动ato活动Aleads到等式(2)的转移概率:P r(a;y | a;y)=Xc∈CP r(a;y | c)P r(c | a;y)≡ 基本法→洛杉矶→a(y,y)。(5) 注意,过程的时间方向由时滞y给出- y、 在y>y的情况下,等式2保持不变(仍然表示从ato a的转移概率),但信息流方面的解释相反:BL→洛杉矶→a(y,y)成为一点信息到达活动a的概率∈ Loriginally来自活动a∈ 五十、 多层空间的假设检验为了评估辅助矩阵元素的统计意义,我们对两部分矩阵{ML(y)}采用了一个空模型,该模型通过随机重新排列其元素(即L层的网络连接)建立,但保留了国家多样性和活动的普遍性(即度)。这允许消除来自网络连接模式的信号,超出度值中包含的信息。然而,为了在分析上形式化完整模型(从而避免依赖条件一致图检验[44,45]),对统计力学中的正则系综平均施加了度约束。

19
mingdashike22 在职认证  发表于 2022-6-2 14:41:20
因此,我们最终得出了一个由二部配置模型(BiCM)[18]描述的零假设,这是标准配置模型[46]对二部网络的扩展。形式上,给定矩阵ML(y)的BiCM零模型定义为集合Ohm最大随机的二部网络配置的L(y),但受经验网络中观察到的值约束的度的总体平均值除外:hdLc(y)iOhmL(y)=数据链路连接器(y)c∈ C和huLa(y)iOhmL(y)=uLa(y)一∈ 五十、 为了便于记法,在下文中,我们省略了数量对图层L和年份y的明确依赖,这在BiCM的整个构造过程中不会发生变化。此外,我们使用带有颚化符的符号表示在空模型配置上评估的数量,不使用颚化符表示观察值。让▄M∈ Ohm 是集合中的网络配置,P(~M)是该图在集合中的概率。根据统计力学[47]的规定,概率分布的最小偏差选择是最大化吉布斯熵=-XM∈OhmP(▄M)ln P(▄M),(6)受规范化条件P▄M约束∈OhmP(▄M)=1加上约束:h▄dciOhm=XM∈OhmP(▄M)▄dc(▄M)=dcc∈ C、 huaiOhm=XM∈OhmP(▄M)▄ua(▄M)=ua一∈ 五十、 (7)引入相应的拉格朗日乘子ω,{uc}c∈坎德{νa}a∈L(每个国家和网络的活动各一个),所有配置的熵满意度最大化的概率分布M∈ Ohm:0=ΔδP(¢M)S+ω1.-XM∈OhmP(¢M)++Xc公司∈CuCdc公司-XM∈OhmP(▄M)▄dc(▄M)+Xa公司∈Lνaua公司-XM∈OhmP(▄M)▄ua(▄M).(8) 解为:P(~M{uc},{νa})=e-H(▄M▄{uc},{νa})。Z({uc},{νa}),(9)其中H(~M{uc},{νa})是图的哈密顿量,Z({uc},{νa})是配分函数H(~M{uc},{νa})=Xc∈CuC▄dc(▄M)+Xa∈Lνa▄ua(▄M),(10)Z({uc},{νa})=eω+1=X▄M∈Ohme-H(▄M▄{uc},{νa})。

20
何人来此 在职认证  发表于 2022-6-2 14:41:23
(11) 方程(9)、(10)和(11)定义了BiCM模型,即在已知约束条件下最大化熵的一组特定网络配置上的分布。当我们考虑局部约束(度数)时,我们可以通过公式(9)得出[18]:P(~M |{uc},{νa})=Yc∈CYa公司∈LπИMc,ac,a(1- πc,a)~Mc,a,(12)其中πc,ais是国家c和活动a之间联系的集合概率:πc,a=h ~Mc,aiOhm=XM∈Ohm~Mc,aP(~M{uc},{νa})=ηcθa1+ηcθa(13),ηc=e-ucandθa=e-νa.注意,在等式(12)中,网络概率是所有可能的国家/地区活动对的连接概率的乘积,这意味着在BiCM上下文中,链接结果是独立的NDOM变量。等式(12)中的概率分布取决于拉格朗日乘数的值,必须估计为:-ucln Z({uc},{νa})=hdciOhmc∈ C-νaln Z({uc},{νa})=huaiOhm一∈ 五十、 (14)为了获得约束的集合平均值的数值,我们将对数似然函数最大化:L({uc},{νa})=lnp(M{uc},{νa})=Xc∈Cdclnηc+Xa∈Lualnθa-Xc公司∈CXa公司∈Lln(1+ηcθa),(15),这意味着求解| c |+| L |未知量中的| c |+| L |方程组:dc=Pa∈Lπc,a=Pa∈Lηcθa1+ηcθac∈ Cua=Pc∈CπC,a=Pc∈CηCθa1+ηCθa一∈ 公式(13)的L(16)连接概率现已明确,可用于直接对两部分配置的集合进行采样或分析计算感兴趣的数量。在符号中重新引入对图层L和年份y的明确依赖,我们最终构建了空模型OhmL→L(y,y)表示从Lat yto Lat y层到Lat y层的辅助矩阵。这是通过沿国家维度【19,20】收缩矩阵ML(y)和ML(y)的两个BICM来实现的,如等式(2)所示。我们有:▄BL→洛杉矶→a(y,y)=uLa(y)Xc∈C▄MLc,a(y)▄MLc,a(y)▄dLc(y)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-6 04:45