楼主: nandehutu2022
984 46

[量化金融] 知识生产中的外部性:来自随机领域的证据 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-6-14 06:13:10
表1显示了实验后页面长度的汇总统计。0 5000 10000 15000平均页长2004m1 2007m1 2010m1 2013m1 2016m1月龄控制-治疗(a)法国0 5000 10000 15000平均页长2004m1 2007m1 2010m1 2013m1 2016m1月龄控制-治疗(b)德国0 2000 4000 6000平均页长2004m1 2007m1 2013m1 2016m1月龄控制-治疗(c)意大利0 2000 4000 6000平均页长6000length2004m1 2007m1 2010m1 2013m1 2016m1月龄对照-治疗(d)安慰剂:DUTCH图2:治疗组和对照组的平均页长(按语言):在每个图上,对照组和治疗组的观察次数分别为30次和30次。实验月(2014年8月)用垂直虚线标记。3.2编辑活动的衡量为了构建编辑活动的衡量标准,我们从180个维基百科页面的30601个编辑(修订)开始。

12
kedemingshi 在职认证  发表于 2022-6-14 06:13:13
这包括所有编辑,但作为表1的一部分生成的编辑除外:页面长度和编辑活动的摘要统计处理后变量平均SE最小值第10个50个90个最大OBS面板A:页面长度减去处理添加的文本长度,治疗后第1年8012 6447 1260 1696 6588 16168 55378 1802年8640 9356 646 1663 6906 16302 98047 1803年9037 9709 627 1744 7358 17250 101428 1804年9463 10141 611 1688 7554 18758 102688 180B组:每月平均独立用户数,治疗后第1年0.37 0.33 0.00 0.00 0.33 0.75 1.67 1802年0.32 0.35 0.00 0.00 0.17 0.71 2.58 1803年0.30 0.29 0.00 0.00 0.25 0.67 1.58 1804年0.29 0.28 0.00 0.00 0.17 0.71 1.25 180C组:每月平均编辑次数,治疗后第1年0.39 0.35 0.00 0.00 0.33 0.75 1.83 1802年0.34 0.41 0.00 0.00 0.21 0.75 3.67 1803年0.32 0.33 0.00 0.00 0.25 0.75 2.00 1804年0.30 0.30 0.00 0.00 0.17 0.75 1.33 180D组:每月平均编辑距离,治疗后第1年119.85 205.39 0.00 0.00 27.96 358.21 1520.83 1802年108.32 678.72 0.00 13.71 187.29 9027.83 1803年65.12 145.85 0.00 0.00 12.92 183.29 1273.92 1804年112.12 500.08 0.00 11.12 167.58 5800.50 180注:观察单位为一页(180页)。专家组A报告了治疗后第1、2、3和4年末的页面长度(减去治疗添加的文本长度)汇总统计数据。处理后的每月平均唯一用户数汇总统计在面板B中,每月平均编辑数汇总在面板C中,每月平均编辑距离汇总在面板D中。页面长度和编辑距离以字符数衡量。实验中的处理。继Aaltonen和Seiler(2016)之后,我们通过以下方式限制编辑样本。

13
大多数88 在职认证  发表于 2022-6-14 06:13:16
首先,我们排除了机器人程序的编辑(约30%的编辑),这些是生成自动编辑的非人类用户帐户。具体而言,我们将机器人定义为用户名出现在机器人列表中(英语、法语、德语或维基百科)或用户名包含“机器人”的用户。其次,我们排除了还原,即还原同一页面的任何以前版本的编辑(约占剩余编辑的7%)。第三,我们排除故意破坏行为(剩余编辑量的0.8%)。我们使用以下标准将编辑归类为故意破坏:(a)仅从先前版本中删除文本的编辑,以及(b)故意破坏后立即将文章恢复为原始版本。然后,我们只剩下19586个由人类用户生成的富有成效的编辑。为了分析治疗对编辑活动的影响,我们构建了三种类型的月度衡量指标,描述了有多少人编辑了页面、编辑了多少次以及编辑了多少。第一个指标是每月编辑页面的唯一用户数。我们通过注册用户的用户名和匿名用户的IP地址定义唯一用户。第二个指标是每月的编辑次数。为了避免重复计算微观编辑,我们首先将编辑汇总到日用户页面级别,然后将这些汇总到月页面级别。第三个衡量标准是编辑距离,我们将其定义为编辑添加的字符数加上与之前版本页面相比删除的字符数。我们将编辑距离度量聚合到每月级别。表1中的面板B至D显示了编辑活动的汇总统计数据。附录A中的图A.3描述了治疗组和对照组在一段时间内的平均编辑活动。附录A中的表A.1显示了治疗组与对照组治疗前页面长度和编辑活动的比较。

14
nandehutu2022 在职认证  发表于 2022-6-14 06:13:19
表格显示,两组在治疗前没有显著差异。除了编辑活动的聚合度量之外,我们还将直接修改处理文本的编辑与修改页面其他部分的编辑分开。我们使用类似于Hinnosar、Hinnosar、Kummer和Slivko(2017)的方法将编辑分为这两类。对于治疗组中的每一页,我们使用治疗前后的差异算法来确定治疗文本,即治疗添加的确切文本。对于每个修订后处理,使用处理文本和本修订之间的Diff算法,我们检查修订是否删除了处理文本的任何部分。如果修订没有从治疗文本中删除任何内容,我们将该修订归类为编辑页面其他部分的修订。4结果4.1影响页面长度的主要实证策略。因为我们能够使用实验变量,所以我们专注于横截面估计。我们的经验策略比较了治疗组和对照组在实验后的页面长度。为了使页面具有可比性,我们从treatmentgroup中的页面长度中减去处理添加的文本长度。因此,这些估计值应被解释为在消除治疗造成的机械性增加后,治疗对页面长度的影响。我们估计,许多维基百科编辑会在短时间内保存同一页面的许多修订(因为他们在编辑过程中每做一个小改动都会保存一个修订)。请注意,我们的编辑距离度量与Levenshtein编辑距离不同,它为替换赋予了权重2,而不是权重1。

15
kedemingshi 在职认证  发表于 2022-6-14 06:13:23
对于每个编辑,我们使用php FineDi ff类在字符的粒度级别计算编辑距离。以下回归:Yi=β+β治疗组i+Xi+εi(1),其中结果变量是实验后几年第i页长度(减去治疗文本长度)的对数。感兴趣的系数是治疗组I的β,这是一个指标变量,如果页面分配给治疗组,则取1,如果页面分配给对照组,则取0。协变量Xi包括语言和城市固定效应以及治疗前页面长度的对数。主要结果。表2显示了实验后四年内治疗对页面长度影响的主要结果。具体而言,结果变量是治疗后第1年(A组)、第2年、第3年和第4年(B组至D组)末的页长对数(减去治疗文本)。第1–4列从无控件开始,依次添加所有控件。系数在各规格间保持稳定,而添加协变量可减少标准误差。表2中的结果表明,一旦纳入所有协变量,治疗组与对照组相比,治疗后第一年的页数大约延长7%。到第四年时,治疗效果在统计学上不显著,且系数较小。多年来,治疗的影响系数小于标准偏差的9%(见表2)。表2中的结果表明,到第四年年底,治疗对页面长度的影响可以忽略不计。

16
能者818 在职认证  发表于 2022-6-14 06:13:26
在排除了治疗增加的文本长度后,使用第4栏D中估计值所暗示的95%置信区间的界限,我们能够拒绝在实验后第4年年底,治疗组的页面比对照组的页面长14.1%以上或短5.1%以上。估计结果如图3所示。稳健性和异质性。在线附录A中提供了我们对稳健性和异质性的分析。我们讨论了纳入替代协变量(表A.2)的稳健性以及跨语言(表A.3)和跨页面特征(表A.4)的异质性。简言之,我们没有发现任何证据表明该治疗对页面长度有任何显著的长期影响。首先,我们评估结果是否对纳入替代协变量敏感。表A.2给出了与表2相同的回归估计,但不是城市,上界为:0.045+1.96×0.049=0.141;下限:0.045- 1.96 × 0.049 = -0.051.表2:处理对页面长度的影响。页长(减去治疗文本)A组:第1年治疗后B组:第2年治疗后(1)(2)(3)(4)(1)(2)(3)(4)治疗组0.068 0.069 0.045 0.065*0.071 0.075 0.047 0.071*(0.118)(0.088)(0.036)(0.035)(0.125)(0.091)(0.043)(0.042)日志。0.927***0.851***0.962***0.853***治疗前的长度(0.022)(0.034)(0.027)(0.041)语言FE否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否,变数8.699。R平方-0.004 0.510 0.909 0.922-0.004 0.526 0.880 0.898观测值180 180 180 180 180 180 log。

17
mingdashike22 在职认证  发表于 2022-6-14 06:13:30
页长(减去治疗文本)C组:第3年治疗后D组:第4年治疗后(1)(2)(3)(4)(1)(2)(3)(4)治疗组0.059 0.074 0.035 0.069 0.040 0 0.048 0.017 0.045(0.127)(0.092)(0.048)(0.045)(0.130)(0.092)(0.056)(0.049)日志。0.963***0.857***0.963***0.830***治疗前的长度(0.029)(0.044)(0.034)(0.048)语言FE否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否否,偏差值8.762 8.795 8.795 8.795。R平方-0.004 0.524 0.858 0.889-0.005 0.547 0.816 0.873观察值180 180 180 180注:每列显示180个维基百科页面的单独横截面回归估计值。因变量是第1年治疗后(A组)、第2年治疗后(B组)、第3年治疗后(C组)和第4年治疗后(D组)页面长度的对数(减去治疗添加的文本长度)。括号中报告了标准错误。***表示在1%水平上的重要性,**在5%水平上,*在10%水平上的重要性。和语言固定效应,它包括分层组假人(见第2节)。结果与表2中没有任何固定影响的结果相同(表2中第1列和第3列)。表A.3分别重新估计了每种语言的回归。只有在法语维基百科和治疗后的头两年,治疗对页面长度的影响很小。在其他语言中没有显著影响。表A.4重新估计回归,同时将样本除以页码。虽然估计值并不显著,但对于较年轻的页面,治疗后第一年的系数更大。第1年治疗后第2年治疗后第3年治疗后第4年治疗后-。05 0 .05 .1.15日志。

18
大多数88 在职认证  发表于 2022-6-14 06:13:32
治疗的页长(减去治疗文本)系数图3:治疗对页长的影响注:该图显示了表2第4列四次回归得出的点估计值(条形图)和95%置信区间(线)。系数描述了治疗后第1年、第2年、第3年和第4年结束时,治疗对页面长度对数的影响(从中减去通过治疗添加的文本长度)。观察单位为一页(180页)。有关更多详细信息,请参见表2.4.2对用户数量和编辑结果的影响。表3显示了治疗对后续用户数量影响的主要结果,并在实验后四年内进行了编辑。每一列都给出了与第4.1节类似的横截面回归的估计值,其中输出变量衡量了实验后第1年、第2年、第3年和第4年的编辑活动。结果变量是每月的平均用户数(编辑页面的人)(面板A)和每月的平均编辑数(面板B)。在表3的首选规范中,协变量包括城市和语言固定效应。其他协变量包含在在线附录A的稳健性分析中。表3的面板A和B显示,在实验后的头两年,治疗增加了用户数量和编辑数量。具体而言,该处理将每月编辑页面的平均用户数增加了约0.13个用户(面板A中的第2列和第4列),并将每月编辑的平均数量增加了0.14个编辑(面板B中的第2列和第4列)。这些影响为标准偏差的30–40%。然而,这些增长只是昙花一现。

19
kedemingshi 在职认证  发表于 2022-6-14 06:13:36
在第三年和第四年,对于这两种测量,治疗效果都不明显,系数也很小。第四年,预计每月增加约0.02个用户,其中不太稳定3:治疗对后续用户数量的影响1第2年第3年第4年(1)(2)(3)(4)(5)(6)(7)(8)面板A。因变量:治疗组每个月的平均用户数量0.099**0.122***0.096*0.119***-0.006 0.014-0.001 0.024(0.049)(0.030)(0.052)(0.035)(0.043)(0.028)(0.043)(0.033)语言FE否是否是SCITY FE公司否否否否否否否否否否0.368 0.368 0.317 0.317 0.295 0.295 0.292 SD折旧0.329 0.329 0.353 0.353 0.287 0.287 0.285 0.285Adj。R平方0.017 0.678 0.013 0.608-0.006 0.618-0.006 0.453观察180 180 180 180 180 180 180面板B。因变量:每个月的平均编辑次数治疗组0.109**0.138***0.119*0.140***-0.008 0.011 0.004 0.029(0.052)(0.032)(0.061)(0.043)(0.049)(0.032)(0.045)(0.036)语言FE否是否是否否Yes No Yes No Yes No Yes No Yes Mean dep.var.0.3890.389 0.335 0.335 0.319 0.319 0.305 0.305SD部门变量0.351 0.351 0.412 0.412 0.325 0.325 0.302 0.302Adj。R平方0.019 0.663 0.015 0.556-0.005 0.623-0.006 0.424观察180 180 180 180 180 180面板C.因变量:每个月的平均编辑次数,包括治疗组添加的文本编辑-0.003 0.022 0.058 0.072*-0.056-0.035-0.050-0.026(0.048)(0.030)(0.059)(0.043)(0.048)(0.031)(0.043)(0.033)语言FE否否否否否否否否否否否否否否否否否否是否是否YesMean dep.var.0.333 0.333 0.305 0.295 0.295 0.278 0.278SD dep.var.0.318 0.318 0.398 0.319 0.319 0.287 0.287调整。

20
何人来此 在职认证  发表于 2022-6-14 06:13:39
R平方-0.006 0.641-0.000 0.533 0.002 0.616 0.002 0.458观察值180 180 180 180 180注:每一列显示了180个维基百科页面的独立横截面回归估计值。因变量是治疗后第1年(第1-2列)、第2年(第3-4列)、第3年(第5-6列)和第4年(第7-8列)每月的平均用户数或编辑数。因变量测量用户(面板A)、编辑(面板B)和编辑(不包括编辑处理添加的文本的编辑)(面板C)。括号中报告了标准错误。***表示1%的显著水平,**表示5%的显著水平,*表示10%的显著水平。低于标准偏差的9%,在第三年,影响甚至更小(面板a和B中的第6列和第8列)。图4总结了这些结果。如果这些编辑和编辑对页面长度的影响微乎其微(如第4.1节所示),那么在治疗后的头两年,他们会做什么?一种自然的解释可能是,额外的编辑只是对处理添加的文本进行润色。至-。1 -.05 0 .05 .1.15 .2.25每月平均用户数第一年第二年第三年第四年(a)#用户-。1 -.05 0 .05 .1.15 .2.25每月平均编辑次数第一年第二年第三年第四年(b)#编辑-。1 -.05 0 .05 .1.15 .2.25每月平均编辑数第一年第二年第三年第四年(c)#编辑不包括治疗图4:治疗对每月平均用户和编辑数的影响注:此图显示了表3面板A至c第2、4、6和8列中12个回归系数的点估计值(条形图)和95%置信区间(线)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 11:31