楼主: nandehutu2022
982 46

[量化金融] 知识生产中的外部性:来自随机领域的证据 [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-6-14 06:13:42
系数描述了治疗对治疗后第1年、第2年、第3年和第4年每月平均用户数(面板A)、编辑数(面板B)和编辑数(不包括治疗后添加的文本)的影响。观察单位为一页(180页)。详情见表3。研究这一点,我们重新计算了每月的平均编辑次数,同时排除了直接编辑处理添加的文本的编辑。使用该结果变量的估计值见表3的面板C和图4c。结果表明,如果包括直接影响处理添加的文本的编辑,则处理效果要小得多。我们的结论是,编辑量的短期增长(见表3的面板a和B)很大一部分来自编辑处理添加的内容。稳健性和异质性。在在线附录A的表A.5至A.7中,我们评估了表3中A组和B组中报告的结果是否符合不同的规范。简言之,我们发现,结果在包含替代协变量和估计面板数据固定效应模型而非横截面回归方面是稳健的。首先,我们评估结果是否对纳入替代协变量敏感。表A.5给出了与表3相同的回归估计,但它不包括城市和语言固定效应,而是包括分层组假人(见第2节)。结果与表3中没有任何固定影响的结果相同。表A.6中的回归包括预处理平均用户数和编辑数。结果与表3中的结果相似。表A.7给出了面板数据固定效应回归的估计值。面板数据固定效应估计值与基于横截面数据的估计值相似。

22
mingdashike22 在职认证  发表于 2022-6-14 06:13:45
实验后的头两年,该治疗显著增加了用户数量和编辑数量,但在第三年和第四年没有影响。与横截面框架相比,前两年的估计影响幅度仅略大:我们估计面板数据回归中每月用户数为0.14,横截面回归中每月用户数为0.12。在表A.8至A.10中,我们分别按每种语言重新估计了表3中的回归。我们发现不同语言之间存在异质性。特别是,这种治疗仅在法语和德语维基百科中对编辑行为有积极的显著影响,而在意大利语维基百科中没有证据表明有积极的影响。为了更清楚地了解编辑活动短期增长的原因,我们将样本分为两种方式进行分析。首先,我们区分实验前编辑过同一页面的“老”用户(即可能对页面有“所有权”意识的用户)和实验前未编辑页面的“新”用户的编辑。表A.11没有证据表明该治疗对老年用户有任何影响。相反,我们发现用户数量的短期增长来自新用户。应该注意的是,老用户的数量很少,这可能会导致难以检测到这种影响。其次,我们研究了维基百科页面的年龄对异质性的影响。我们假设,在页面时代的早期阶段,添加内容的影响可能比后期更大。我们用页面的平均年龄来划分样本。表A.12中的估计表明,事实上,对于较年轻的页面,第一年的处理效果更大。4.3对编辑距离主要结果的影响。

23
kedemingshi 在职认证  发表于 2022-6-14 06:13:48
表4显示了处理对后续编辑距离影响的主要结果,该距离等于添加的文本总量加上删除的文本总量。通过将添加和删除的文本量相加,editdistance可以捕获文本的抛光程度,并以这种方式提供质量度量。如前几张表所示,每一列都给出了横断面回归的估计值,其中结果变量衡量了实验后第一、第二、第三和第四季度的编辑活动。面板A中的因变量是每月的平均编辑距离。表4面板A中的估计显示,治疗对编辑距离没有统计上的显著影响。系数的符号各不相同,除第二年外,系数的大小较小,每月少于15个字符(第2、6和8列)。第二年,(统计上不显著的)系数估计(第4列)意味着每月100个字符的治疗效果,这仍然略低于标准偏差的15%。由于编辑距离的分布有一条长尾,在表4的面板B中,我们注意到,由于许多页面是在同一天创建的,所以样本被分成了不同的组。表4:治疗后4年内治疗对编辑距离的影响第1年第2年第3年第4年(1)(2)(3)(4)(5)(6)(7)(8)A组因变量:月平均编辑距离治疗组7.655 12.806 128.524 100.284-15.897-13.534 23.890 1.296(30.699)(31.301)(101.004)(105.570)(21.771)(21.692)(74.735)(79.265)语言FE否是否是否是否是否是否YesMean dep.var.119.848 119.848 108.318 108.318 65.123 65.123 112.119 112.119SD dep.var.205.394 205.394 678.724 145.853 145.853 500.082 500.082Adj。

24
nandehutu2022 在职认证  发表于 2022-6-14 06:13:51
R平方-0.005 0.071 0.003 0.032-0.003 0.115-0.005-0.005观察180 180 180 180 180面板B。因变量:每月平均封顶编辑距离治疗组13.644**17.282***18.642*20.512**-6.174-4.158-2.823 0.485(6.124)(5.609)(9.776)(8.654)(6.812)(5.294)(6.140)(5.343)语言FE否是否是否是否否否否否否否YesMean dep.var。39.173 39.173 35.008 35.008 32.183 32.183 28.758 28.758SD部门变量41.530 41.530 66.061 66.061 45.675 45.675 41.095 41.095Adj。R平方0.022 0.270 0.015 0.314-0.001 0.463-0.004 0.324观察180 180 180 180 180注:每列显示180个维基百科页面的单独横截面回归估计值。编辑距离(面板A)等于添加的字符数加上删除的字符数。限制编辑距离(面板B)使用单个编辑计算,编辑距离限制在第90个百分点。所有因变量均为各月的平均值,并以字符数衡量。括号中报告了标准错误。***表示在1%水平上的重要性,**在5%水平上,*在10%水平上的重要性。使用从单个封顶编辑计算的替代编辑距离度量。个人编辑的上限为90%。第90个百分位大约等于500个字符,大约是中值编辑的10倍。这样,限制的编辑距离度量为长编辑提供了较小的权重。小组B中的估计表明,在实验后的前两年,治疗增加了平均封顶编辑距离。影响的大小很小,第一年每月增加约17个字符(第2列),第二年每月增加21个字符(第4列)。

25
nandehutu2022 在职认证  发表于 2022-6-14 06:13:55
假设实验中跨语言的平均单词长度约为10.4个字符,我们的处理在第一年将editdistance增加了1.5个单词,在第二年增加了两个单词。编辑距离的短期增长幅度较小,与表3 panelC的结果一致,这表明编辑量的增长主要来自编辑来源:http://www.ravi.io/language-word-lengths.content通过处理添加。这种治疗方法对后期的封顶编辑距离没有显著影响。在最近几年,系数甚至更小。在第四年,估计效果约为每月0.5个字符(第8列),低于标准偏差的1%。稳健性。表4已经说明了治疗对编辑距离影响的估计对结果变量的特定形式很敏感。在下文中,我们评估了不同规格下的结果是否相似。首先,我们重新估计横截面回归,包括替代协变量。其次,我们不使用横截面数据,而是使用面板并估计面板数据固定效应模型。简而言之,所有这些稳健性检查的结果与表4中的结果接近。首先,我们评估估计值是否对包括替代协变量敏感。表A.13给出了与表4相同的回归估计,但它不包括城市和语言固定效应,而是包括分层组假人(见第2节)。结果与表4(表4第1、3、5和7列)中无任何固定影响的结果相同。在表A.14中,我们重新估计了表4中的回归,包括作为协变量的治疗前平均编辑距离测量值。请注意,附加协变量的估计系数具有不稳定的迹象,并不总是具有统计意义。

26
能者818 在职认证  发表于 2022-6-14 06:13:58
但治疗对编辑距离影响的估计值与表4中的相似。表A.15显示了面板数据固定效应回归的估计值。这些结果与基于横截面数据的结果相似。据估计,治疗后第一年,封顶净编辑距离每月增加约18个字符,第二年每月增加23个字符。在接下来的几年中,它没有统计上的显著影响,系数非常小,表明每月的影响少于2个字符。综上所述,表4和A.13至A.15中的结果表明,治疗对原始编辑距离测量没有显著影响,仅在治疗后的头两年内,对限定编辑距离有较小的积极影响。5讨论与以往文献的比较。Aaltonen和Seiler(2016)以及Nagaraj(2017)研究了相同的问题,得出了两个相反的结论。Aaltonen和Seiler(2016)使用了维基百科的详细观察数据,发现页面越长,未来编辑越多。他们的模拟表明,由于正外部性,维基百科的内容几乎是没有的两倍,因此会产生巨大的累积效应。另一方面,Nagaraj(2017)使用了维基百科式地图服务中自然实验的准随机变量。他发现,从长远来看,初始内容较好的地区收到的捐款较少,产出质量较差(错误率高出约10%)。与这些论文不同的是,我们使用了随机现场实验的变异,这为因果影响提供了清晰的识别。我们的结果弥补了他们相反结论之间的差距。我们发现,内容的增加对随后内容的长期增长有着可忽略的影响。

27
nandehutu2022 在职认证  发表于 2022-6-14 06:14:01
然而,我们确实发现页面长度和编辑活动的小幅度和短期增长。准确地说,阿尔托宁(Aaltonen)和塞勒(Seiler)(2016)估计的系数意味着额外的10000个字符的文本会导致每周额外增加0.204个用户,这相当于通过治疗增加的2000个字符每月额外增加0.18个用户。我们对实验后前两年的估计值略小,约每月增加0.12个用户,我们发现没有显著的长期影响。此外,我们还发现,编辑活动的短期增长主要集中在处理增加的文本上。综上所述,我们的发现意味着,在一个变异来自随机实验的环境中,长期外部性可以忽略不计。我们想指出,结果的差异不仅可以通过鉴定方法的差异来解释,还可以通过研究环境中的细微差异来解释。在下文中,我们将重点介绍三个这样的差异。首先,维基百科是一个协作过程,不清楚最终产品应该是什么样子。每个贡献都可能向其他编辑发出特定主题重要性的信号。例如,目前尚不清楚哪些与罗马帝国相关的主题(由阿尔托宁(Aaltonen)和塞勒(Seiler)(2016)研究)足够重要,可以在维基百科中详细介绍。这样,捐款就变成了重要的“选票”。在MAPS(Nagaraj(2017)研究)的情况下,这种影响是缺失的,在这种情况下,最终输出在细节层次上应该或多或少是同质的。我们研究了具有标准化结构的城市网页,因此重要投票的影响应小于Aaltonen和Seiler(2016)的投票。

28
何人来此 在职认证  发表于 2022-6-14 06:14:04
未来的研究可以进一步探索用户产生的贡献是否也可以作为一个主题重要性的信号或投票。其次,在我们的环境中,与Nagaraj(2017)类似,添加的内容来自外部来源,而不是由社区本身生成。相反,在Altonen和Seiler(2016)的背景中,内容是由社区创建的。与现有用户自己生成的内容相比,来自外部来源的内容可能会产生不同的影响。第三,Nagaraj(2017)提出的解释负面提升的关键机制,在我们的案例中,添加的内容是从维基百科的其他语言版本翻译而来的。三元性是“所有权效应”,在维基百科中的作用不太突出。Nagaraj(2017)认为,在用户生成的地图上添加特定桥梁或街道的贡献者可能会觉得随着时间的推移更新这些对象更负责任。因此,添加更多种子信息的处理方式可能会通过不允许对象的所有权自然产生而得到支持。Aaltonen和Seiler(2016)以及我们的论文都关注维基百科中的文本内容,在维基百科中,所有权不太明确,因此我们预计添加内容的负面影响不会太明显。事实上,我们没有发现任何证据表明老用户(可能有主人翁意识)会改变他们的编辑行为,这表明所有权在维基百科编辑中的作用较小。在随机实验中看到未来关于内容所有权影响的研究会很有趣。启示。许多用户生成的内容平台使用旨在激励用户贡献新内容的管理干预。例如,在平台上植入初始内容,补偿用户的贡献,或者运行活动来帮助启动流程。

29
mingdashike22 在职认证  发表于 2022-6-14 06:14:07
是否应该使用此类策略取决于添加的内容是否会激发更多用户生成内容的螺旋上升,还是会阻碍未来的贡献。这是一个关键的管理决策,因为企业维基、档案或问答论坛都依赖于信息的有效提供。另一方面,此类干预措施成本高昂,需要投入其他地方无法投入的资源。因此,重要的是不仅要了解添加内容可能对后续贡献产生的任何可能外部性的方向,还要了解其大小。我们的发现具有明确的政策和管理含义。额外的含量对增长的累积影响可以忽略不计。因此,信息播种和激励贡献是一个直接的成本效益分析问题:如果且仅当创建内容的成本低于新内容对用户以及最终对平台的价值时,他们才会付出代价。通过外部性产生的额外成本或收益,阻碍或激励未来的贡献,可以忽略不计。局限性我们的分析得益于随机化带来的清晰识别,但仍面临局限性。第一个问题是我们结果的普遍性。正如上面的讨论已经指出的,维基百科的结果可能不会直接推广到其他用户生成的内容平台。平台之间的一个相关差异是贡献者个人利益的大小。在维基百科中,贡献者的个人利益可能小于开放地图或开源软件。

30
nandehutu2022 在职认证  发表于 2022-6-14 06:14:11
例如,开放地图的用户可以通过纠正地图上的错误直接获益,而维基百科中的错误不太可能产生任何个人后果。在本文中,我们使用页面长度、用户数量、编辑数量和编辑距离来衡量知识产出。相同的方法和数据可用于估计对其他度量的影响,例如,图像数量、外部或内部链接数量或主观质量度量。6结论在本文中,我们表明,添加内容对内容的后续长期增长影响可忽略不计。我们使用维基百科随机现场实验中的外源变量来确定因果效应。我们发现,这种将内容随机添加到维基百科页面的治疗方法对随后的长期增长影响微乎其微。我们确实发现一些证据表明,编辑活动在短期内有所增加,特别是在治疗后的头两年,编辑和新编辑的数量有所增加。然而,这些用户添加的内容量很小,他们的大多数编辑修改了通过处理添加的内容。我们的结果对一系列敏感性检查都是稳健的,包括横断面和面板数据固定效应框架中的替代协变量和分析。我们的发现有明确的政策和管理含义信息播种和激励内容创作不足以产生未来内容生成的有意义增长。然而,这些政策也不会适得其反,因为对未来捐款的阻碍作用也可以忽略不计。因此,这只是一个直接成本效益分析问题,即此类政策是否有效。参考Saaltonen,A.和S。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 11:31