楼主: 大多数88
1562 29

[量化金融] 维基百科和数字货币:集体注意力之间的相互作用 [推广有奖]

11
能者818 在职认证  发表于 2022-6-11 16:33:28
而在一开始,编辑们更多地关注新内容,随着页面的老化,更多的工作致力于打击故意破坏和错误信息(维护工作)[43,49]。我们通过查看“恢复”、恢复页面以前版本的编辑以及报告故意破坏的编辑数量来量化维护工作。我们发现,回复占所有编辑的18.2%,平均而言,它们占加密货币页面贡献的15.4%±4.3%。回复部分在时间上是稳定的(见图5-A)。加密货币(Cryptocurrencypages)的回复率高于维基百科中的平均页面(2016年末编辑量的8%[50]),这表明围绕其内容存在更多争议。只有0.5%的编辑被报告为故意破坏行为,自2011年年中以来,其发生时间一直保持不变(见图5-A)。与其他页面相比,完善的加密货币页面较少受到维护编辑(见图5-C)。从比特币派生出来的加密货币页面,如比特币现金、比特币私人和比特币黄金,是许多争论的来源[51],导致大量维护编辑(见图4:编辑历史的示例。(a)比特币两个连续编辑之间的事件间时间分布(带填充圆圈的线条)和破折号(带白色圆圈的线条)。虚线为幂律函数(P(x)~ x个-β) 比特币和破折号的指数分别为β=2.75和β=1.73。对于比特币(B)和破折号(C)5-B),编辑器显示为随时间变化的垂直黑线。图5:还原和故意破坏修订。(A) 随着时间的推移,“还原”编辑(带完整圆圈的线条)和报告为故意破坏的编辑(带白色圆圈的线条)的比例。使用一年的时间窗口聚合值。

12
kedemingshi 在职认证  发表于 2022-6-11 16:33:32
B-C)前10大货币的还原(B)和破坏(C)编辑分数,分别按还原和破坏编辑的数量排序。编辑人员的角色我们的数据集包括~ 6170名编辑贡献了~ 总共有29000次编辑。尽管每年新编辑的数量有所增加(见图6-B和附录A.6),但编辑的数量自2006年以来总体上有所增加。仅在2017年,创建了10个新的加密货币页面,~ 1200名新编辑加入。有趣的是,这种增长并不是维基百科上所有页面的特征。例如,在[52]中,作者指出,医学相关文章的编辑人数一直在减少。图6:维基百科编辑的贡献分布不均。(A) 2005年至2018年期间,编辑的分数为编辑的r级(红色实线)。虚线是幂律函数(P(r)~ r-β) 指数β=1.01±0.003。(B) 参与加密货币页面的编辑器数。使用一年时间窗口聚合值。(C) 基于编辑贡献的维基百科页面数量的编辑直方图。正如我们通过根据编辑数量对编辑进行排名发现的那样,编辑活动是非均匀分布的(见图6-A)。事实上,编辑的等级r和编辑分数之间的关系可以用幂律分布(P(r))来描述~ r-β) 式中,β=1.01。这一结果与维基百科[53]中普遍观察到的结果一致,且随时间变化一致,β值介于0.84和0.95之间(见附录A.5)。特别是,最活跃的编辑器独自负责~ 10%的编辑(有关最活跃的编辑器的更多详细信息,请参见附录A.7),仅~ 9.6%的编辑(596人)至少编辑了2页(图6-C)。

13
能者818 在职认证  发表于 2022-6-11 16:33:35
该组负责所有加密货币维基百科页面总编辑数的50%。然后,我们研究了编辑活动在时间上的演变。我们根据2019年1月研究结束时编辑的总数将编辑分为四组(见图7):编辑次数超过或等于500次的投稿人(6名编辑,占编辑总数的23%),编辑次数为100至500次的投稿人(23名编辑,占编辑总数的15%),编辑次数为20至100次的投稿人(142名编辑,占编辑总数的19%),编辑次数少于20次的编辑(97%的编辑负责43%的编辑)。我们发现,与维基百科上普遍观察到的情况相比,一个群体的累积活动越高,他们最近开始编辑页面(见图7)。值得注意的是,最活跃的贡献者小组于2012年8月开始编辑,这是比特币页面创建三年后的事。此外,图8显示,编辑次数最多的编辑负责在编辑字数方面做出最广泛的贡献。然而,他们的一些编辑可能是为了维护。通过根据编辑在整个研究期间的总人数按降序排列编辑,我们发现,对于前10位贡献者,维护编辑占其编辑的20%。平均而言,~ 前250名编辑撰写的编辑中有18%是维护工作(见图9-A)。该值在不同等级组之间是一致的。最后,平均而言,排名靠前的编辑倾向于在多个页面上发表意见(见图9-B)~ 4页。图7:每个组的活动编辑器。从2005年到2018年,每个群体的活跃编辑人数。使用一年的时间窗口计算结果。

14
kedemingshi 在职认证  发表于 2022-6-11 16:33:38
根据编辑总数,编辑分为四组:超过500次编辑(蓝线)、100到500次编辑(紫线)、20到100次编辑(绿线)、少于20次编辑(红线)。2019年1月23日,编辑根据其总贡献进行分类,然后追溯。图8:不同群体中编辑的活动。每个编辑器的平均字数。所有结果都是在2005年8月至2019年1月期间180天的时间窗口内计算的。这四条线代表四组编辑:贡献超过500个总编辑数(蓝线)、100到500个编辑数(紫线)、20到100个编辑数(绿线)、少于20个编辑数(红线)。图9:编辑的重点。编辑器根据总编辑数按降序排列,并根据其排名分组。(A) 每个等级组的维护编辑分数。(B) 每个排名组的平均贡献页面数。只考虑具有多个编辑的编辑器。为了了解加密货币维基百科(cryptocurrencyWikipedia)页面顶级编辑的一般兴趣和专业化,我们重点关注6位编辑的子集,每个编辑至少贡献了500次编辑。考虑到他们对整个维基百科的贡献,我们详细研究了他们的兴趣。我们的结果表明,这些编辑器的主要兴趣是加密货币和区块链(见图10)。当我们将分析扩展到前29位编辑时,结果是一致的,他们负责37%的编辑。顶级编辑也会在其他非加密货币相关的页面上发表文章,然而,这些页面的同质性较差,包括一些不同的兴趣爱好,如;转基因食品、音乐家和汽车公司。图10:前6位加密货币页面编辑器的活动。(A) 排名前15位的页面由众多的编辑编撰。

15
nandehutu2022 在职认证  发表于 2022-6-11 16:33:41
x轴显示在其顶级编辑页面中包含此页面的顶级编辑的数量。注意,这里我们只考虑每个编辑器的前10页。(B) 按编辑次数排列的前15页。X轴显示每页的编辑总数。获得了6个最活跃编辑器的子集的结果。我们进一步研究了共同编辑的维基百科页面网络。我们构造了一个无向权重图,其中节点是Wikipedia页面,如果两个节点至少有一个公共编辑器,则它们之间存在一条边,链接权重对应于公共编辑器的数量。截至2014年7月底,网络有13个节点(见图11-B),平均节点加权度为hsi=78.3,共有2691个编辑器。加权程度是非均匀分布的:比特币的强度最大,sBT C=207,而最近引入的节点(Dash、Auroracoin和Nxt)的加权程度最低。这些属性在时间上持续存在(见图11-C和11-D),并且Acryptoccurrency页面年龄与其网络加权程度呈正相关(Pearson相关性ρ=0.40,p=0.015,见附录A7)。

16
nandehutu2022 在职认证  发表于 2022-6-11 16:33:44
比特币在所考虑的整个领域中具有最高程度的中心地位(见附录A6)。比特币名称CoinpeercoinRipplePrimeCoin(a)前八年RororacoinBitCoinDashDogeCoinThereumLiteConMazacoinMoneronNameCoinNxtPeerCoinPotCoinPrimeCoinRippletConvertConnemStellar(b)自第一页AuroracoinBitCoinDashDogeCoinGridCoinMazacoinMoneronMemonemNameCoinMazacoinMoneronXperCoinPotCoinPrimeCoinRippletConvertConvertConvertConnemStellar(b)十年前ClassicNuBitsWaves platformZcash(c)自第一页AuroraCoinBitcoinBitcoinBitcoin现金比特币GoldBitcoin PrivateBitconnectCardAnodashDecredDogeCoineosethereum ClassicFileGridCoinLiteComazacoinMoneronemNeonameCoinUbitsnXTOMISEGeopercoinPetropotCoinPrimeCoinPrimeRippleStellartetherTitcoinVechaInvergeCoinWaves platformzCashteztos(d)整个研究期间见图11:加密货币页面网络的演变。节点表示Wikipedia页面,如果两个节点至少有一个公共编辑器,则两个节点之间存在边缘。节点的半径与传入链接的权重之和成比例,边厚度与edgeweight成比例,以常用编辑器的数量衡量。该网络在不同时间段进行聚合:(A)从2005年7月到2013年7月,(B)从2005年7月到2015年7月,(C)从2005年到2017年7月,(D)整个研究期间。网络中出现了一个巨大的组件(见图11),这意味着当我们分析其在大时间窗口下的演化时,每个节点都与分配节点相连(~ 年)。相反,如果考虑每周时间窗口,我们会发现网络已断开连接(见图12)。通常,新页面由新的编辑器创建。

17
何人来此 在职认证  发表于 2022-6-11 16:33:49
平均而言,新页面在创建后的5.2周内连接到这个巨大的组件(见图12),在大多数情况下,这要感谢有经验的编辑贡献了新创建的页面。图12:维基百科网络演变的短期动态。累计新节点数(虚线)和网络组件总数(实线)。使用1周的时间窗口对值进行聚合。基于Wikipedia Attention的投资策略加密货币市场的属性与Wikipedia上的交易之间的关联表明,后者有助于制定成功的投资策略。我们通过测试一种基于维基百科的策略来研究这种可能性,该策略类似于[16,17]中提出的股票市场投资策略。对于给定的页面和给定的日期t,维基百科的投资策略依赖于差异n(t)=v(t)- v(t- 1) 在第t天的页面浏览量v(t)和浏览量v(t)之间- 1) at t时- 1、根据策略,如果n(t)>0,投资者在时间t+1出售资产(价格p(t+1)),然后在时间t+2购买资产(价格p(t+2))。这种交易头寸正式称为空头头寸。另一方面,如果n(t)≤ 0投资者在时间t+1(价格p(t+1))买入,在时间t+2(价格p(t+2))卖出,即多头头寸。该策略背后的直觉是,如果注意力和信息收集一直在增加,价格就会下降,反之亦然【16,56】。我们考虑的是维基百科的浏览量,而不是编辑量,因为后者每天都没有变化(编辑之间的平均间隔时间是10.12天)。考虑到更长的时间,加密货币的价格波动将被忽略【57】。我们还考虑了两种基线策略。第一种是基于价格差异p(t)=p(t)-p(t-1) 而不是页面浏览量的差异n(t)[33]。

18
何人来此 在职认证  发表于 2022-6-11 16:33:52
在所有其他方面,它都与基于维基百科的策略相同。这将允许我们测试在相同条件下哪个指标(价格或维基百科页面浏览量)具有更好的预测能力。第一个基线策略背后的基本原理是,如果价格一直在上涨,就会出现下跌,反之亦然。作为第二条基线,我们选择了一种随机策略,在每次t时,人们选择以50%的概率购买或出售资产【16】。通过计算累积收益率R来评估不同策略的绩效,其定义为根据拟定策略获得的对数收益的总和。什么时候n(t)>0对数返回值计算为对数(p(t+1))- log(p(t+2)),而在相反的情况下,log返回的是log(p(t+2))-对数(p(t+1))。使用对数收益率的动机是便于计算空头和多头头寸,因为我们正在考虑多期收益率[58]。我们根据17种加密货币的基线测试了基于维基百科的策略,这些加密货币有维基百科页面,可以进行小额交易(见附录A.2中具有保证金交易支持的交易所列表)。保证金交易是一种从经纪人处借入资金来交易金融资产的做法,这种交易依赖于出售自己尚未拥有的资产。我们发现,考虑到2015年7月至2018年1月期间,基于维基百科的策略优于两种基线策略(见图13-A)。平均而言,根据基于维基百科的策略获得的回报为hrwi=0.62±0.42,而平均回报为随机策略,即hrri=-0.15 ± 0.13. (见图13-B)。在Kolomogorov-Smirnov检验下,两种策略下获得的收益分布存在显著差异,p 0.05.

19
大多数88 在职认证  发表于 2022-6-11 16:33:55
与维基百科策略相比,pricebaseline策略的平均回报率更低(hrpi=0.16±0.36)。更仔细的检查表明,加密货币之间在平均回报方面存在着一致的差异(见图14),有些甚至产生了总体负回报。基于维基百科的策略产生了~ 以太坊经典版为300%,但对于其他货币,包括Ripple和以太坊,基于维基百科的投资会导致负回报。观察到的差异可能由dailyprice变化与维基百科观点之间的相关性来解释。相反,我们观察到,虽然基于维基百科的策略对比特币有效,但对Dash无效,但对于这两种货币,每日价格变化和维基百科浏览量分别为0.1和0.18之间存在正相关关系(见图A1)。然而,我们建议的图13:基于维基百科的投资策略优于基线。(A) 使用三种投资策略获得的累积回报:基于维基百科的策略(橙色线)、基于价格的基线策略(蓝线)和随机策略(灰线)。(B) 使用基于维基百科的策略(橙色线)、基于价格的基线策略(蓝色线)和随机策略(灰色线)获得的每日收益分布。平均回报率为hrwi=0.62±0.42(橙色虚线),hrpi=0.16±0.36(蓝色虚线),hrri=-基于维基百科的策略、基于价格的基线和随机策略分别为0.15±0.13(灰色虚线)。数据显示使用核密度估计,高斯核和带宽使用Silverman经验法则计算。

20
kedemingshi 在职认证  发表于 2022-6-11 16:33:58
随机策略的数据来自1000个独立的实现。所有结果均显示了2015年7月至2019年1月期间所有加密货币的投资结果,这些加密货币可进行少量合并交易。当维基百科页面浏览量增加时,这种策略并不仅仅是购买加密货币。为了使用我们提出的策略获得正回报,在时间t增加视图数量之后,应在第二天t+1提高价格,在t+2后降低价格。如果在时间t时视图数量减少,随后在时间t+1时价格下降,在时间t+2时价格上升,则也会出现正回报。最后,我们研究了投资期开始和结束时间的作用(见图15)。我们发现,对于大多数选择,基于维基百科的策略具有比随机策略更高的累积回报。在截至2018年1月之前的大多数时期,其表现优于价格基线。2018年1月后的这一变化可归因于2018年1月后市场发生了意外转变,造成了4000多亿美元的损失。图14:不同加密货币策略的性能。对于所考虑的16种加密货币,在基于维基百科的策略(A)、基于价格的基线策略(B)和随机策略(C)之后,整个投资期间的累计回报率。结论与讨论在本文中,我们调查了维基百科数字货币信息的生产和消费与其市场绩效之间的相互作用。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 17:02