楼主: mingdashike22
1381 26

[量化金融] 计算数据红利 [推广有奖]

21
何人来此 在职认证  发表于 2022-6-15 22:36:41
使用这些ah、bhand qa、b值,欧文值的一部分,例如我从C创建的分类决策,作为k-nn分类中的第k个示例,是^fm,i(x,y)=~O(a,b,a′,b′)| a+b+a′+b′=k-1和a+a′+I(yi=y)<kqa,b | Cm||厘米|- 1a′+b′-1.ama\'bmb′型(大众汽车- vn)+~O(a,b,a′,b′)| a+b+a′+b′=k-1和a+a′+I(yi=y)>kqa,b | Cm||厘米|- 1a′+b′-1.ama\'bmb′型(vc- vn)。证据在每个术语中,a是带l标签y的示例数,b是不带l标签y的示例数,由Cm之前的联盟贡献,a′和b′是在Cm中的示例中带和不带标签y的示例数,这些示例在示例inCm的排列中先于示例i。两个总和都需要k- 1示例在示例i之前要求a+b+a′+b′=k- 1、第一笔金额要求分类不正确(a+a′+I(yi=y)<k),且有价值术语vw- vn,从无决策到错误决策的净值。第二个和需要正确的分类(a+a′+I(yi=y)>k),并具有值项vc-vn,用于从无决策中创建正确决策的净值。在这两种情况下,sums、qa、bis是指除Cmcontributea之外的联盟纠正a和b错误投票的概率,| Cm |是指CMThat example i is In position k中示例排列的概率- (a+b),使其成为分类中的第k个示例,其他术语是(k- 1) - (a+b)=a′+b′示例1之前的示例是标签正确的a′,标签错误的b′。定理5.7。在标签为y的样本外输入x的分类中,Owen值(例如i in coalition Cmin)为:^fm,i(x,y)+^Дm,i(x,y)。证据组合引理5.5和5.6。Eric Bax 136讨论本pap提供了在数据提供商之间划分数据盈亏的方法。

22
mingdashike22 在职认证  发表于 2022-6-15 22:36:44
在未来,有必要扩大利益或损失的划分,以包括进行分析并根据分析采取行动以实现利益或损失的一方或多方。一种可能的方法是,在计算Shapley或Owen值时,将分析人员和管理员作为一个参与者或多个参与者加入到协议中。其他更为平淡的方法包括仅将Shapley或Owen值应用于“超额”利润,这可能是由数据提供商和分析人员/管理员之间的先验协议定义的,例如让每个用户为分析和管理支付固定的费用,然后,将剩余利润或损失分摊给数据提供商,类似于共同基金中支付给基金经理的费用。在这种情况下,出于计算数据红利的目的,决策产生的收益或损失应限于仅对超额利润有贡献的收益或损失部分。可以使用Shapley或Owen值计算每个决策对超额利润的贡献。在投资等共同竞争环境中,向多个决策者提供数据可能会降低数据对每个决策者的价值。相反,如果一个组织可以拒绝向其他组织提供数据,它可能会获得竞争优势。研究这种战略利益如何影响数据的估值和支付将是一件有趣的事情。例如,决策制定者应该在多大程度上重视独家访问数据?相反,对于某些应用程序,数据对于决策的边际价值可能会下降,因为使用有限的数据可以进行统计上显著的估计,然后更多的数据不太可能改变决策。

23
kedemingshi 在职认证  发表于 2022-6-15 22:36:47
因此,在确定rdata价格时,统计效率和竞争压力可能会相互平衡。随着数据的付费,产生了生成虚假或重复数据的动机,可能会有细微的变化以避免被检测到。因此,为数据付费可能会促使需要进行数据验证。这一点很重要,不仅可以避免向提供此类数据的人支付过高的费用,还可以避免因此做出不理想的决策。最后,对于某些组织或某些职能部门来说,一些人的数据可能比其他人的数据更有价值。例如,关于一个人的数据,其消费行为表明一个大集团的哪些产品正在增加销售额,这可能比关于一个人的数据更有用。然而,可能有更多的人有共同的消费习惯,这使得有关他们的数据更少。在这两种情况下,代表消费更多群体的人似乎拥有更有价值的数据。因此,根据数据价值付费可能会加剧不平等。(有关moreon大数据和不平等的信息,请参阅[28]。)更多保护隐私的人群贡献的数据可能会更少,而付费购买数据可能会加剧这种情况。为了获得具有代表性的样本,可能有必要向这些群体的人支付更多的费用,以获取他们的数据。这将有助于减少数据分析和基于数据的决策中的某些形式的偏差。(有关偏见和网络的更多信息,请参阅[6]。)Eric Bax 14参考文献[1]2015。冰岛来信。自然遗传学47(28 04 2015),425 EP–。https://doi.org/10.1038/ng.3277[2] 2016. 欧洲议会和理事会条例(EU)2016/679。《欧盟官方杂志》(2016年)。[3] A.Agresti和B.A.Coull。对于二项比例的区间估计,近似优于精确。

24
何人来此 在职认证  发表于 2022-6-15 22:36:51
美国统计学家52(1998),119AS126。[4] 阿里·阿莱萨和米阿德·法齐波尔。2018年,通过社交网站进行的影响检测和预测回顾。理论生物学和医学建模15,1(0 2 2 0 18),2;2–2. https://doi.org/10.1186/s12976-017-0074-5[5] Angel Au-Yeng。2019年,加州想要复制阿拉斯加,并向人们支付数据红利。现实吗?福布斯。2019年2月14日(2019年)。[6] 里卡多·贝扎·耶茨。2018年,网络上的偏见。公社。ACM 61,6(2018),54–61。[7] L.D.Brown、T.T.Cai和A.DasGupta。[n.d.]。([n.d.])。[8] C.J.Clopper和E.S.Pe纵火案。二项式中所示的信心或资本限额的使用。26 (1934), 404^aAS413.[9] T.M.盖。最近邻法的收敛速度。在《夏威夷系统科学国际会议记录》中,B.K.Kinariwala和F.F.Kuo(编辑)。夏威夷大学出版社,413–415。[10] T.M.盖和P.E.哈特。1967年。最近邻模式分类。IEEE信息论学报13(1967),21–27。[11] L.Devroye、L.Gyrfi和G.Lugosi。模式再认识的概率理论。斯普林格。[12] L.Devroye和T.Wagner。197 9. 删除和保留估计的无分布不等式。IEEE TransactionsonInformation Theory 25(1979),202–207。[13] R·O·杜达、P·E·哈特和D·G·斯托克。2001。图案分类。威利。[14] 弗朗西斯科·达穆里和朱里·马库奇。2017年,谷歌搜索在预测美国失业方面的预测能力。《国际预测杂志》33,4(2017),801–816。https://doi.org/10.1016/j.ijforecast.2017.03.004[15] S.Sunna Ebenesersdóttir、Marcela Sandoval Velasco、Ellen D.Gunnarsdóttir、Anuradha Jagadeesan、ValdíS B.Gudmundsdóttir、Elisabet L.Thordardóttir、Margrét S.Einarsdóttir、Kristjan H.S。

25
能者818 在职认证  发表于 2022-6-15 22:36:55
摩尔、斯盖尔·西格松、德洛佩格·N.Magnúsdóttir、Hákon Jónson、施泰农·斯诺拉多蒂尔、埃文德·霍维格、帕尔·莫勒、英格丽德·科克姆、托马斯·奥尔森、拉尔斯·阿尔弗雷德松、托马斯·汉森、托马斯·韦尔奇、詹皮罗·卡瓦莱里、埃德蒙·吉尔伯特、卡洛斯·拉卢扎福克斯、乔·沃尔瑟、施泰农·克里斯托蒂尔、希亚姆·戈帕拉克里希南、莉亚193;rnadóttir,'OlafurTh。马格努松、托马斯·吉尔伯特、卡里·斯特芬森和阿格纳·赫尔加松。2018年,来自冰岛的古代基因组揭示了人类的构成。《科学》360,6392(201 8),1028–1032。https://doi.org/10.1126/science.aar2625arXiv:http://science.sciencemag.org/content/360/6392/1028.full.pdf[16] B.Edelman、M.Ostrovsky和M.Schwarz。2007年,互联网广告和广义二价拍卖:卖出价值数十亿美元的关键词。《美国经济评论》97,1(2007年3月),242–259。[17] Daniel F Gudbjartson、Hannes Helgason、Sigurjon A Gudjonson、Florian Zink、Asmundur Oddson、Arnaldur Gylfason、Soren Besenbacher、Gisli Magnusson、Bjarni V Halldorsson、Eirikur Hjartarson、Gunnar Th Sigurdsson、Simon NStacey、Michael L Frige、Hilma Holm、Jona Saemundsdottir、Hafdis Th Helgadottir、Hrefna Johnsdottir、Gunlaugur Sigfusson、Gudmundur Thorgeirsson、Jon Therrisson、,Solveig Gretarsdottir、G Bragi Walters、Thorun Rafnar、Bjarni Thjodleifsson、Einar S Bjornsson、Sigurdur Olafsson、Hildur Thorarinsd ottir、Thora Steingrimsdottir、Thora Sgudmundsddottir、Asgeir Theodors、Jon G Jonasson、Asgeir Sigurdsson、Gyda Bjornsdottir、Jon J Jonsson、Olafur Thorarensen、P etur Ludvigsson、Hakon Gudbjartson、Gudmundur I Eyjolfsson、O lof Sigurdardottir、Isleifur奥拉夫森,David O Arnar、Olafur Th Magnusson、Augustine Kong、Gisli Masson、Unnur Thorsteinsd ottir、Agnar Helgason、Patrick Sulem和Kari Stef ansson。2015年,冰岛人口大规模全基因组测序。《自然遗传学》47(2015年3月25日),435 EP–。

26
kedemingshi 在职认证  发表于 2022-6-15 22:36:58
https://doi.org/10.1038/ng.3247[18] 丽贝卡·海勒斯坦和我没有米德尔多普。2012年,使用互联网搜索数据进行预测。自由街经济学(2012)。https://libErtystreeteeconomics。纽约联邦储备银行。org/2012/01/forecasting-w,互联网搜索数据。html【19】Sharpe JD、Hopkins RS、Cook RL和Striley CW。2016年。使用贝叶斯变化点分析评估谷歌、推特和维基百科作为流感监测工具:比较分析。JMIR公共卫生监督。2, 2 (2016) .[20] Farshad Kooti、Mihajlo Grbovic、Luca Maria Aie llo、Eric Bax和Kristina Lerman。2017年,《iPh one的数字市场:大消费人群的特征》。第十届ACM国际网络搜索和数据挖掘联合会(WSDM’17)会议记录。ACM,美国纽约州纽约市,13–21日。https://doi.org/10.1145/3018661.3018697[21]法沙德·库蒂、米哈杰洛·格博维奇、卢卡·玛丽亚·艾略、内曼贾·朱里、弗拉丹·拉多萨夫列维奇和克里斯蒂娜·勒曼。2017年,优步共享乘车经济分析。《第26届万维网伙伴国际会议记录》(W WW’17 Companion)。国际万维网会议指导委员会,瑞士日内瓦共和国和坎托诺州,574-582。https://doi.org/10.1145/3041021.3054194【22】维贾伊·克里希纳。2002年,《拍卖理论》。学术出版社。埃里克·巴克斯15【23】乔纳森·莱文。2011年,《互联网市场经济学》。讨论文件10-018。斯坦福大学经济政策研究所。http://ideas.repec.org/p/sip/dpaper/10-018.html约翰·麦克米兰。《重塑集市:市场的自然历史》。诺顿公司。【25】P.R.米尔格罗姆。2004年,将拍卖理论付诸实践。剑桥大学出版社。【26】诺姆·尼桑、蒂姆·劳夫加登、伊娃·塔多斯和维杰伊·瓦齐拉尼。2007.算法博弈论。剑桥大学出版社,纽约,纽约,美国[27]Irem Onder和Ulrich Gunter。2015

27
可人4 在职认证  发表于 2022-6-15 22:37:02
利用谷歌趋势预测欧洲主要城市的旅游需求。旅游分析21(01 201 5),203–220。https://doi.org/10.3727/108354216X1455923 3984773[28]凯西·奥尼尔。2016年,《数学毁灭的武器:大数据如何加剧不平等并威胁民主》。皇冠出版集团,美国纽约州纽约市[29]G.欧文。1977.具有先验结合的游戏的价值。(1977), 76^aAS88.[30]凯蒂·M·帕尔默。2015年。为什么冰岛是世界上最大的基因实验室。有线。com(2015)。https://www.有线。com/2015/03/冰岛世界上最大的基因实验室/[31]大卫·拉姆利。2018年,苹果公司的蒂姆·库克(TimCookCal)提出了更多关于数据隐私的规定。彭博社。c om(2018)。https://www.bloomberg。com/news/articles/2018-03-24/apple-s-tim-cook-calls-for-more-regulations-on-data-privacy[32]瓦伦汀·罗戈夫斯基。2018年。公司如何在FinTech市场使用替代数据和AI。Intellias。com(2018)。https://www.intellias公司。com/arti-ficial intelligence predicts-金融市场/【33】T.D.Ross。20 03. 二项比例和泊松率估计的准确置信区间。《生物与医学计算机》33(2003),509-531。【34】劳埃德·S·夏普利。1953年,n人游戏的值。数学研究年鉴28(1953),30 7–317。亚伯拉罕·托马斯。2016年。用于预测亚马逊和优步收入的电子邮件收据。Quandl公司。com(2016)。https://blog.quandl.com/alternative-data-action-email-receipts亚伯拉罕·托马斯。2016年,电子邮件收入如何预测GoPro的第三季度收益。Quandl公司。com(2 0 16)。https://blog.quandl.com/email-receipts-predicted-gopros-q3-earnings【37】H.R.瓦里安。2009年,在线广告拍卖。《美国经济评论》99,2(2009),430–434。[38]E.B.威尔逊。概率推理、继承定律和统计推理。J、 美国。统计学家。Assoc.22(1927),209–212。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-29 09:18