楼主: 能者818
713 21

[经济学] 大流行期间奥运奖牌分布的预测 [推广有奖]

  • 0关注
  • 6粉丝

会员

学术权威

79%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
34.9698
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24952 点
帖子
4198
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Forecasting the Olympic medal distribution during a pandemic: a
  socio-economic machine learning model》
---
作者:
Christoph Schlembach, Sascha L. Schmidt, Dominik Schreyer, Linus
  Wunderlich
---
最新提交年份:
2021
---
英文摘要:
  Forecasting the number of Olympic medals for each nation is highly relevant for different stakeholders: Ex ante, sports betting companies can determine the odds while sponsors and media companies can allocate their resources to promising teams. Ex post, sports politicians and managers can benchmark the performance of their teams and evaluate the drivers of success. To significantly increase the Olympic medal forecasting accuracy, we apply machine learning, more specifically a two-staged Random Forest, thus outperforming more traditional na\\\"ive forecast for three previous Olympics held between 2008 and 2016 for the first time. Regarding the Tokyo 2020 Games in 2021, our model suggests that the United States will lead the Olympic medal table, winning 120 medals, followed by China (87) and Great Britain (74). Intriguingly, we predict that the current COVID-19 pandemic will not significantly alter the medal count as all countries suffer from the pandemic to some extent (data inherent) and limited historical data points on comparable diseases (model inherent).
---
中文摘要:
预测每个国家的奥运奖牌数量与不同的利益相关者高度相关:事先,体育博彩公司可以确定赔率,而赞助商和媒体公司可以将其资源分配给有前途的团队。事后,体育从政者和管理者可以衡量他们团队的表现,评估成功的驱动因素。为了显著提高奥运奖牌预测的准确性,我们采用了机器学习,更具体地说是两阶段随机森林,因此,在2008到2016年间首次举办了三届奥运会的传统预测,在2021年的2020届东京奥运会上,我们的模型表明,美国将获得奥运奖牌榜,获得120枚奖牌,紧随其后的是中国(87)和大不列颠(74)。有趣的是,2019冠状病毒疾病的流行不会显著改变奖牌总数,因为所有国家在某种程度上都遭受了流行病(数据固有的)和有限的历史数据点(类似的疾病)。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Economics        经济学
二级分类:Econometrics        计量经济学
分类描述:Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论,微观计量经济学,宏观计量经济学,通过新方法发现的经济关系的实证内容,统计推论应用于经济数据的方法论方面。
--
一级分类:Statistics        统计学
二级分类:Computation        计算
分类描述:Algorithms, Simulation, Visualization
算法、模拟、可视化
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Forecasting_the_Olympic_medal_distribution_during_a_pandemic:_a_socio-economic_m.pdf (571.59 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:奥运奖牌 econometrics distribution Stakeholders Applications

沙发
大多数88 在职认证  发表于 2022-4-26 12:36:15 |只看作者 |坛友微信交流群
预测大流行期间的奥运奖牌分布:社会经济机器学习模型Christoph Schlembach、Sascha L.Schmidt、Dominik Schreyer和Linus Wunderlich*第一个版本:2020年12月9日第二个版本:2021年6月21日摘要预测每个国家的奥运奖牌数量与不同的参赛者高度相关:事先,体育博彩公司可以确定赔率,而赞助商和媒体公司可以将其资源分配给有前途的球队。事后,体育政治家和管理者可以衡量他们团队的表现,评估成功的驱动因素。为了显著提高奥运会奖牌预测的准确性,我们采用了机器学习,更具体地说是两阶段随机森林,从而首次超越了2008年至2016年举行的前三届奥运会的传统天真预测。关于2021的东京2020奥运会,我们的模型表明,美国将领先奥运奖牌榜,赢得120枚奖牌,紧随其后的是中国(87)和大不列颠(74)。关键词:奥运会、奖牌、体育、预测、机器学习、随机森林JEL:C53;Z20跑步负责人:预测奥运奖牌分布*施伦巴赫:WHU–奥托贝希姆管理学院,德国杜塞尔多夫Erkrather Str.224a,40233(电子邮件:christoph。schlembach@whu.edu); 施密特:WHU——德国杜塞尔多夫Erkrather Str.224a,40233号奥托·贝希姆管理学院,CREMA——瑞士经济、管理和艺术研究中心,LISH——哈佛大学创新科学实验室,美国波士顿哈佛街1350号北175室,邮编:MA02134(电子邮件:sascha)。schmidt@whu.edu);  施雷耶:WHU–奥托贝希姆管理学院,Erkrather街。

使用道具

藤椅
能者818 在职认证  发表于 2022-4-26 12:36:22 |只看作者 |坛友微信交流群
224a,40233,杜塞尔多夫,德国(电子邮件:多米尼克。schreyer@whu.edu); Wunderlich:伦敦玛丽女王大学数学科学学院,伦敦E1 4NS英里端路(电子邮件:l。wunderlich@qmul.ac.uk).1. 引言基于社会经济指标的预测在学术界有着悠久的传统,尤其是在社会科学领域。正如约翰斯顿(1970年,第184页)早些时候指出的那样,验证相关的“社会计划(从经验上)可能有助于制定适当的政策或计划,从而避免陷阱,否则会减少或消除我们的行动自由。”因此,从那以后,人们一直在努力预测未来,在经济学(Modis,2013年)、公共卫生(Puertas等人,2020年)、土木工程(Kankala等人,2011年)、生态学(Behrang等人,2011年)或城市规划(Beigl等人,2004年)等领域堪称典范。特别是在经济文献中,准确预测奥运会表现在过去几十年中获得了相当大的研究兴趣(参见利兹,2019年),主要是因为这种预测,通常是奖牌预测,对于为政府及其公民提供一个基准是必要的,他们可以根据这个基准来评估国家的奥运会成功。对于一个经常大量投资于运动员训练项目以提高一个国家奥运会成功可能性的政府来说(参见Humphreys等人,2018年),这样的评估是全面的,因为它可以让他们更好地了解向国家奥委会(NOC)申请资金(即纳税人的资金)是否有成效。例如,像奥运会这样的重大体育赛事往往会增加公民的民族自豪感(参见。

使用道具

板凳
能者818 在职认证  发表于 2022-4-26 12:36:28 |只看作者 |坛友微信交流群
鲍尔,1972年;格里姆斯等人,1974年;艾莉森和蒙宁顿,2002年;霍夫曼等人,2002年;Tcha和Pershin,2003),以及他们开始从事体育活动的意愿(参见Girginov和Hills,2013;Weed等人,2015),因此,通过降低长期医疗成本,如果他们的国家奥委会达到(或超过)奖牌预测,政府可能愿意筹集资金。相比之下,由于奥运会的成功是众所周知的公民支持政府精英运动员培训项目的意愿的体现(Humphreys等人,2018),因此落后于预测可能会促使政府增加对国家奥委会的压力,尤其是通过减少未来的资金。同样,准确预测奥运会的成功与许多非政府的不同利益相关者密切相关。例如,体育博彩公司依靠精确的估计来确定赔率,而媒体和奥运会赞助商都必须将他们的资源分配给有前途的球队和他们的运动员。因此,从心理学角度分析奥运会已经成为一个相关的研究领域,其重点是预测(如DeBosscher等人,2006年)和预测(如Streicher等人,2020年)。自1972年鲍尔首次撰稿以来,这种奥运会预测的质量有了显著提高,原因有二。首先,那些对预测一个国家的独特成功感兴趣的作者已经陆续开始采用新的评估技术。第二,随着在该领域工作的作者探索多样化、越来越广泛的数据集,模型的预测能力逐渐增强。自从Ball(1972)开创了基于相关性的评分模型以来,预测模型不断变得更加复杂。

使用道具

报纸
可人4 在职认证  发表于 2022-4-26 12:36:33 |只看作者 |坛友微信交流群
最初,正如我们在附录表A1中所示,大多数作者提到了普通最小二乘回归(OLS)的使用,因为它提供了易于解释的结果(例如Baimbridge,1998年;Condon等人,1999年;Kuperand Sterken,2001年)。然而,在预测奥运会奖牌时,一个重大的挑战是正确地反映出许多没有获得奖牌的国家。由于无组织的贡献函数会惩罚预测的少量奖牌,因此一些作者(如Lui and Suen,2008;Leeds and Leeds,2012;Blais Morisset al.,2017)转而使用基于泊松的模型(即泊松模型,负二项模型)来解决这一方法学问题。然而,直到今天,由于因变量(通常是奖牌数量)被感知,大多数作者都使用托比特回归来预测奥运会的成功(例如,Tchaand Pershin,2003年;Forrest等人,2015年;Rewilak,2021年)。直到最近,采用两步法,即在确定成功奖牌的确切数量之前估计赢得任何奖牌的概率,才变得更受欢迎。特别是,Scelles等人(2020年)和andRewilak(2021年)都对Tobit模型进行了Mundlak变换,再次提高了各自的障碍模型的预测精度。相比之下,其他作者,例如Hoffmann等人(2002年),通过将他们的样本分成过去曾获得或未获得任何奖牌的国家,绕过了潜在的方法学问题,而很少有作者采用替代方法学方法。然而,尽管有这些方法上的改进,一个天真的预测仍然比以前所有的预测方法都要好。与此类似,在过去几年中,作者通过三种方式显著增加了用于奖牌预测的数据集。

使用道具

地板
mingdashike22 在职认证  发表于 2022-4-26 12:36:40 |只看作者 |坛友微信交流群
首先,通过提高国家具体情况的颗粒度水平;第二,包括更多年;第三,通过探索额外的自变量。作为整合更精细数据从而提高预测准确性的常用方法,一些作者考虑通过关注不同的体育项目来预测奥运会的成功(例如,Tcha和Pershin,2003年;Noland和Stahler,2016a;Vagenas和Palaiothodorou,2019年),有时甚至探索运动员个人水平的数据(Condon等人,1999年;Johnson和Ali,2004年)。由于性别研究的相关性越来越高,其他作者已经开始按性别区分他们的数据集(利兹和利兹,2012年;洛文等人,2016年;诺兰和斯塔勒,2016b)。值得注意的是,这两种方法对于回答非常具体的问题都非常重要。然而,相比之下,宏观层面的模型具有“平均个人比赛中固有的随机成分的优势[导致]更准确地预测国家奖牌总数”(Bernard and Busse,2004,第413页)。因此,宏观分析仍然是奥运奖牌预测中常用的方法。另一种可能提高预测精度的方法是扩展数据集的时间维度。因此,一些作者在他们的模型中加入了100多年的奥运会经验(例如Baimbridge,1998年;Kuper和Sterken,2001年;TrivediFor,Condon等人(1999年)在一次奥运会上使用了神经网络)。其他作者使用(单步)二元回归模型(Probit,Logit),同时使用更精细的数据(Johnson和Ali,2004;Andreff等人,2008;Noland和Stahler,2016b)。和Zimmer,2014)。然而,最近,大多数作者似乎出于三个原因限制了调查后事件的数量。

使用道具

7
可人4 在职认证  发表于 2022-4-26 12:36:46 |只看作者 |坛友微信交流群
首先,诸如“1980年莫斯科奥运会和1984年洛杉矶奥运会上发生的大规模抵制”(Noland and Stahler,2016b,第178页)和“东德兴奋剂项目(该项目)负责17%的女运动员主题奖”(Noland and Stahler,2016b,第178页)等具体事件扭曲了过去的主题奖计数。第二,边境转移,尤其是在两次世界大战和苏联解体的过程中;直到20世纪90年代以来,各国才保持相对稳定(Forrest等人,2017年)。第三,变量的重要性随着时间的推移而变化,例如,在国际旅行已成为我们日常生活的一部分的时代,潜在的宿主效应可能会发挥不同的作用(Forrest et al.,2017)。最后,另一种增加数据集从而提高预测准确性的方法是加入额外的自变量。早在1972年,鲍尔就发现,“同一种成功与拥有人力和经济资源有关,与政治决策和权力的集中形式有关,从而最大限度地分配资源”(第198页)。特别是,具有特定政治制度的国家,即当时的苏联,在奥运会上的非凡表现,直到今天都得到了研究的证实,例如Scelles等人(2020年)。其他作者(参见Kuper和Sterken,2001年;Hoffmann等人,2002年;Bernard和Busse,2004年;Johnson和Ali,2004年)发现,举办奥运会增加了预期的奖牌数量,其中一个原因是球迷数量增加,以及国际旅行带来的压力减少。Maennig和Wellrock(2008年)、Forrest等人(2010年)、Vagenas和Vlachokyriakou(2012年)扩展了这一发现,并得出结论,这种东道主效应在奥运会四年前就已经开始了,令人惊讶的是,一直持续到下一届奥运会。

使用道具

8
能者818 在职认证  发表于 2022-4-26 12:36:52 |只看作者 |坛友微信交流群
在一个类似的注释中,作者们发现,国家的表现持续高于、分别低于,因此奖牌份额的滞后显著提高了预测的准确性(参见Bernard和Busse,2004)。此外,值得一提的是,许多学者对其他变量进行了实验,如气候(Hoffmann等人,2002年;Johnson和Ali,2004年)、娱乐公共支出(Forrest等人,2010年)、卫生支出、增长率、失业率(Vagenas和Vlachokyriakou,2012年)和收入(Kuper和Sterken,2001年)。总的来说,这些变量中的大多数都有混合的发现,只有少数作为综合数据集公开提供。在这方面,De Bosscher等人(2006年)对预测体育成功的变量进行了荟萃分析,甚至超越了夏季奥运会,并发现国民生产总值和该国人口“一致地解释了国际体育成功总方差的50%以上”(第188页)。因此,这两个变量在过去50年中被大多数作者使用并不奇怪。因此,也考虑到多重共线性的潜在问题,即探索太多不同但可能相关的社会经济变量,预测模型不应无限扩大。考虑到奥运会预测的高度政策相关性和学术关注度,机器学习在检测隐藏模式,从而提高预测准确性方面的潜力在这种情况下尚未耗尽,这是令人惊讶的。然而,这种方法最近在体育领域越来越受欢迎,例如infootball(Baboota and Kaur,2019)。

使用道具

9
mingdashike22 在职认证  发表于 2022-4-26 12:36:59 |只看作者 |坛友微信交流群
尤其是随机森林方法通常能带来优异的结果,例如,在预测足球成绩(Groll等人,2019年)或赛马成绩(Lessmann等人,2010年)方面。正如Makridakis等人(2020年)所承认的,统计知识也可以应用于机器学习领域。这也解释了为什么公布的模型中没有一个能反复超过一个天真的预测模型,即在即将到来的奥运会上,前几届奥运会的奖牌数量。因此,在本研究中,我们通过使用两阶段随机森林模型预测奥运会表现,将托比特模型的成熟概念转化为机器学习。通过这种方式,我们确定了第一个在连续三届夏季奥运会(2008年、2012年和2016年)中持续超过天真预测模型约3到4个百分点的模型。除此之外,我们还将最近关于奥运会成功的潜在决定因素的研究(Scelles等人,2020年)中提出的预测精度提高了约20%。我们手稿的其余部分结构如下:在激发模型中使用的变量并引入两阶段随机森林的概念后,我们评估了预测的质量,提出了2020年东京的估计值,并讨论了Vid-19的含义。最后,我们总结了预测的前后后果,并对进一步的研究进行了展望。2.材料和方法我们根据两阶段随机森林预测每个参赛国在东京奥运会上的奖牌数量。然而,2019冠状病毒疾病的重要组成部分,我们也要注意到,作为一部分,我们还量化了COVID-19对奥运会奖牌数的影响,这些因素基于国家GDP、来自低呼吸道疾病的死亡事件和死亡的独立变量(即特征)。

使用道具

10
mingdashike22 在职认证  发表于 2022-4-26 12:37:05 |只看作者 |坛友微信交流群
在本节中,我们将激发潜在变量,解释两阶段随机森林的概念,并描述预测过程。2.1变量2。1.1因变量(输出变量)预测准确度的显著提高基于两个影响:首先,Scelles等人(2020年)建立了一个非通用线性模型,分别为Tobit模型。相比之下,我们采用两阶段随机森林算法,考虑到更复杂的非线性交互。第二,经常有人认为,奥运队的准备时间是四年(参见Forrest等人(2010年));Scelles等人(2020年)。这将意味着,理想情况下,只有2016年之前的社会经济数据才能用于预测东京2020年的结果。然而,Stekler等人(2010年)对不同的体育预测方法进行了评估,发现最近的数据产生了更好的结果。因此,在我们的模型中,我们包括数据直到2020,以克服这个问题,这甚至被世界卫生组织决定宣布COVID-19大流行(CASCELA等)(2020)和随后推迟到2021的游戏(国际奥委会(2020))。奥运会奖牌的数量代表了经济和政治实力,并提升了国家声望(Allison和Monnington,2002)。De Bosscher等人(2008年,第19页)承认这一数字是“衡量高绩效体育运动成功与否的最不言而喻、最透明的指标”。与大多数学者一样(如Andreff等人,2008年;Scelles等人,2020年),我们将奖牌数量定义为因变量,而不区分金牌、银牌和铜牌。继Choi等人。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-9-10 10:31