楼主: 时光永痕
583 0

[数据挖掘新闻] Kaggle Grandmaster系列–独家专访2x Kaggle Grandmaster Firat Gonen [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

48%

威望
0
论坛币
26 个
通用积分
49.7576
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
316 小时
注册时间
2020-7-21
最后登录
2024-4-24

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
Kaggle Grandmaster系列–独家专访2x Kaggle Grandmaster Firat Gonen
当您想学习如何应对数据科学竞赛时,您从哪里开始?
您可以与精英接触。您尝试从最好的中学到东西。掌握了黑客马拉松阶梯并亲身体验成功的数据科学专家。
简而言之,您可以向大师们学习。我们很高兴推出新的“ Kaggle大师系列”,我们将采访来自世界各地的顶级Kaggler,以将他们的想法,见解和经验带到Analytics Vidhya社区。
在第一次采访中,我们是Karat笔记本和讨论大师的Firat Gonen!没错-我们很高兴主办2X Grandmaster,他将与我们分享他的经验和知识。
Firat将他在实验方法,视觉注意/感知,决策与遗传算法,计算神经科学,神经网络,机器学习,人工智能与基础工程,大数据工具方面的10多年的知识带到了这次采访中。
他还拥有学士,硕士和博士学位的广泛教育资格。电气工程学位。
这是Firat的瑰宝:
“为了在Kaggle的任何领域中实现任何步骤,您都需要很大的耐心。” – Firat Gonen
这次采访中还有很多精英建议和知识,请继续阅读!
在这次采访中,我们涵盖了一系列主题,包括:
Firat Gonen的背景知识和数据科学突破
菲拉特从零开始到2倍大师级的Kaggle旅程
为初学者提供有关如何参加Ace数据科学竞赛的建议!
Firat Gonen的背景知识和数据科学突破
数据科学访谈Firat Gonen-休斯敦大学
Analytics Vidhya(AV):您已完成MS和博士学位。专门研究神经网络和神经工程。您何时,如何意识到要从事数据科学的?学位如何帮助您过渡?
Firat Gonen(FG):当我是本科生时,我并不了解“数据科学”领域,也许世界上没有那么广泛地使用这些术语。人工智能,数据科学,机器学习!
在伊斯坦布尔大学的大三和大四期间,我加入了一个MEMS实验室,专注于构建微激光投影仪。我开始在实验室里和我的前辈一起度过相当长的时间,他们的工作给我留下了深刻的印象,我想继续从事这一领域。在休斯顿/得克萨斯州开始专注于光电子学的硕士课程后,我被介绍给了NeuroScience,大脑成像,MRI和视觉注意。我眼花and乱,并确定这是我的领域。我拔掉了插头,左侧的光学元件并切换了实验室。
我记得我与该领域有关的第一篇演讲:神经与认知建模。在这之后,我迷上了。
我当时身处数学,生物学,解剖学,统计学和医学的复杂世界。随着时间的流逝,学习越来越多,我对这个领域的丰富历史感到惊讶。我仍然记得我的导师Haluk Ogmen教授教我们早期的感知器,明斯基-罗森布拉特-??佩尔特的研究。我们正在讲座中学习早期研究和发现,然后回到实验室,我们正在设计自己的实验并掌握它们的统计数据。
AV:这是一个了不起的背景。您还参与了实时3-D扫描仪技术的开发。您能告诉我们更多有关您以及您在开发中的角色的信息吗?
FG:那是10多年前了!那是我在MEMS实验室的高年级项目。我试图使用激光输入和通用网络摄像头构建实时3D扫描仪。我记得那时在Matlab中开发它。这是对信号处理,卡尔曼滤波器,矩阵运算等的不错介绍。
AV:在您有关神经工程和认知科学的独立研究项目之一中,您提出了有关实时数据科学算法的假设。这是我们社区希望了解的更多信息。
FG:在我攻读博士学位期间的一项实验。该程序基于人类决策算法,以及我们是否可以使用眼动仪和早期版本的学习器对其建模。这是一个有趣的实验,并给了我“博士”的头衔。
我们作为哺乳动物所拥有的探测特性促进了积极的探索行为;进行意外事件检测是人类智力和行为的重要组成部分。如何对环境进行采样并使用采样的环境做出决策是感知和认知的基本问题。
资料来源:Atlassian
当时,有几种模型将人类的感知和决策解释为优化给定标准的一种手段。然而,一些研究感知,认知和决策的研究得出结论,人类行为与决策模型有很大的不同。例如,根据统计理论,人们期望最大程度地采样以做出决定。
然而,人类经常选择小样本而不是大样本,并且对他们的决策表现出更高的信心。直到我们了解了为什么我们比大样本更喜欢小样本,才能对感知和认知过程有一个大致的了解。发现做出决定所用的样本量与工作记忆能力之间存在关联,可能是“快速决定”,疲倦,机会成本和有限的短期记忆。那时,由于小样本不具备大背景,因此偏爱大样本的研究仍然值得商question。
“最近提出了一种统计决策框架,在检测刺激事件时,小样本在决策方面要超过大样本(Small Sample Advantage,SSA)。换句话说,人类并没有寻求最大化样本数量,而是有意地将其保持在很小的数量。我们的目标是了解自然动态场景中感知和认知过程是如何实时运行的。”
AV:目前,您是Getir的数据科学主管。这是很多人希望看到的一个问题–参加黑客马拉松和竞赛对您的职业生涯有何帮助?
盖蒂|  盖蒂尔比穆特鲁克
FG: 5个月前,我加入Getir,担任数据科学与分析主管。这是数据科学家的理想之地。零售与技术之间的美好婚姻。
“老实说,我从每次比赛中学到了很多东西,多年来,每个领域都帮助我建立了业务敏锐度。我相信领域知识非常重要,比赛是学习此知识的理想环境。”
我没有其他选择,还有一个月可以深入NLP然后与地震数据作斗争吗?
菲拉特从零开始到2倍大师级的Kaggle旅程
AV:您拥有Kaggle Double Grandmaster –讨论Grandmaster和Notebook Grandmaster的头衔。除此以外,您还是数据集管理员和竞争专家。这是一个令人印象深刻的组合!为了达到这个不可思议的阶段,您必须克服哪些主要挑战?
FG:我已经慢跑了两年多了,每一步都需要时间。每个领域都有学习曲线,每个领域都很困难。
我认为最明显的挑战是Kaggle的第一个起点。我通常会看到很多人在尝试开设一些帐户然后离开后开设帐户。我认为这有两个原因:
第一个原因是他们很难在日常工作中创造时间
第二个原因是他们期望快速的结果
为了实现Kaggle中任何领域的任何一步,我认为您需要很多耐心。在Kaggle中,有许多关于如何开始Kaggling和/或资深Kagglers的详细经验的著作。我强烈建议新手阅读这些内容。
我认为我最大的挑战也很相似:奉献时间。在私人生活和职业上奉献所需的注意力和时间并不容易。
AV:开始新比赛时,您遵循特定的框架吗?还是您更喜欢自由放任的风格,先解决问题,然后再决定从哪里开始?
FG:几位Kaggle竞赛大师建议,即使这是一个简单的端到端管道,也会有很大帮助。我想我应该听从那个建议。我通常是自由放任的人。
“在开始编写代码之前,我开始阅读越来越多的讨论,我认为这确实有帮助。我现在是一个很好的读者,我可以明确地说这很有帮助。”
AV:这是可靠的建议,Firat。阅读绝对是数据科学成功中一个被低估的方面。大多数人倾向于专注于Kaggle比赛。您为什么选择进入Kaggle的讨论和笔记本方面?
FG:实际上,我想相信我试图在各个层次之间取得平衡。当我成为讨论大师时,我已经获得了4枚比赛奖牌,进入前1000名;或者当我获得第二次大师奖(笔记本)时,我已经获得了第五枚比赛奖牌。而且我已经获得了数据集方面的硕士学位。
100+免费的讨论和对话向量-Pixabay上的免费图片
“我真的很喜欢Kaggle实际上是一个庞大的社区,并且分享想法或资源会大有帮助。笔记本和讨论层迫使我们互相帮助,并展现出很棒的想法或方法。”
像每个在线社区或论坛一样,大多数Kaggler都是新手和新手。他们需要良好的资源,而仅靠竞争是无法实现的。您可以看到,无论是在笔记本中还是在讨论中,几位高级Kaggler都分享了很多很棒的东西。
AV:我们喜欢您构造笔记本电脑的方式。完成工作后,很容易看出您是如何成为笔记本电脑大师的。创建结构合理的笔记本有哪些技巧?
FG: Kaggle中有几本很棒的笔记本,它们的制造方式或目的非常不同。他们中的一些人在比赛中有很大帮助,一些人在时间序列预测或BERT等特定方面做得很好。其中有几个对您的EDA有很大帮助。
有些人在笔记本上花费数周,有些小时。数以千计的笔记本分叉,有些使您在比赛中获得金牌。
我想有人需要了解这一点,将它们全部检查出来,然后自己决定。它们之间唯一的共同之处在于它们是为帮助而构建的,这才是重要的。
“我的方法是保持简单,简短并且非常容易理解,以便完整的初学者阅读,理解和学习新知识,就是这样!”
Firat Gonen的初学者建议
数据科学采访Firat Gonen-初学者
AV:如果有人想成为Kaggle Grandmaster,他们应该从哪里开始并且应该专注于什么?
FG:我很荣幸成为Kaggle Grandmaster,但目标不应该是成为一个!
“他们应该专注于学习,共享,讨论。如果他们的目标是成为计算机视觉,NLP等特定领域的专家,那真的很好,并专注于此。”
我非常喜欢看到新的Kaggler何时开始他的/她的旅程,并在某个特定领域变得真正有经验,开始分享并获得Kaggle等级奖励。因此,总而言之,重点应该放在体验上。
AV:Kaggle无疑有助于建立强大的数据科学资料。话虽如此,成为一名优秀的数据科学家的关键是什么?初学者还能如何扩展其个人资料?
FG:好问题!Kaggle是建立强大的数据科学资料的好地方。
“除此之外,优秀的数据科学家还需要在线性代数,概率,统计,计算机科学基础知识和编码等多个领域拥有强大的背景知识。”
掌握了基础知识之后,开始学习机器学习和统计学习会容易得多。根据他们的公司,分布式系统和大数据工具可能会变得很方便。
一旦习惯了技术方面,他/她就需要专注于业务理解,并应该尝试理解复杂的常规业务模型。多年来,我了解到,在自己的业务领域中获得业务洞察力,良好的判断力,快速的决策与创建出色的机器学习管道一样重要。
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:kaggle Master Grand Aster Firat

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 16:56