数据科学(Python/R/Julia)数据分析、机器学习、深度学习
文 | 心缘
在人工智能的江湖,2015年是个关键时间节点,这一年之前和之后,似乎是两个截然不同的世界。
此前数年间,历经AI吊打在图像识别赛吊打传统算法、AI战胜世界围棋冠军、DeepMind"委身"谷歌等标志性事件,AI逐渐走出学术殿堂,开始用科幻般的"超能力"改变人们的认知。
从这一年开始,科技巨头的AI战事从暗战变为明局,AI也开始以前所未有的速度在全球爆发,逐渐演化成为如今AI格局的雏形。
每当我们提及第三次AI浪潮是如何复兴的,数据爆发、算力崛起已成为标准答案,而一股隐形却强大的力量却往往被视而不见。
而这股力量,不仅是使得AI再度兴盛的关键推手,也是科技巨头赢得AI话语权的"上甘岭"。
这股力量,就是开源。
当国外谷歌Facebook微软为升级迭代AI开源框架各显其能,国内以BAT领衔推进的AI开源项目亦在暗流涌动。
一、开源,黑客文化中诞生的奇迹
什么是开源的力量?这是包括AI在内的计算机发展史中,一个熠熠生辉的话题。
开源,英文名Open Source,即开放源代码,任何人可以在源代码的基础上进行学习与修改。它从58年前的黑客文化中缓缓演进,而最早催生这一文化的MIT技术模型铁路俱乐部的黑客们(Hackers),大都成为MIT AI实验室的核心成员。
如果说AI是一场饕餮盛宴,数据是原材料,算力是天然气,算法是菜谱,那么开源就犹如无数厨师经验与智慧合著成的一本永不完结的烹饪百科全书,其他厨师可以从中汲取经验来快速完成菜品,也可以指出书中的问题、贡献更多创意,让这本书经过无数人的完善后逐渐成为神作。

可以想象一下,一个人专门检查代码bug,它可能需要好几天的时间还有纰漏;而如果一群开发者和测试者来查bug,那么代码排错与演化的效率将得到惊人的提升。
如果能创建一个开放、有改进能力的环境,驱动成千上百的人才库去反馈并提供设计空间拓展、代码贡献、Bug定位以及其他的改进,而一个封闭项目中,要多么顶级的黑客才能仅依靠自己就做到与这成千上百人抗衡。
在开源文化中,黑客们追求的是更高质量的代码、更完善的项目,其动力也许是单纯的热爱,也许是对证明个人能力的渴望,但绝不是追求接近物质财富的东西。
与之相悖的是闭源,由专门的研究团队开发一个软件项目,不让别人知道源代码。选择闭源的机构无外乎几种目的,担心泄露机密,不想让竞争者使用它,或者想用它来卖钱。
这并不难理解,充斥着共享理念的开源文化,似乎与以营利为核心目标的商业世界天然不搭。即便是对在商业的考量中,开源的直接目的也不是为了营收,而是为了借此开拓市场和生态以获得更长远的收益。同时,开源也能有效防止闭源产品垄断市场的局面出现。
相较而言,传统开源项目会给开发者带来更大的压力,而开源开发者更为自由,他们只需专注在自己想要做的事情上,不必被上层的需求抽着鞭子往前走。

微软就曾是闭源的典型代表,早期它采用软件授权的模式,为其商业软件建立起一整套完整定价。Windows操作系统正是微软典型的闭源商业力作之一。尽管开源之光Linux操作系统没能在商业战场上干过微软,但长期站在开源对立面的微软,最终还是选择了拥抱开源。
开源既然要开放代码,让成千上万人协作,那就需要一个足够友好和安全的开源托管服务,在这一背景下,GitHub应运而生。
2008年,克里斯·万斯克拉斯已从辛辛那提大学英语专业辍学了三年,同普雷斯顿一起经过夜以继日地合作写代码,终于打造出能提供优秀协作服务的代码托管平台GitHub,并专程找Twitter经典logo的设计者西蒙·奥克斯利设计出其吉祥物章鱼猫Octopuss。

▲克里斯·万斯克拉斯(左上),普雷斯顿(右上),Github吉祥物章鱼猫(图下)
经过十一年的发展,Github早已成为"全球最大程序员交友平台",它每年发布的Octoverse年报已成为呈现这一年度热门开发项目、顶级编程语言等趋势的权威榜单。例如从Github上我们可以看到,近年数据科学、深度学习、自然语言处理、机器学习等主题的存储库正变得愈发流行,新的框架正吸引着成千上万的贡献者。

▲2016-2019年Github自然语言处理存储库的增长变化
大约也是从Github成立那年起,微软对开源文化的态度开始发生转变。
2009年,微软向Linux贡献2万行设备驱动代码;2011年,微软一度跻身Linux 3.0五大公司贡献者之一;2014年,"重塑"微软的CEO纳德拉喊出著名的"微软爱Linux";2016年,微软推出了兼容 Linux 的 SQL 服务器数据库软件;2017年,微软成为GitHub上贡献代码最多的公司,这一宝座蝉联至今。
2018年6月,微软斥资75亿美元收购Github,全球轰动。
截至当时,GitHub上,聚集了约2800万开发者、高达8500万代码库,仅是在去年,70%的全球财富50强公司均使用Github为开源做出贡献,包括微软在AI时代的主要对手,苹果、谷歌、亚马逊等科技巨头。
二、群雄混战AI开源框架

▲部分主流AI框架项目社区活跃度指标统计
AI框架上承应用、下接芯片,堪称智能时代的核心软件支柱。
11月7日,GitHub发布年度报告,贡献者最多的TOP10开源项目中,谷歌AI框架TensorFlow排名第五(9.9K)。

TensorFlow,当前AI开源框架的扛把子,承载了"业界开源典范"谷歌在AI时代的野心。
凭借一个开源手机操作系统"安卓",谷歌占据全球80-90%的智能手机,坐拥超过40万的开发人员和十多亿用户,据说凭借广告、应用、授权及付费内容等收入,一年能给谷歌赚30亿美元。
"赢者通吃"的价值在安卓身上发挥的淋漓尽致,如今其在智能手机界的地位早已稳如泰山,令其他未入局的大公司屡屡扼腕。连微软创始人比尔·盖茨都公开表示,自己犯下最大的错误就是"因为管理不善,导致微软没有推出像安卓那样标准化的、非苹果的手机操作平台"。
2015年11月,谷歌第二代深度学习框架TensorFlow横空出世。
背靠谷歌这座开源大山,TensorFlow强势崛起,借助于英特尔、NVIDIA等硬件平台的配合打法,向全球开发者免费供给AI库与工具,成为Github上最受开发者欢迎的平台之一。
去年4.6万个项目依赖于这一平台,贡献人数从2238位直接贡献者增长到25166位社区贡献者。开发人数、贡献人数、受欢迎程度(star数)、谷歌搜索量都碾压其他一众开源AI框架。

关注“AIU人工智能”公众号,回复“白皮书”获取数据分析、大数据、人工智能行业白皮书及更多精选学习资料!


雷达卡



























京公网安备 11010802022788号







