Joaquin Quiñonero Candela是Facebook 机器学习应用团队的负责人。他曾在微软剑桥研究院工作,还是微软Bing团队的一员。Joaquin Quiñonero Candela 在Facebook的主要工作是与Facebook 的人工智能实验室、各产品部门紧密合作,将机器学习、语言技术,计算机视觉等技术运用到Facebook的各个产品中,并将产品反馈纳入接下来的研究中。可以说,Joaquin Quiñonero Candela的团队Facebook人工智能从实验室到产品的关键。作为横跨学术界和产业界的机器学习大拿,Candela 在Quora上回答了诸多问题,如何看待机器学习发展的现状、机器学习如何在Facebook变得如此流行以及该如何学习机器学习,这些问题都将在本文中得到解答。

LeCcun表示,Facebook的人工智能包括人工智能研究中心、机器学习应用团队,再加上产品团队。
Facebook的机器学习团队都在做什么?
机器学习应用团队是Facebook应用研究团队的一员。我们的核心工作是机器学习、计算机视觉、计算图像以及语言技术。我们和公司的人工智能研究团队紧密合作,不过相对来说我们的工作更关注应用层面。接下来,我将简单介绍一些我们团队所做的有趣事情,当然,这并非一个完整名单,也并非只是我们一个团队能完成的事情,我们也需要和人工智能团队、核心数据科学团队以及众多产品团队并肩作战。
在计算机视觉方面,我们有一套能够处理用户上传的每张照片和每个视频的系统,每天的处理总量超过100万张(个)。利用这套系统,我们可以预测出这张照片的内容,这个用处非常大。比如帮助盲人「看到」图片、自动侦测图片上的敏感信息、提升用户搜索多媒体信息时的准确性等等。我们采用包含数十亿节点的深度卷积网络。这个模型最有趣的地方就是可普遍适用的特性。最近,Facebook的Connectivity实验室和核心数据科学团队通过这些特性,分析了海量的卫星图片,创造了一张高分辨率的世界人口密度地图。
这个团队还有很多有趣的研究,也发布了一些论文:多任务学习、强化学习形成的通用视觉模型(论文)、采用Elastic SGD与时空卷积网络训练的大规模分布式系统对视频的分析(论文)、级连算法在视觉模型的应用(论文)。
在语言技术方面,我们正在努力做的一件事情是消除Facebook上的语言壁垒。为了实现这个目标,我们每天处理超过20亿个帖子的翻译需求,超过40个语言的翻译,翻译方向(比如英翻中、中翻英)超过1800个。过去我们采用微软bing的翻译产品,后来我们自己开发或部署相关产品。现在,我们正在讲深度学习纳入到翻译产品中,希望通过神经网络,达到人类翻译的水准。
在机器学习和新领域,我们主要聚焦研发和使用一些大规模、实时的机器学习或人工智能算法,用到一些大型机器学习应用程序中。无论用户何时登陆Facebook,这些系统都会用来评估用户时间线上的状态更新(目前的数字为:平均每天超过10亿用户,每个用户1500个状态)、广告和搜索结果(每天的搜索请求超过10亿)、热门趋势信息、拍朋友推荐信息甚至也会评估用户收到的各种提醒以及别人的评论信息。机器学习团队同样利用深度学习打造了一系列「优雅」理解文本的算法。这些算法整合到我们打造的机器学习平台里,用于加快推进和大规模实现从训练到部署的过程。Facebook所有采用机器学习的产品都会使用这个机器学习平台。如果你想理解机器学习在Facebook有多流行,我举个简单例子吧,超过20%Facebook工程师(甚至非工程师)都是这个平台的活跃使用者。我们现在研究的方向包括用于预测事件的深度学习模型、用于稀疏模型、深度学习的分布式复习系统、通过卷积和递归网络进行文本理解的表征学习以及通过多任务学习的模型压缩。
关于学习:你学习机器学习的途径是什么?在学习机器学习时,你最喜欢哪一本书?
我最初接触机器学习,是在我作为一位电信工程本科生学习高等非线性信号处理的时候。那是在1995至2000年。我非常幸运地拥有一位很赞的导师,他在个人信息在 [url=]Prof. Anibal Figueiras-Vidal[/url]这网站上。他解释到你可以怎样使用神经网络构建自适应的、受训于观察到的数据的非线性过滤器。于是,我就入坑了!
我写的硕士论文是关于稀疏的径向基函数分类器。在那时,支持向量机风行一时,它似乎就像稀疏性是模型为了提高广泛性而应该具备的合乎要求的性质。我还记得你总是会评估你根据[url=]UCI repository[/url]的数据集创造出的算法。有趣的是在我们后来的学术生涯里,我警告过不谨慎使用稀疏模型的缺点(见[url=]the dangerous uses of sparse Gaussian Process priors[/url]),并且我曾在行业里寻求一份gogn zuo,以能生成由机器学习应用程序产生的新的有趣数据。
如果我不得不指出一本非常有影响力的书,那就是 [url=]Chris Bishop[/url]’的第一本书: [url=]Neural Networks for Pattern Recognition (1995)[/url]。其中第十章「贝叶斯技术」真的很对我的胃口,也是我至今仍对贝叶斯倾注热情的产物。然而正如我经常所说的,「一位真正的贝叶斯派不可能彻底是贝叶斯派:你需要优先保留一些余地,因为有可能贝叶斯方法不是正确的。」
在我花了6个月时间拜访丹麦科技大学时,我非常幸运地在2000年偶然碰上[url=]Prof. Carl E. Rasmussen[/url] 。Carl是一位贝叶斯派,向我介绍了神经网络的贝叶斯处理方法和针对近似推理的蒙特卡洛马尔科夫链抽样方法。他也向我介绍了高斯过程,我写的论文就是关于这个。我最后回到了丹麦,在Carl的指导下攻读博士。
这些天,我会犹豫要不要给人们指出特定的书(有太多杰出的书了)。我坚持建议人们观看视频演讲。如果你在YouTube上搜索你想了解的任何主题,你将发现由顶尖学校的一流教授提供的丰富的视频演讲。给你一个具体的例子:我最近需要掌握更多计算图像学知识,找到了Bill Freeman的很赞的入门介绍。我最近还想综述自然语言处理的简介,就找到了Dan Jurafsky 和 Chris Manning的很赞的入门级讲座。
如果你坚持读下去,这里是一本极大地激励了我的书,是Jaynes的《概率论:科学的逻辑》(这里是供你阅读的pdf版本: [url=]pdf version[/url])那本书提倡使用概率论作为科学推理的语言,在我们如何探讨概率推理方面给人很大的启发,也对机器学习非常重要,而且近来这些天当我们思考人工智能的未来时,也会从这本书获得相关联的哲学启发。
我也会鼓励人们立刻动手。如果你是Matlab用户(我以前是!)或者使用Python(当然你会用的),有许多应用程序包基本上是实现所有事情。然而对于很多算法而言,你可以编写你自己的程序工具,那是你真正要学的。
我看中的是技术实力和性格。寻找的人是这样的:
任务驱动型的。人们需要完全投入最终目标。
适应不确定性。
无私与合作。
ML黑客。
强大的背景条件。
在应用机器学习中,什么是更重要的:数据,基础架构还是算法?
首先让我们确定目标:在应用机器学习中,成功意味着将机器学习系统对实际应用的影响最大化。例如,通过我们的广告排名系统将拍卖的总额最大化,广告排名系统是由机器学习系统驱动的,能预测广告与受众的关联程度。拍卖价值将被两件事积极影响:
预测的准确性。
候选广告的数量。候选广告能通过大多数精确的预测器(经典的是严格的延迟约束器,能更快的激活级联途径,是通过更不精确的预测器精选候选广告)来估价。
我们需要将精确度最大化,同时将在服务时间进行预测的计算工作量最小化。让我们现在聚焦于最大化预测精确度。机器学习系统典型地有一个实验组件,旨在设计和训练模型。我们已经发现最重要的属性是实验速度。一个团队能在单位时间内完成的实验越多,他们就能取得更大的进步,建立更好的模型。我们努力应用机器学习,一直以来遵循「每周扬帆前行」的口号,做出了伟大的成果。为了每周至少能给特定应用输送一个生产模型,你需要管理几十个现场实验,每周执行成百上千的线下试验。极佳的基础架构、平台和工具对应用机器学习是必不可少的,既要最大化实验速度,又要最小化在服务时间的预测成本。
现在,让我们转向数据和算法问题。我们的哲学理念将问题分出了轻重缓急,下面是按重要性从高到低排列:
数据:尽你所能地得到大量数据,确保这些数据是最高质量的。就我们的经验而言,数据会以出乎意料的、不同寻常的方式变得杂乱。我最喜欢的一个故事是,快速重复点击以增加impression(译者注:impression是网站分析的最基本度量之一),这偶然不会起作用,因为存在一个假设是点击被报告给处理impressions的同样的数据中心。
特征工程:做大量的和它有关的事。提取你的数据,浓缩为有最大化预测力的信号。构建尽可能自动化的工具(自动化特征选择时常在后台运作,保持CPU的效用最大化)。我必须强调深度学习的来临正改变者游戏:当使用更简单的算法特征工程是关键的时,深度学习的承诺是它允许自动化地学习表征(例如特征)和你能馈送给它原始数据。一些明显的例子是DeepMind的令人惊讶的工作,也就是纯粹基于屏幕上的像素学习玩耍经典的街机游戏,而没有做任何特征工程。深度学习通过自动学习表征也已经引发了计算时间和语言技术的革命。还是那样,在实际应用中,依赖机器学习的产品团队定期通过特征工程仍有重大收获
算法:一旦你拥有了针对特征工程的最棒的数据和工具,就要保持提升你的算法能力(同时要保证这些算法是广泛推广的)。在Facebook,我们定期输送新的具备更大生产能力的模型,但是值得注意的是,只有当训练数据的数量一路增长,而且表现力(包括训练和在服务时间的预测)没有退化得太多以致于抵消了增长的精确度带来的益处时,这才有意义。我们总是将来自更复杂模型的精度收益与在做预测时增加的CPU成本相比较。这意味着我们经常使用最简单的可以完成工作的模型(从计算效率角度来说)。
总结:在应用机器学习中基础加工是至关重要的。然后,你应该聚焦于拥有尽可能是最好的数据,做大量的特征工程和使用最简单的能完成工作的算法。
2012年基于深度神经网络的方法在 ImageNet 分类比赛中获胜之后,深度学习引起了很大的反响。神经网络已经在机器学习中应用了相当一段时间,但具备更大容量和远远更多数据的深度神经网络带来了变革并显著击败了其它较浅的模型。这一运动开始于计算机视觉,并快速扩张到了文本理解、机器翻译和语音识别领域。
Facebook 拥有一个单一的使命:创造一个更加开放和互联的世界。随着我们开发出让人们可以分享更多的工具和产品,理解用户的内容并向他们提供最大的价值就变得越来越重要。这意味着,高准确度(精度和回调)、低延迟和更快速的创新。深度学习在所有这些方面影响我们的产品。它被用于文本、音频、照片、视频甚至交互的内容理解中。嵌入式的深度学习被无缝整合到许多产品组中,这使得他们能更专注于核心产品,同时又指望我们团队(机器学习应用产品组)提供可用于多种任务的可能最好的嵌入产品。
除了提供嵌入产品,深度学习也在被应用在一些端到端产品中,如用于视频字幕的自动语音识别、为盲人配音的核心视觉识别引擎、让你可以将数百种语言翻译成英语的机器翻译。
为什么 Facebook 要投资(大量)人工智能/机器学习?
没有人工智能/机器学习,Facebook 就不能存在。
人工智能是 Facebook 已有的工程工作的自然延伸,这是向我们的社区提供好体验的关键部分。每天,这个世界都在产生越来越多的数据——文本、图片、视频等等。为了做到有用,我们需要帮助你梳理所有这些信息,这样你就可以看到你想看到的内容,并更高效地和他人交流。
回答这一问题以及有关人工智能和机器学习领域更多具体应用研究工作,请见:What are the most interesting things Facebook is doing in ML research?


雷达卡




京公网安备 11010802022788号







