做学术好像在隧道里摸黑行走,商汤彻底打开了汤晓鸥对隧道外世界的想象力。
撰文 I 周琪 策划 I 郝亚洲 出品 I 零度工作室
1
一次崩溃
2017年,胖头鱼遭遇了他25年人生中一次巨大的崩溃。他清晰地记得那天,晚上11点多,在香港中文大学附近的沙田海滨海长廊,不知不觉跑了20公里,到终点时忍不住哭了出来。
他注意到附近一直有人待着不离开,明白对方是担心他一时想不开,心想:这里真是个温暖的地方啊。
他太有理由苦闷了。不久前,他以清华大学电子工程系优等生身份来到港中大多媒体实验室读博,师从王晓刚教授,而王晓刚师从汤晓鸥。后者于2001年7月建立的多媒体实验室,多年来有“计算机视觉界黄埔军校”的美誉。
第一年通常大家都不发论文,但胖头鱼想试一试,尽管并非计算机视觉科班出身,他对自己的学习能力一直很有信心。还有一个原因是,他了解自己,如果没有什么挑战,人就会懒散起来,大不了就是论文被拒,运气好了还能减轻一下接下来的科研压力,专心做点长期研究。
“计算机视觉+自然语言处理”的方向是一开始就定下的,实验室里研究这个方向的只有他一个,这意味着,遇到难过的坎,唯有孤军奋战。和导师王晓刚商量时,对方并没有阻拦,鼓励他说是很有价值的研究方向,但要为困难做好准备。
在接近研究终点线的地方,困难猝不及防地降临。修改了一段代码BUG后,识别结果表现反而变差了。CVPR(全球计算机视觉顶级学术会议)提交论文的截止日就在眼前,无助、沮丧、自我怀疑在那一刻如海水般涌向他。
胖头鱼更新了一条朋友圈,那几乎是最后的情绪出口,但内容和平日里开朗的人设实在不符,加上不愿给朋友们增添情感上的负担,他只允许这一条“存活”5分钟,5分钟后,这条朋友圈将和崩溃一道,消失在沙田海。
5分钟足够了,底下出现了很多留言,他还收到了王晓刚发来的信息,了解情况后,导师劝慰他不用担心,并推荐了一位或许可以提供帮助的人选。
目前,博士生三年级的胖头鱼在商汤科技的自动驾驶团队实习,并带领一支团队,和导师王晓刚,现任商汤科技研究院院长只差了两个层级,就像在多媒体实验室一样。
商汤科技是香港中文大学教授汤晓鸥2014年创立的计算机视觉和深度学习原创技术的创新型科技公司,去年5月末,商汤宣布完成 C+轮 6.2 亿美元融资,投后估值达 45 亿美元,是全球最大的AI独角兽。近期也有消息说,商汤最新估值已达60亿美元。
公元前1650年左右的中国商汤时期,农业、手工业迅速发展,早期汉字甲骨文诞生并得到充分应用,该时期成为人类古代文明进步的重要阶段。
这成为商汤科技名字的由来,不过,民间的另一个版本是,“汤老师”从商了,所以叫商汤。
2
“汤氏”研究场
汤晓鸥于计算机视觉领域的影响力,或者更确切地说,是一呼百应的能力。他避开媒体的追逐,几乎不接受采访,酷爱电影和“晒娃”的形象深入人心——每一次公开演讲,他都会拿电影出来类比和演示。比如《战狼》的成功证明了尊重原创是一件多么重要的事情,再比如,在一场人工智能大会上,他演示了商汤的黑科技如何把一辆汽车毫无痕迹地植入《花样年华》,“其实我最想植入的应该还是我儿子的照片,这也没有什么别的原因,因为我觉得他比梁朝伟长得还帅。我也跟他说,你不要相信人工智能,你长得这么帅,谈女朋友一定要亲自去谈。”在港中大多媒体实验室首页,汤晓鸥用儿子Samuel的照片科普人脸深度识别,一张上面标着“浓眉”、“有吸引力”,对应人脸属性,还有一张上面标着“You are Samuel”(你是Samuel),对应人脸识别。
从商前,汤晓鸥先后在香港中文大学和微软亚洲研究院(MSRA)工作。《十九年来,从微软亚洲研究院走出了他们》一文中这样定义这座微软在海外设立的首个研究院,“没有人可以绕开这个机构去谈论过去十几年的中国科技史”。张宏江、李开复、沈向洋、张亚勤等一大串星光熠熠的名字都来自那里。
在2003年的一篇自述中,汤晓鸥回忆了他和MSRA结缘的故事:
铭铭(汤晓鸥儿子)六个月大的时候,妈妈的假期结束了,不得不回北京工作了。铭铭当然毫不犹豫地决定跟妈妈走(主要是从他的哭声中判断的),这样我又开始了对微软亚洲研究院的经久不息的访问。可能是访问实在太频了,结果我访问的媒体计算组的主任,时任研究院副院长的张宏江问我愿不愿意接管他的媒体计算组,还没等我们开始谈条件,没过多久,研究院重组,宏江(张宏江)成了新成立的工程院院长,另一位副院长Harry(沈向洋)成了研究院新院长。Harry好像觉得我来管媒体计算组不大合适。我也没问为啥。过了没多久,一个周三的下午,Harry突然来电邮说想和我谈谈。原来Harry想找我接管他自己的视觉计算组,又觉得对不起媒体计算组,所以干脆将两个组合并成一个,问我愿不愿带。我第二天就答应了,Harry也怕夜长梦多,隔天我们就把很多细节敲定了,没有经过任何面试,我就在几天之内成了研究院的人了。周六,我就买了房子。那一周,感觉上像两个恋人生怕对方反悔而匆匆领了结婚证。
我当然不会反悔,我对研究院其实爱慕已久,研究院在我心里很像铭铭,大有天下第一铭的气势。我一直觉得Bill(Bill Gates)一生中做了两个了不起的决定,第一是和IBM签了DOS协议,第二就是建立了微软亚洲研究院。当然,有些同学可能不同意这种说法,我有时也想,和世界上最大的计算机公司签约怎么能和同世界上最大的国家签约相比呢,所以也许建立了亚洲研究院应该更重要。
北京的学校差不多集中了中国十几亿人中最优秀的人才。研究院是中国唯一的一所由跨国公司成立的从事基础研究的地方。和国外一流研究机构相比,研究院近水楼台;和国内的一流研究院比,亚洲研究院具有国际一流的理念和管理模式;和IBM 及Google 在中国的研究院比,亚洲研究院从事基础研究而不是产品开发。这样独树一帜的地位,天下无双。
戴娟大四时经师兄介绍来到MSRA,跟随汤晓鸥实习,“有学者气”是汤留给她的第一印象。“从2004年到现在,感觉他一直没怎么变过。”刚接触人脸识别那会儿,汤晓鸥对她只有一个要求,沉下心来,读300篇论文。“他也不会来检查,但是他会跟你说,你这样做的原因是什么,不熟悉这个行业,就没办法做出更优秀的研究方向和议题。”
实习七个月里,开头将近三个月,戴娟都把自己埋在论文堆里,当时深感痛苦,现在觉得,这个苦不能绕,也绕不开。毕业后,她拖着大大的行李箱,第一次离开大陆,进入港中大多媒体实验室,当时,20多个人里,她是唯一的女生。2005年,计算机视觉尚未成为“显学”,选择这个专业,意味着选择了纯研究的道路。
戴娟在中国科技大学电子信息工程专业读本科时,就耳闻多媒体实验室的“口碑”,所有从实验室走出去的学生都去了美国最牛的学校,MIT、耶鲁、剑桥、哥大(作者注:哥伦比亚大学的简称)……每一个都让她心动。“汤老师会不遗余力地帮学生找最好的出口,他真的很关心自己的学生。”
在多媒体实验室,论文分享会是每周的规定动作,大家一起读论文,互相改论文,分享要点、笔记,戴娟从师兄林达华的笔记里“偷学”了不少统计学的知识,后者是商汤科技的联合创始人。
实验室带有强烈的“汤氏风格”,开放、包容、平等、透明。所有人共享所有算法,对新人而言,最幸运的莫过于,开始任何一项研究,都可以站在巨人的肩膀上。人与人之间的较劲,则几乎感觉不到,大家关心的是团队投中国际顶级会议的论文数量,要是有人没中,其他人都会上去安慰。
“我觉得汤老师的理念是,希望所有学生都能去全世界最优秀的大学。不是说一定要谁去MIT,谁去哥大,一切都是有可能的。在学术界,你要希望身边的朋友变得更好,这样无论你以后做什么,都会有更好的圈子来支撑。”戴娟离开实验室后,简历上新添了苹果公司Siri和微软Windows Phone的产品经理两个职务,去年回到“初心”商汤,仿佛穿越到了学生时代。“它是最安稳的一个地方,因为你不是一个人在战斗,遇到问题时有团队,是很厉害的一群人。”
这种被天才包围的感觉,大水也有。去年,他所在的团队勇夺计算机视觉界的顶级竞赛之一MS COCO冠军。两年前,他定点投了商汤实习职位,大水研究的方向是目标检测,和自动驾驶中的场景改善高度匹配。
“在这里大家不会互相甩活,会主动接活,遇到问题的时候,大家会先考虑这个事情自己是不是能直接解决掉,然后再去找其他人,而不是说我发现这个问题好像跟我没关系,就直接抛出去,看谁能解决掉,这个是我特别喜欢的一点。”
当被问起实习生和正式员工的差别时,大水仔细想了想后答,没有。
关于“无差别”,胖头鱼举了一个例子。算法测试是科研人员检验代码是否WORK(可以落地)的必经之路,它需要强大的GPU(图形处理器)集群——超算中心支持。商汤有14000块单价万元以上的GPU,是亚洲规模最大的 AI 超算平台,依托深度学习训练框架 SenseParrots,支持千卡并行训练、千亿级参数模型、百亿训练样板、亿级类别分类任务。任何时间,任何地点,提交测试需求后,会进入队列,先后次序只和任务的紧急程度相关,无关提交人员的身份。“如果排队的话,最晚,也是最极端的情况,就是你白天挂上,晚上肯定能跑上。正常情况是挂上就跑了。”

商汤深度学习超算中心
包括实习生在内,商汤的研究员人均拥有数十块GPU卡。大水说,这里的超算集群是他见过所有公司里最好的,大大加快了迭代的速度,降低了试错的代价。
3
“赔本”招人
巨大的投入隐藏在背后,超算中心特别“烧钱”。据《财经天下》报道,商汤的研究员闫俊杰博士做过估算,按下那个标有“run”(启动)字样的按钮,一次数据迭代整体花费至少50万元。CEO徐立笑称,“我们有150多个博士天天在算法平台上按‘run’,训练人工智能模型。”
我在商汤上海办公室见到了这位37岁的CEO。偌大的空间横放着两张白漆办公桌,和公共办公场地的桌子没有区别,上面是一台笔记本电脑,空旷程度让人怀疑这只是临时的办公场所。徐立穿着NIKE定制的黑色司服,连帽卫衣和宽松运动裤的搭配,胸前印着更新后的“商汤”logo。和早前的公司Logo相比,中文取代了英文SenseTime,占据了醒目位置。
“尚简而重能,”徐立去年在公司立了一条规定,在公司内实行称谓“减负”,互相直呼其名。违规者要向公司用于青海捐助的慈善基金“充值”。他相信,这有助于铸造并保护一种开放、坦诚、纯粹的团队文化。
计算机视觉领域的玩家几乎都有知乎账号,在这个专业人士热衷的社交网站上,自称港中大“多媒体实验室出来的学渣”的“AI观察员”称徐立是圈内的全能型选手,“写得了算法,做得了DSP(数字信号处理),三天两头出新技能。平时工作应付得得心应手(开会、写PPT、写代码、出去吃喝打球打游戏一个不误,每天回家路上看篇paper,睡觉前再来个睡前读物),不耽误每年CVPR/ICCV/ECCV(全球计算机视觉领域三大顶级会议)再投个三五篇paper,绰号中国联通(宵)。”
徐立在港中大师从贾佳亚教授。贾佳亚2017年5月作为杰出科学家加盟腾讯优图实验室。接受36氪采访时,他称徐立是“让他非常自豪的一个学生”,“徐立是一个非常聪明的人。不只是我们组里面,他可以说是我见过的所有学生里最聪明的人之一。他能够触类旁通,从细节上理解问题。他在我们组的时候从最早需要几个月做完一篇论文到一个星期解决战斗就充分证明了他的能力。”
2014年3月,汤晓鸥团队发布研究成果,基于原创的人脸识别算法,准确率达到98.52%,首次超越人眼识别能力(97.53%),这开启了汤晓鸥创业的决心。在此之前,受困于数据规模有限和算力不足,学界对能否突破工业红线,即计算机识别准确率高于人眼,并没有十足的把握,用徐立的话说,就像在隧道里摸黑行走,什么时候到达出口,不知道。

商汤SenseID身份验证解决方案落地酒店应用场景
商汤彻底打开了汤晓鸥对隧道外世界的想象力。在一次香港的对谈中,他说,在香港科技园主席的支持下,公司两周就在香港成立了,“过去20年的努力,都是为了这一刻”,面对台下坐着的学生,他感慨道,“都说香港错过了互联网时代,商汤要做的,是引领人工智能时代。”
徐立自称联合创始人里“最不学术”的那个,他在很多场合说过自己加入的故事。“汤老师找到我,说我们现在做的这些事情不够有power(力量),做商汤有一个目的,形成影响力,然后做更多更大的事情。我听完之后,觉得一个人有长远的想法,能够去改变世界,真的不一样。当时我基本上没有犹豫,就说‘OK,我非常想去’。”
2015年初,汤晓鸥召集深圳和香港两地的商汤员工一起吃饭,迎接农历新年,徐立记得,当时的人连两桌都凑不满,其中还有6位联合创始人。到了3月,算上实习生,整个公司也就30多人。
那年夏天,汤晓鸥和徐立去美国硅谷参观了几家创业公司。戴娟当时在硅谷所在的旧金山湾区工作,据她回忆,那次硅谷之行,汤晓鸥没有约重量级人物见面,反倒是约了她好多在Facebook工作的研究员、工程师朋友聊天,他好奇他们的企业文化是怎样的,甚至会问Facebook如何布置办公室,厨房长什么样子。“汤老师想知道为什么员工喜欢去Facebook工作。他就是一个研究型的学者,没有做过startup(创业公司),就先看全世界最好的startup都是怎么做的。”
徐立用“扩招”形容2015年。2014年底获得IDG资本数千万美元的天使轮投资后,商汤开启了“大包大揽”式的人才招聘计划。几位创始人在计算机视觉领域沉浸多年,比谁都清楚人才对一家技术初创公司意味着什么。那时,AlphaGo引爆世界尚未发生,在美国,名校计算机系毕业,最聪明的都去了华尔街,投身金融业,那里意味着稳定、高收入、成功。在香港,徐立的很多同学也去了银行,人才的错配让这位年轻的CEO看到了机会。
“我们当时就有一个判断,人工智能的战争是人才的战争,而人才是需要培养的,一般要经过3~5年的训练。于是商汤做了两件事,一是把过去几年行业里做得比较好的人招过来,二是拦住那些刚刚毕业的博士,告诉他们不要去银行了,来这里。”
扎克伯格说,增长是最重要的,盈利只在第二位。对成立之初的商汤而言,任何事都比不上积累人才重要。为了吸引人才,不惜血本砸钱买显卡,搭建运算平台,然后,请一堆博士过来用,一分钱没赚,净烧钱。有投资人忍不住跟徐立说,“这样下去不行,咱们不是办研究机构,要有项目落地,要回应需求,快速迭代。”徐立内心并不认同,“你想啊,在这个行业有积累,又是Top(最好)的人,我觉得,差不多就一辆巴士,最多了,这些人里有的去了微软、谷歌、Facebook……你如果把剩下的都招进来,那别人要再做同样的事的时候,会发现市场上人才真空了,就不得不从零开始培养。”
事实上,“赔本招人”的效果比预期更好,有人从微软、谷歌、Facebook回到国内,加入商汤,当然,迎接他们的是体面的收入、公司期权,以及一种与美国科技巨头既相似又不同的创业氛围。
2015年末,积蓄的能量开始在商业上显现,商汤在多个垂直领域拿单,合作客户不乏中移动这样的大客户,2017年宣布实现正向盈利。
作为一枚通过了微软4轮面试和苹果公司15轮面试的学霸,戴娟比较过商汤和她的两个老东家。在她看来,微软属于成熟的大公司类型,自上而下做决策;苹果是创业型,自下而上做决策,任何人有一个好的产品想法,都可以找人一起做,在苹果公司,人们常说People follow visionaries(人们愿意追随愿景)。商汤更接近苹果模式,在内部鼓励大家提出各自的想法,再由高层去判断这些想法是否和公司的战略一致。
戴娟目前负责的教育产品就是“自下而上”决策的典型。起初,汤晓鸥交给她的任务是编写一本人工智能教科书,经过几轮和工程院院长、研究院院长的沟通,戴娟产生了规划教育产品的想法,从教材到配套教具,再到教师培训,团队规模从3个人扩大到了近30人。
徐立在最近一封公司的内部信中也提到了教育团队,“非常感谢教育团队的努力,教书育人也是商汤人的情愫所在……‘教育者,养成人格之事业也’。教育非一日之功,推动AI时代发展也如是。我们有幸身处人工智能发展到了可以落地应用、处处开花的时代,这时代给予了我们看到世界在被AI快速改变而能亲手参与其中的美妙机会,能够将我们所领略到的、所坚信的这份技术落地为一个个产品、一个个应用,让我们经手的每一件事都擦出更智能的可能。”
4
黑羊文化



雷达卡






京公网安备 11010802022788号







