楼主: william9225
1563 4

[其他] 【商业故事】抢跑AI视觉 [推广有奖]

版主

巨擘

0%

还不是VIP/贵宾

-

TA的文库  其他...

文库之星

【William新闻精选】

2019经济报刊周刊精选

威望
15
论坛币
1437738 个
通用积分
155.2302
学术水平
3616 点
热心指数
3969 点
信用等级
3571 点
经验
676818 点
帖子
18353
精华
60
在线时间
4871 小时
注册时间
2015-2-12
最后登录
2024-2-21

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

【封面报道】抢跑AI视觉
来源于 《财新周刊》 2018年第01期 出版日期 2018年01月01日
1.jpg
“独角兽”已批量登场,安防是中国特色下的第一大赛道,自动驾驶、电商、消费硬件也已依次排开

《财新周刊》 文 | 财新记者 屈运栩 叶展旗 特约记者 王晓庆

  仿佛一夜之间,一个接一个数学博士、计算机博士、统计学博士牵头的团队,长成了数十亿美元估值的“独角兽”。

  2014年3月,香港中文大学教授汤晓鸥团队发表了震动计算机界的学术论文,其原创的算法可使计算机的人脸识别精准率超过人类。敏感的风险投资(VC)机构IDG资本嗅到了机会,IDG合伙人周全与汤晓鸥相识,从中牵线,最终由IDG资本合伙人牛奎光团队拿出几千万美元的天使投资,支持汤晓鸥团队走出高校实验室创业。当年10月,商汤科技成立。

  这笔投资彼时并未获得市场太多关注,VC们对教授创业也不是那么有信心。然而,时至2017年,资本已经追不上炙手可热的“汤老师”。据财新记者了解,商汤目前整体估值已到二三十亿美元。

  “汤老师”们被归入一个全新行业——AI视觉,即将机器学习等AI(人工智能)技术应用于计算机视觉(computer vision,CV),让摄影机和计算机代替人眼对目标进行识别、跟踪和测量等。最为普通消费者熟知的场景就是人脸识别,比如苹果在2017年11月上市的iPhone X手机的“刷脸”功能,以及各类门禁系统、银行远程开户等使用的“刷脸”功能。

  2017年年中以来,AI视觉公司突然进入融资“军备竞赛”,其中最受资本追捧的当属商汤、依图、旷视三家,三家公司团队皆博士成群,拥有大量来自学界的人才。2017年5月,成立五年的依图科技宣布完成C轮3.8亿元融资;7月,成立仅三年的商汤科技宣布完成B轮4.1亿美元融资,估值超过15亿美元;11月,成立六年的旷视科技宣布完成C轮4.6亿美元融资,刷新融资记录。就在旷视宣布融资的第二天,商汤又宣布启动C轮融资。

  商汤的C轮融资在两周后就陆续公布。高通和松禾资本分别在2017年11月15日和12月26日宣布投资商汤,披露商汤估值超过20亿美元。“我们听说商汤这轮投资非常火爆,号称8亿美元on the table(摆到桌面上)。”一家知名VC的合伙人告诉财新记者。而另一家国内大型私募股权投资机构负责人,了解到的商汤最新估值已达30亿美元:“团队都挺好的,就是值不值这个价格?”

  商汤科技联合创始人兼CEO徐立在接受财新记者专访时表示,“这波AI能起来其实只有一个原因,我一直强调‘工业红线论’概念,就是要看技术能否越过工业红线。比如在AI视觉领域,工业红线就是人眼识别的准确率。我们的算法让机器越过了这条红线,判断AI视觉能够工业化,能够成为替代现有劳动力的生产力工具。”

  徐立称,商汤已在几个垂直行业形成了AI生态循环,“越往后(指融资轮次)的投资人,越不会被遥远的故事打动,一定会看你是怎么落地的,还会看未来是否有足够的增长空间。AI的关键就是落地。”

2.jpg
2017年9月12日,苹果秋季新品发布会,苹果全球营销高级副总裁Phil Schiller介绍iPhone X的面部扫描解锁功能。

  面对商汤和旷视在资本市场的竞速赛跑,依图科技联合创始人林晨曦近日对财新记者说:“我们团队人数少一些,没有扩张团队,但现在看来,我们的价值是被市场低估了的。”

  三家公司背后,已站上IDG创投、高瓴资本、鼎晖资本、创新工场、红杉资本、真格基金、云峰资本、高榕资本、纪源资本等中国IT和互联网行业的主要投资人。高通、蚂蚁金服、富士康等产业资本也纷纷入局投资。资本为何在这个时间段密集杀入AI视觉领域?

  首先是沉寂多年的人工智能技术在近年取得了应用突破。谷歌旗下人工智能团队开发的AlphaGo系列在围棋项目中碾压人类顶尖棋手,呈现了超越人类的自我进化和学习能力,这形成了强大的市场教育和示范,催动所有AI公司身价暴涨。

  但更重要的是,近年互联网技术在细分行业加速商业化演进,创造出了更为丰富的应用场景,引爆了AI视觉的落地需求。

  事实上,中国一直有一块特殊的市场领域——安防市场,这个以政府采购为主的市场,已经成就一批硬件厂商。多位采访对象预估,中国安防市场整体规模高达几千亿元。

  安防市场的上一次爆发约在十年前,以海康威视( 002415.SZ )、大华股份( 002236.SZ )等为代表的摄像头硬件公司为主。硬件厂商经过激烈的市场竞争,终将全国布满摄像头。但公共安全部门在实际使用中发现,摄像头单纯采集了数据,却无法利用大数据快速处理和解决更多的问题。比如从100万人中比对可能的犯罪嫌疑人员,就需要更高的运算能力和更精准的算法模型。

  新兴的计算机视觉公司看到了这一机会,精研此道。于是,以算法模型立身的数学家和AI专家们与长于商务和渠道的硬件商们正面相遇——是合作还是竞争?

  安防之外,金融、医疗、自动驾驶、电商、消费硬件等各类场景,也开始纷纷挖掘对AI视觉的潜在需求。AI视觉公司借势进入垂直行业提供解决方案,希望构建“数据-模型-应用-积累更多数据”的商业闭环。

  教授和博士们迫不及待地从实验室跑上市场,试图在互联网巨头“扫荡”之前立稳脚跟,而后者又如何甘心放过机会?2016年到2017年,腾讯、阿里、华为等公司也纷纷加入战局,从满足自身业务场景入手,伴随云服务在垂直行业的拓展,AI视觉则作为整体解决方案的技术之一,被打包装入项目。

  知情人士透露,互联网巨头和头部AI视觉公司之间的竞合关系十分复杂,多方资本暗战将是下一个看点。

  “视觉计算刚刚起步,但火力太集中了,都去做人脸识别,这意味着安防的第二轮竞争已是红海。但其实很多场景还没有意识到需求,应用场景需要被界定,商业模式需要进一步探索。”阿里巴巴iDST副院长华先胜告诉财新记者。华先胜负责阿里AI视觉技术团队。

  在头部公司牵引下,行业迅速扩张。据腾讯研究院2017年8月份发布的报告,中国计算机视觉领域有146家公司,在中国AI各领域中排名第一,之后是智能机器人与自然语言处理行业。在融资上,计算机视觉公司同样排名第一,迄今行业融资总额达143亿元,占比23%,高于自然语言处理与自动驾驶行业。

  百家科技公司杀入这个目前尚由安防业务占六七成比例的市场,未来是何方向?多位行业人士和投资人对此总结称:算法是基础,数据是“护城河”,资本投入是最大助推器,但最终变现取决于应用场景,以及拿订单的商务拓展能力。各要素缺一不可。

视觉超越语音

  计算机视觉的突破来自AI革命。上世纪80年代卷积神经网络(CNN)出现,却多年未获产业界关注。2012年,神经网络之父、多伦多大学教授Geoffrey Hinton为推广CNN,和学生一起参加了著名的ImageNet计算机视觉识别挑战赛并一举夺魁,击败了其他计算机视觉专家开发的算法,将准确率从此前两年的72%、74%大幅提升至84%。
3.jpg

  这被视为近年AI技术的里程碑事件,影响了大批计算机视觉研究者。这些人或者来自全球各大高校科研院所,或者是科技巨头公司的研究院。大批研究者随后从学界下海,组建创业团队,而手握场景的科技巨头也纷纷成立实验室,高薪挖角或整体收购高校团队。

  依图科技创始人朱珑和林晨曦正是在2012年创业。朱珑毕业于美国加州大学洛杉矶分校(UCLA),是统计学博士,曾在麻省理工学院人工智能实验室做博士后。林晨曦则来自业界,是阿里云计算资深专家,参与搭建了阿里云飞天分布式操作系统。

  2013年,依图科技通过帮助某地公安系统识别车牌进入了系统采购名单,为进入真正核心的犯罪嫌疑人搜索比对领域创造了条件。这一领域是人脸识别的重要应用场景。当地公安系统有几百万人的数据库,需要从中匹配出路上拍到的犯罪嫌疑人照片。原有供应商提供的技术首位命中率仅为20%,这样的准确率面对百万级别的大数据几乎没有可操作性。依图的团队却在第一天实验时就将准确率提升到了85%。

  “85%意味着在路上巡逻碰到十个人,有八个半能对出来是谁,公安的工作流程就可以据此展开。人脸识别在2014年落地了警务应用。”林晨曦说。

  依图的创业故事是中国诸多AI视觉初创公司的缩影。

  中国教育体系对数学教育的重视,给全球培养了很多人才。商汤科技投资人、鼎晖资本管理合伙人黄炎告诉财新记者,全球大概有10万人能被称为AI专家或人才,中国大概就有3万到4万人,顶尖的人才百里挑一,也就1000人到2000人。

  2014年3月,现在的商汤科技创始人汤晓鸥当时仍在香港中文大学任教,其团队发布了一项研究成果,原创人脸识别算法,准确率达到98.52%,首次超越97.53%的人眼识别能力。机器看人能够超越人类肉眼。这样激动人心的发现,令“汤老师”的团队按捺不住了,遂与IDG资本一拍即合,下海创业。

  各个创业团队在算法准确率上不断精进,在各类大赛中争冠,又通过这些成绩向市场推介自己。一般2B(对公业务)生意里,靠吃饭喝酒拿单的模式,被科技实力所打破。

  中科院计算所研究员、中科视拓创始人山世光告诉财新记者,2012年以来,尤其是最近两年间,业界取得了长足进步,为广泛应用打下了基础:“人脸识别原来想做到千分之一的错误率都非常困难,如今的iPhone手机已经能达到百万分之一了。”

  在算法领域,语音识别发展比计算机视觉更早,然而多位采访对象指出,语音识别的应用场景并没有AI视觉丰富,因而在风靡一时的智能语音音箱之外,语音技术并没有呈现太多爆发性的商业场景落地。

  AI语音公司出门问问创始人李志飞对财新记者表示,在2B行业中,AI视觉公司比AI语音公司在创收上更为成功。重要的原因是AI视觉在解决非常小且具体的问题,比如美颜,但在语音识别领域这样清晰定义的情况很少。

  创新工场创始人李开复则告诉财新记者,图像识别相比语音识别,更能击穿场景。对于人类来说,识别语音和识别语意是同步的事,但机器并非如此,语音识别和自然语言理解是两个步骤:“如果能够实现听得懂,那么应用场景将极大拓展,但只能识别语音,却在应用上受到很大限制。”最直观的案例是,目前应用于很多会议场合的语音识别软件,一旦遇到中英文夹杂的演讲对象就有些“思维混乱”。

  即使语音识别受到诸多限制,该领域也诞生了科大讯飞( 002230.SZ )这样市值超过800亿元的小巨头。业界以此参照,认为视觉AI公司的中长期价值趋于乐观。

安防市场再度繁荣

  AI视觉在中国第一个爆发的场景是安防。几乎所有AI视觉公司都先切入这一领域,大量公司的“第一桶金”来自政府采购。

  AI视觉应用于安防的精确度惊人。在上海白虹软件科技股份有限公司(下称白虹软件)的办公室,财新记者提供了一张自己十几岁时的照片,工作人员将它输入后台。只凭借这一张照片,系统就自动关联出了记者被园区摄像头拍到的画面,以及手机号码、身份证号码等信息。

  白虹软件董事长胡力和称,这套系统可以实现“车过留牌、人过留脸、机过留号”的功能,公安内部的数据库从这三个维度甄别信息,可以完全锁定目标对象。

  2017年4月,公安部发布《公安科技创新“十三五”专项规划》,对下一步公安科技创新工作进行总体布局和系统阐述,通过专项规划的实施,开展知识创新、技术创新、应用创新与管理创新等四类创新;促进技术与装备的智能化、数据化、网络化、集成化、移动化应用。此前,中央高层已将公共安全视频监控系统建设纳入“十三五”规划和国家安全保障能力建设规划,部署开展“雪亮工程”建设。而“雪亮工程”的一项重要规划就是,统一管理目前还分属于政府各部门、社会机构的摄像头及其后台数据。

  从中央到地方,公安系统在技术侦查方面的资金投入逐年增长。据接近公安部门的知情人士透露,福州市公安部门刚刚完成8亿元的人脸识别项目招标,上海市公安部门在未来三年的相关预算高达数百亿元。“公安部门相信,一个城市只要有足够的资金投入,治安一定没问题。在现有的技术下,想找谁都能找到,大部分案件可以覆盖。”这位人士说。

  “所有最尖端的技术最开始一定用在最有钱的地方,过去是军工业,如今是AI用在政府类安防上。”深鉴科技创始人兼CEO姚颂认为,AI的部署成本决定了它的落地市场。

4.jpg 5.jpg 6.jpg

  深鉴科技本是AI芯片公司,姚颂看到了安防市场的机会:在前端,一方面监控视频质量在改善,拉高了数据传输量和带宽成本;另一方面,实际场景中网络条件不一,比如小区、公交车上网络可能不稳定。这使得前端数据要提前做筛选,乃至直接在前端做人脸识别。而前端的智能化,也给中端传输、管理、储存的设备和后端服务器带来了更新换代的需求。

  姚颂指出了进入安防领域的三个理由:首先,市场足够大,预计2017年整体安防市场收入能达到6000亿到7000亿元;其次,安防市场已存在多年,公司能够快速获得收入;第三,安防市场非常分化,公司能够切到一块“蛋糕”。

  安防市场是“大蛋糕”,这是行业共识。“今年(2017年)有这么多公司都去得起深圳安防展,说明什么?这些公司都还活着,安防市场是足够大的。”旷视科技CTO唐文斌谈到市场竞争时毫不担心。

  从技术层面看,目前算法公司的能力和安防市场需求也相当适配。唐文斌指出,AI视觉的最高应用门槛在自动驾驶领域,这一场景高度依赖机器独立完成。但在安防领域,是人机混合的逻辑,机器所要解决的问题更清晰:“并不是说识别出一个坏人,机器就会自动开枪把这人枪毙了。”唐文斌说,在安防上,是用机器挖掘情报,再通过人工研判的方式加以处理。这使得即便有一些极端情况(corner case)没有解决,也不至于产生灾难性的结果。

  安防的技术升级需求,还需要算法公司更加努力地去满足。“抓逃,是目前公安部门最重要的应用点。”上述接近公安部门的知情人士表示,目前人脸识别技术还不能实现真正的智能识别,主要还是基于“比对”功能,如果“比对库”过大,就很难识别。AI视觉公司的技术最多只能承担80万张的数据库识别,如果是更大的量,误差就很大。他举例称,以全国通缉犯数据库的规模,按目前比对技术就可以满足。

  有系统集成商人士向财新记者透露,人脸识别设备在公安系统的市场成交价约为4万-5万元/套,包括摄像头和分析算法,其中摄像头硬件价格大约在7000元-1万元,可见算法的价值占据大头。

  “我们是将软件的成本摊到了硬件上,因为政府采购的习惯是:可以接受‘看得见摸得着’的硬件叫高价,却接受不了高价软件。”该人士解释称。他坦承,目前的利润率的确很高,随着市场化程度越来越高,价格下降是趋势。

  唐文斌认为,安防市场规模未来会有数倍的扩张,原因在于随着现有数据被使用,更多算法和模型出现,安防市场还将激发更多的应用场景。

  这是中国安防市场的第二轮激战,上一轮始于十年前,主要竞争模式是硬件加上摄像头存储和视频接入管理系统。“上一轮安防竞争差不多已经盖棺定论了,海康、大华占主流,但大大小小公司都有生存空间。”华先胜说。

  而以算法切入的AI视觉公司成为第二轮安防市场竞争的主力,一入场就面临传统势力的“虎视眈眈”。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


本帖被以下文库推荐

沙发
william9225 学生认证  发表于 2018-1-2 21:00:38 |只看作者 |坛友微信交流群
海康威视们:敌人还是伙伴?

  “新兴AI视觉公司对战海康威视,类似小米刚出来时对战vivo和OPPO,短时间内通过产品和低价策略可以一拼,但更长远来看,技术壁垒并没有想象的那么高,海康等积累了商务能力和渠道资源的公司,仍可能保持市场地位。”一位安防领域分析师对财新记者分析称。

  海康威视2001年成立,赶上第一轮政府对布局摄像头系统的需求:“海康一开始并不被私募市场看好,那时大家对政府需求的稳定性持怀疑态度。”一位VC机构合伙人透露,曾有投资机构以较低价格获得海康威视高股权占比。经过多年的市场鏖战,海康终于奠定行业龙头位置。

  根据市场调研机构iHS的报告,海康威视连续六年(2011-2016)位列视频监控全球第一名,2016年市场份额达21.4%,营收约320亿元;列于其后的大华营收约130亿元。伴随着第二轮安防市场需求爆发,海康威视的股价在2017年上涨了超过1倍,总市值已超过3500亿元。

  海康威视总经理胡扬忠将海康与电脑行业的联想、通信行业的华为相类比。他认为,安防行业链条非常复杂,包括摄像机、存储、显示、应用系统等,客户的认可等都需要时间,“行业基本定型,新进入者已没有太多机会”。

  这拨新进入者最终用算法撬开了市场,但市场上下游产业链众多,和海康做敌人还是合作伙伴,是现阶段很多AI视觉公司面对的首要问题。

  林晨曦告诉财新记者,谷歌AlphaGo教育了政府部门,令其意识到摄像头带人脸识别要成为标配,从这一角度出发,海康不得不面对算法类公司。

  不过,海康威视在安防领域也形成了全产业链,从起家的网络硬盘录像机到安防视频监控系统,再到最新的智能算法分析,均全面布局。据财新记者了解,海康的AI团队有千人级别。

  “海康一揽子都干的优势在于,如果有一个环节落后,就可以把这个环节报低价,然后把利润转到别的环节。”一名AI视觉公司人士称。在他看来,海康威视等传统厂商给采购方灌输的思想是,人脸识别算法各家差不多,技术会趋同:“过去多年,海康先放任小公司去承担创新风险,一旦小公司做到了技术,海康就利用全国销售体系追赶,那些创业小公司可能没卖几个地方,海康就赶上来了,剩下的市场还是它通吃。”

  因而,对新兴算法公司而言,市场拓展变成竞速游戏,它们需要从市场上融入大量资本,一为迅速撑大自己的体量,造势品牌,二为“烧钱”于规模化的渠道与商业拓展。而面对手拿大把现金的AI视觉公司的挑战,海康要追赶的是技术。

  依图创始人林晨曦告诉财新记者,在省级过亿级数据库范围的竞争中,算法精准度的高低仍是竞争关键,海康目前尚未赶上。

  而旷视、云从、依图等从算法起家的AI公司,也都在推软硬件一体的设备,包括智能摄像头、智能门禁等,加速进入海康的领地。

  唐文斌指出,仅仅提供SDK(软件包)的商业模式并不成立,要沿着数据链,把技术转化为产品,打造垂直行业的闭环解决方案。新需求要求高度集成方案,唐文斌发现,传统厂商的人脸识别摄像头无法胜任地铁口等超大人流量的场景,旷视也找不到合适的硬件合作商,最终自己基于可编程芯片FPGA开发了一套软硬件产品。

  旷视在C轮融资中引入了富士康。唐文斌称,旷视希望建立自己的硬件生产能力,但能力未必要自己全方位具备。

  安防的数据链分为三个部分,即前端摄像头、中端接入平台以及后端处理系统。唐文斌称,其中前端的非智能摄像头,中间管理、组织、存储影像的接入平台都是旷视不擅长的,也不会去做,让海康威视、大华、东方网力这样的公司去做。旷视擅长的还是对数据的分析处理和对算法的理解。此外,旷视的业务线也会有所侧重,比如在公安内部又分为刑侦、技侦、网络安全等,在不同的细分领域和地区有不同需求。

  在深鉴科技创始人兼CEO姚颂看来,朋友和敌人之间没有中间地带,“当你自己都做摄像头、承接智慧城市项目,那么(海康威视、大华等)这些公司就不会放心跟你合作了。”

  姚颂将业务边界定在AI核心模组,可集成在摄像头等产品中,服务海康威视、大华等安防设备集成厂商,其竞争对手是海康威视的芯片供应商海思等。

  “不可能在短信服务上颠覆中国移动,而是要选择微信的角度。”徐立认为,海康、大华的传统安防业务已经完备,商汤瞄准的是智能化带来的增量价值。他强调,“做增量部分必须要跟原有设备商、集成商形成上下游的关系,甚至是紧密的合作。“这也是为什么前十家厂商中七家都是我的伙伴。”

  商汤曾在2015年与传统视频监控厂商东方网力( 300367.SZ )成立合资公司深网视界。东方网力出资5000万元,持股51%,商汤则以技术作价出资,持股49%。合作协议规定,合资公司每年向商汤支付1000万元,以获得商汤人脸识别、模糊图像处理软件产品在公安领域独家销售代理权以及相关技术许可。双方还确定了2016年5000万元、2017年7000万元的销售目标,如果没有完成,东方网力将向商汤补足。

  不过,深网视界2016年的营收未及预期,2017年上半年的营收仅1555万元,净亏损743.3万元。合资公司于2017年5月引进了新投资者,获得新老股东共7530万元增资。

  在公共安全领域,人脸识别设备不是单独应用,而是配合“电子围栏”手机信息识别、定位,加上庞大的公安数据库和后台控制,组建成“天网系统”的架构。

  公安系统属于涉密行业,市场相对封闭,准入门槛高,供应商比较稳定。只有进入系统供应商名录的企业,才可能参加政府项目采购招标。无论是老玩家海康威视等,还是新一代AI视觉公司,都很难直接将产品卖给公安部门,而是需要通过公安部门的系统集成供应商。

  现在,公安系统的内部壁垒正在打破。此前公安部各直属局分管不同警务职能,“车过留牌”归交通管理局负责;“人过留脸”归科技信息化局负责;“机过留号”归行动技术局负责,各部门有各自供应商系统和管辖范围。“随着互联网技术覆盖和社会演变,现在的趋势是单独成立一个类似‘大数据办’的部门,将三个部门的数据融合,最大效率地利用资源、对接市场。”一位长期和公安部门有业务往来的人士透露,上海市正在做这样的尝试。

  新的采购体系意味着新的渠道机会。算法公司和海康威视的渠道鸿沟,或将缩小。

场景是王道

  安防市场在2016年到2017年快速爆发并红海化。看到了商业落地前景的风险投资基金一改对学术创业的不看好,纷纷追入几家头部公司。

  两年前情形却大不相同。2014年,资本对AI视觉的理解基本停留在“团队+概念”层面,那时这类公司被归入大数据或人脸识别。一些VC认为“科学家创业”必死,原因是这类团队通常只会技术、不会拿单。

  科学家创业团队必须证明自己有拿单能力。林晨曦告诉财新记者,2013年依图团队通过一个很远的朋友,找到了苏州一位管科技的副局长,在他给警察学校上课的间隙争取了五分钟时间介绍了依图团队:“那时根本不敢提人脸识别,想都不敢想,那是需要高度信任的场景。”

  但就是这次交流,让林晨曦知道了交通系统的强需求:识别车辆。原有的供应商识别率为30%,在实际操作中几乎无用,政府提出的理想识别率是70%。在前期,依图通过自己上街拍车辆照片已经识别超过100个品牌类型。政府决定让依图试一试,五个品牌车辆,两到三周之内,依图给出了95%的识别率成绩单,两三个月之后,100个品牌的识别率仍是95%。

7.jpg
2017年10月30日,山东大学学生宿舍楼内的人脸识别系统,学生通过“刷脸”进出宿舍,学生面对设备站定两三秒,脸部数据比对成功即可通行。

  “订单下来了。”林晨曦回首依图拿下的第一单仍记忆犹新,此后他又拿到了人脸识别的订单。即便有了订单,投资人对依图定位的2B市场仍不看好。“单子做下来了,但没有人觉得会爆发。”林晨曦说。

  旷视也同样在寻找场景。旷视2012年把视觉识别技术应用到游戏中,尽管该款游戏的下载量一度攀升至苹果中国应用商店的游戏榜单前列,但唐文斌发现仍无法形成真实需求:“只能带来短时的新鲜感,对用户价值有限,类似的伪需求还有手势控制空调气温等。”

  2C的技术要求更高:“现在很多AI在2C端的应用,仍让用户觉得是‘人工智障’。”唐文斌说。

  汤晓鸥团队在各创业团队中可谓豪华阵容,自称拥有18个教授、150多位博士。类似很多AI行业顶尖人才的经历,汤晓鸥毕业于麻省理工学院,进入香港中文大学任教研究,创业时为信息工程系主任,兼任中国科学院深圳先进技术研究院副院长,中组织部“千人计划”入选者。因汤晓鸥个人在学术领域的成就,市场多尊称其为“汤老师”。

  鼎晖资本管理合伙人黄炎告诉财新记者,正是看中商汤在人才储备上全国第一,鼎晖才在2015年决定投资:“说实话,我当时是忐忑的,那时收入情况还难以撑起10亿美元估值,但随着2017年资本都进来了,我就放心了。”

  各家都在寻找场景,在安防场景整体爆发前的2015年,金融市场的需求出现了。林晨曦发现,市场上的银行系统人士都开始谈论人脸识别。这一年,以微众银行为代表的网络银行已提出利用人脸识别远程开户。

  华创资本联合创始人熊伟铭告诉财新记者,银行和金融机构拥有巨量数据,是AI的强应用场景:“2017年,基本上所有银行和很多非银金融机构都在用人工智能提高效率,比如提高信用卡投放效率,更好的风控,农行已在全国推无人职守营业厅。”在他看来,金融系统的AI运动有自上而下的动力。所有设备都从总部到县城一键触达,这种互联网化的运营方式意味着总行得到了集权。

  金融之后,医疗、物流等领域相继出现了各类具体需求。视觉AI公司终于等来了好日子,单子纷至沓来。风险投资资本、产业资本和政府基金也追随而来。

  产业资本带着供应链,“国”字头投资人则成为在高壁垒行业拿单的“背书”。云从科技脱胎于中科院重庆研究院,B轮资金中有20亿元来自广州市政府;旷视科技在C轮融资中引入了中国国有资本风险投资基金;商汤科技的B2轮则由赛领资本领投,赛领资本的大股东是上海市政府旗下的上海国际集团有限公司。

  黄炎说,这一轮人工智能的发展作为国家战略,各级政府极为重视。目前很多城市开始打造新的地区性产业集群,很多工厂和产业园都需要视觉AI技术支持:“如果政府投资可以帮助引入当地产业园区,这样的(混合所有制的资本)模式就很好。”

8.jpg
2017年4月20日,旅客在青岛机场安检通道“刷脸”过检。该系统抓取旅客脸部图像与身份证件头像进行比对,可快速甄别乘机旅客身份,提升安检辨识准确率和效率。

  信任解决之后,到了拿订单仍看能力。但是,多位受访者认为,事实上,各家算法的差异在实际应用中并不构成绝对的竞争力。

  黄炎指出,视觉AI的应用分为关键任务和非关键任务两类,自动驾驶类属于关键任务,没有任何容错率,算法的精确率99%还是99.9%不是0.9个百分点的差别,而是10倍的差别,因此任何技术精度的提升都至关重要,哪怕小数点后提升一个点都能获得更强的竞争优势。但类似安防场景,精准率要求就没有那么高,“价格可能是采购方考虑的重要因素”。

  唐文斌称,旷视在三分之一到二分之一的项目竞争上会碰到商汤、云从、依图等行业头部对手。林晨曦则认为,各家在标杆案例上常常“狭路相逢”,但行业足够大,各家拿单都不成问题。

  目前,三家头部公司已开始有意识地错位竞争,但安防、金融是各家都不放手的领域。商汤和旷视同在布局手机端的人脸识别。唐文斌称,目前旷视开始关注工业自动化领域,希望将AI与制造业相结合。

  商汤意在多元化布局、打造AI生态,现已进入4个领域14个细分产品,以不同产品线切入细分行业,但背后的技术实质是有共性的。徐立认为,“跨行业之间有很大的协同作用,但行业细化才能形成垂直化、标准化的产品,从而每个行业并不需要投入太多工程研究产品人员,可能只需要销售和市场拓展来进行升级。”

  徐立称,在安防、金融等之外,商汤着重布局互联网尤其是视频行业:“我们将行业分为两类,2020年之前主要是各类替换人力的行业,而2020年之后会有更多交互类应用场景的需求。”所谓交互类应用场景,包括互联网直播等,常见应用是各类秀场主播们头上出现的各类兔子耳朵、猫耳朵:“目前市场几乎所有主流App使用的AR(增强现实)技术都是商汤提供的,我们在互联网领域已有120家合作者。”

  依图着重在医疗领域下功夫,融资主要用于医疗行业团队建设和布局,在国内推出了第一个真实应用于人工智能影像诊断的产品,识别肺叶结节,已在上海、浙江的多家三甲医院部署。

  商汤和旷视的人员扩张进入快车道,目前旷视有700多名员工,同比增长翻倍,而商汤的员工已达1500人。

如何抵御巨头“扫荡”

  BAT(百度、阿里巴巴、腾讯)等互联网巨头在2C(消费级)市场拼杀多年,早已习惯“羊毛出在猪身上”的模式,通过免费方式获取数据,比如百度在语音识别上的免费接口,就让科大讯飞感受到了压力。

  黄炎指出,互联网巨头也在积极入场AI领域,创业公司如果不从商业模式层面创新,最终将很可能被“扫荡”。

  除了团队和技术,没有更多重资产的AI视觉公司,动辄融资数亿,它们要这么多钱做什么?“主要是抢在竞争对手进入前,获取更多行业的更多数据训练模型。”一名业界人士称。

  资本和数据仍是有效的“护城河”。多位采访对象指出,训练算法模型的数据并不需要巨量,但某些特定需求的数据不易获取。中科院计算所研究员山世光将其称为数据贫瘠领域,比如识别打架、徘徊、小偷小摸等定义不清晰的问题的数据就很难获取,若想完全通过深度学习来解决问题存在困难。

  山世光认为,各个场景的差异化需求,给创业公司带来时间和人力成本上的压力。比如一家公司想开发AI模型,让机器人识别小区地上的狗屎,从而及时汇报、清除。看似简单的需求,在实际操作中需要的流程是先去收集狗屎的图像数据,再训练模型、部署模型:“今天是检测狗屎,明天可能是矿泉水瓶子、塑料袋或芹菜叶,光垃圾就有几百种,每一种都用深度学习方法去做,最少需要三个月时间,每一个细分需求都需要以同样流程来解决,时间成本极高。”

  人力则是另一个瓶颈。山世光表示,在计算机视觉行业中,硕士毕业生的年薪已经到了30万到50万元,博士能达到50万到80万元。普通创业公司根本无法负担。

  “事实上,AI视觉公司的商业模式是传统的项目制模式。”黄炎指出,项目制意味着B端可以拖欠账款,可能踢掉公司找他人替代:“这样的模式能走多远?做多大?”

  BAT三家的视觉AI服务首先应用于自身业务场景,比如手机淘宝中通过图片搜索商品的拍立淘,就是由内部团队开发,负责人是华先胜。腾讯优图团队的视觉AI则应用在了手机QQ、QQ音乐、微信等各类场景。

  随着互联网公司深入线下,其视觉AI团队也开始服务外部市场。

  华先胜告诉财新记者,2016年4月,他从服务内部视觉AI的团队调任阿里云,成为阿里AI部门iDST的视觉方向负责人,很大一块业务就是帮助阿里云城市大脑提供视觉AI支持。

  在华先胜看来,阿里做视觉AI是从项目出发,形成产品化模型和解决方案,最终的目的是搭建平台。他透露,阿里云做项目,一开始在底层系统设计上就开始考虑未来复制的代价,目前项目正往产品化转型,最终形成解决方案。进入其他类似场景时可能需要一些微调,最后希望达到的效果是不再重复投入算法类人员,而是依靠运维人员,用户需要的各类能力可以直接勾选。

  华先胜认为,创业公司从底层开始搭建平台投入过大,不过新生市场客户目前也并不在互联网公司手中,在这一点上初创企业和大公司没有区别:“这个行业,算法是核心,但平台、用户、数据和商业模式都很重要。”

  腾讯优图也在医疗、安防、金融等各个领域布局。最新的案例是和微信支付共同开发了绫致集团的智慧店铺。绫致集团作为丹麦企业,其主要业务却在中国,旗下ONLY、Vero Moda、Selected和Jack&Jones四个品牌几乎是中国线下零售的标配门店。微信支付进入线下零售行业已久,在新一代AI浪潮中,视觉AI提供的能力包括刷脸支付等场景。腾讯优图将这类解决方案定名为Mall智能零售系统,以产品模式进入零售市场的打法初现端倪。

  初创公司中战略“野心”最大的是商汤。徐立自称“T字型”业务布局,一横是标准化产品,加上各垂直场景的方案,打造基于AI视觉的生态系统,其思路堪比阿里的平台化战略。

  不过,多名业内人士指出,以目前的AI技术,在视觉领域很难快速完成行业复制,因为每一个垂直行业、甚至每一个项目,都有极其差异化的需求,但AI技术又绕不过对应场景的大数据获取与算法训练,这使得所谓的生态协同与规模化都成为挑战。

  另一边,初创企业为满足场景对解决方案的需求,已开始通过上下游投资集成技术能力。商汤投资了VR硬件公司,而依图投资了芯片厂商。

  所有玩家都在加速跑,但AI行业一定是一场耐力赛。“互联网是革命,AI是革新,在很长时间内都是逐步渗透取代人力的过程。”黄炎说。■

使用道具

藤椅
啸傲江弧 发表于 2018-1-3 00:28:44 |只看作者 |坛友微信交流群

使用道具

板凳
HappyAndy_Lo 发表于 2018-1-3 14:31:46 |只看作者 |坛友微信交流群

使用道具

报纸
anoya388 发表于 2018-1-3 17:31:18 来自手机 |只看作者 |坛友微信交流群
好文。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 19:34