人工智能的演进逻辑是行业应用会最先落地,通过不断积累训练集和校正参数带动基础应用的发展,进一步引起高级应用的爆发,然后再推动行业应用的良性闭环。
图表1: 人工智能应用的演进路径
虽然已有不少应用先例,但人工智能目前起到的主要是辅助作用,距离重塑应用还有距离。这就意味着人工智能带来的行业增加值还需要时间的积累才能真正爆发。 首先,尽管相关算法在实验室中成绩越来越好,但实际复杂场景下的表现能力还是不尽如人意。比如我们经常听到的某算法人脸识别准确率98%以上,实际上都是基于特定人脸数据集的训练和检测结果,在实际场景中会大打折扣。在实际复杂场景中的表现正是目前人工智能的重点与难点。
图表2: 科大讯飞麦克风阵列面临的现实问题与解决方案
其次,终端人工智能芯片还未大规模普及,这就导致消费端只能实现一些较简单的人工智能应用,比如比较简单的语音助手和人脸识别。 我们认为2-5年内人工智能才会真正迎来行业应用的成熟。
当机器学习水平比人类低时,它的准确率提升是很快的;超越人类后,准确率提升效率就逐步降低。并且,在人类水平线的上方,有一条贝叶斯最优误差(Bayes Optimal Error)线,这是人和机器学习永远都无法逾越的。
图表3: 机器学习性能提升曲线
以人脸识别为例,在LFW数据集下,目前的深度学习算法可以普遍达到98%以上的准确率。但是诸如High-dim LBP等经典的非深度算法也可以达到95%——这意味着在数据集扩大、方法更新的几年里,成功率也不过增长了3%。
图表4: 不同人脸识别技术的准确率比较(基于LFW数据集)
随着深度学习的发展,各家基础技术提供商的差距逐渐不再可感。如果继续深耕识别技术,路会越走越窄,投入与效果的提升远不成正比。 人工智能的技术壁垒渐消,底层技术提供商就容易受到巨头价格战和免费模式的绞杀,这在移动互联网时代已经屡见不鲜。昔日行业巨头纽昂斯(Nuance)的历史很好的证明了这一点。
纽昂斯作为iPhone Siri背后的技术提供商被人所熟知,是一家典型的语音识别基础应用提供商,其技术主要面向智能医疗和移动互联网。在2011年iPhone4s畅销之时,纽昂斯在全球语音识别行业的市场份额超过70%。然而最近几年其营收增长基本停滞,更是连续三年亏损,市场占有率锐减一半。根本原因是其主要技术接受方(谷歌、苹果、三星等)开始研发自己的语音技术,纷纷摆脱对纽昂斯的依赖。
当然,我们认为基础应用商作为科研成果的第一步产业化和公司未来的战略布局也是非常重要的,将来人工智能的重大突破必须需要基础应用商的带动。只不过目前技术奇点还没有到来,人工智能整体上还处于感知阶段,距离认知、自我学习还比较遥远,技术突破需要长期大量的投入并且很难预料产出,这注定是有资源和技术积累的大厂的独舞。