与前几年忽然兴起的“大数据”热潮一样,“人工智能”(AI)这个概念,在2016年的科技界绝对风头无二,颇有些“天下谁人不识君”的阵势。
“大数据”和AI爆发的根基,是机器学习技术的发展。我们耳熟能详的AI展现形式,如人脸识别、自动驾驶及AlphaGo等,都是基于算法让机器从数据中学习规律,从而让机器可以自动决策的技术。简而言之,数据是机器学习技术的养料,AI是机器学习技术的产物。在这个数据体量急速增长,机器学习算法不断创新的时代,人们似乎看到了AI的无限前景。
而真实情况却远没有看起来那么乐观:数据体量虽大却繁杂——是充满养分却也被严重污染的土地;果实丰美却有着苦涩坚硬的外壳——计算机给出的结果不通过数据科学家的翻译常人根本无法理解。
人工智能的发展与应用,极大的依赖于数据科学家的科研创新能力,而如此稀缺的资源却常常被大量的数据清洗及特征抽取等繁琐重复的数据准备工作而占用。如同厨艺高超的厨师不能专注烹制美食,却需要花大量时间去洗碗摘菜。
当人力劳动不能被解放,任何一种科技创新都无法产生爆发性增长。
人工智能若要产生颠覆性的价值,就必须打破“有多少人工,才有多少智能”的魔咒。
数据科学家这个二十一世纪最性感的职业,到底性感在哪里?
我们常以为,数据科学家拥有举世无双的神秘法宝,用神奇的“算法”让原本需要人去执行的决策由机器来代替。
然而真相却是:数据科学家主要的工作是在处理数据,而非研究科学。
数据科学家超过90%的工作量在于准备数据,并且这个过程并不科学,更多是由各领域业务专家的经验和直觉驱动,同时还涉及到大量跨部门的沟通协作。
首先,面对海量数据,数据科学家需要花大量时间去了解到底什么特征(数据)影响一个目标问题,而设定这些特征几乎完全依赖业务人员的经验。在这个层面,数据科学家需要持续的将业务经验转化为数据特征,相当于不辞劳苦的数据记录员。
同时,数据科学家还需要向数据库管理员了解数据源的结构、数据字段的口径及不同数据表彼此间的关系等,进而针对现有数据的特性进行有效的数据清洗,相当于勤勤恳恳的数据清洁工。然后,模型需要在现有的系统中去验证和沟通,最终才能在IT部门的协同下将数据模型正式部署。
数据中自有黄金屋,数据科学家本应是点石成金的魔术师。然而,当下这种并不“科学”的数据科学应用过程,不但使数据的价值大打折扣,更让数据科学家的才能被“低级脑力劳动”牢牢捆绑。
为挖掘数据的价值而疲于奔命的,绝不仅仅只有数据科学家。
当今,许多行业都引入了数据化运营的概念,其目的是为了提高运营效率,协助业务负责人做决策。然而,当各种独立开发的业务系统越来越多,数据体量越来越大,系统维护、数据存储以及数据调用却逐渐成为企业的不可承受之重。
一方面,业务人员需要向多个系统持续输入数据,而这些花费大量时间录入的数据却在大部分时候都处于沉睡状态,仅停留在业务信息化而非智能决策的层面。只有当业务系统运行了一段时间,积累了一定量业务数据的时候,数据分析的需求才会显现。而在这个阶段,业务人员又要投入很多精力去制定分析指标,再交由技术人员开发数据可视化系统产出图表。最终,费时费力产出的数据可视化图表,依然只能通过业务人员主观理解来辅助决策,业务能力的高低直接决定决策结果。
由此可见,在传统的数据化运营体系中,数据的时效性和真正价值都在一个个“人工”环节里,被大量损耗,以极其不“智能”的方式陷入恶性循环的泥潭。
为什么本该威力无穷的数据科学技术,在商业应用上却变成了“鸡肋”?
无论数据科学家和业务专家怎样密切合作,仅仅依靠人的力量都不可能解决“有多少人工,才有多少智能”的困局。人工智能技术的关键,在于如何让机器更多的参与到与数据相关的各个环节,如何使人的智慧与机器智能在双边循环中迭代升华。
人机协作将孕育超越人类传统认知能力的智慧。
人的记忆力再强大,在拥有大数据存储能力的机器面前也显得不值一提。人的理解力再强大,在自己经验知识之外的新领域也难以获得快速学习的能力。人的执行力再强大,也无法7*24小时不间断的观察、比较和决策。人的协作能力再强大,也无法与成千上万合作伙伴进行分布式协作。
人工智能发展的关键在于人机协作,而人机协作的瓶颈则在于人机双向沟通。
著名的哲学家维特根斯坦说过:“世界上一切的问题,都是语言的问题。”人与机器的语言,有着根源上的不同。只有当人理解了计算机的语言,在重大决策上才能充分信任计算机给出的结论;只有当计算机学会了人的语言,才能承袭人已经被证实有效的经验,提升解决问题的效率。
“有多少人工,才有多少智能”的根结并不是机器不够智能,而是机器的智能和人的智能没有衔接点。人工智能的影响力,取决于人与机器沟通的质量。
机器理解的语言是程序,而让机器可以自我学习的媒介是数据。高质量数据越多,机器的自我学习能力也就越强。从早期的“专家系统(expert system)”发展到当今机器学习领域最热门的“深度学习(deep learning)”技术,人机互动已经实现了令人欣喜的三级跳:
专家系统(Expert System)诞生于本世纪70年代,是最早期的人机互动雏形。其基本原理是将人的规则逻辑直接翻译成机器可以执行的代码,让机器可以自动运行。专家系统是可以自我决策的机器,但却无法在变化的环境下自我学习。因此,专家系统仅仅可以简单直接地复制人的某一项决策机制,却无法拓展人的智慧。
以电商选品为例,一个电商网站需要选出10款商品进行营销推广,业务目标是选出在营销推广中最可能热卖的商品。一个专家系统的设计逻辑往往依赖于业务人员的过往经验,只要商品所在类目最近一个月销售额大于10万元,商品品牌最近一个月销售额大于1万元,则价格最低的前10款商品则为挑选营销商品。但是,这些拍脑袋拍下来的数字,却无法随着业务的变化精确的改变,于是专家系统赖以生存的规则依据存在着先天的局限。


雷达卡




京公网安备 11010802022788号







