文:天竺居士
在本文的讨论之前,先来回顾一下拉普拉斯的决定论。
拉普拉斯的原话是这样的:
“我们应当把宇宙的现状看作它先前状态的结果以及它的后继状态的原因。假定在某一时刻,有一种智慧能够把握自然界所有的力以及组成自然界的一切事物的特定状况——这种智慧博大精深足以对所掌握的资料进行分析——那么,它就将宇宙间从最庞大的物体到最微小的原子的运动全都囊括于同样的公式之中,对于它来说,没有什么是不确定的,未来,一如过去,都出现在它的眼前。”
拉普拉斯决定论的确立可以说是“笛卡儿分割”的必然结果。“笛卡尔哲学在关于物质界的全部理论上,是严格的决定论。活的有机体完全和死物一样受物理定律支配;不再像亚里士多德哲学,需要有‘隐德来希’(entelechy)或灵魂来解释有机体的生长和动物的运动。”
拉普拉斯决定论的影响是极其深远的。它意味着,未来在终级的意义上是可以预测的。
在这样的决定论范式下,诸如 “世界是物质的,物质是运动的,运动是有规律的,规律是可以认识的”之类的教条是成立的。因此如果存在一个超智慧的领袖,他能认识到规律并能“看”到人类的终极目标,那么我们就可以由他来“顶层设计”人类社会的制度和道路,以快速实现那个终极目标。
然而,在这样一种决定论范式指导下的实践给二十世纪的世界带来了灾难性的后果。
痛定思痛,一部分放弃了“自上而下”(top-down)的决定论范式。而另一部人则依然痴心不改,他们把失败的原因归结为仅仅是因为那些“领袖们”的失误。他们认为,如果随着科学技术的发展能够发明一种机器,它的智慧“博大精深足以对所掌握的资料进行分析”,那么拉普拉斯所预言的“未来,一如过去,都出现在它的眼前”就是可能的。
现在,中国出了一个马云,他认为这样的一种“机器”已经出现了,这就是基于大数据云计算等技术的人工智能。马云认为,大数据时代的出现让人类进入了万物互联的时代,取得对数据进行重新处理的能力也远远超过过去,对世界的认识将会提升到一个新的高度,大数据让预判和计划都成为了可能。因此,我们需要对计划经济和市场经济进行重新定义,市场经济不一定会比计划经济更好。
百足之虫死而不僵,旧的思维范式总是会寻找机会“借尸还魂”的。
为了对马云的观点有一个清醒的认识,我们还是从大数据谈起。
何谓大数据?我个人曾经下过一个定义:所谓大数据,就是关于人的行为的一切数据。
在大数据分析的视野里,所有的数据就像道路上的脚印,虽然看上去很杂乱,但却是“有迹可循”的。
静态地看,大数据分析中的数据不是混合的(mixed),而是聚块的(assorted):混杂的表面下隐藏着精细的结构。
动态地看,数据的“前后相随”形成了“足迹”,大数据分析技术可以帮助我们辨识出无数不同的足迹,但是这些足迹不是相互独立的而是相互影响相互关联的,有些足迹会“殊途同归”,而有些足迹则会“分道扬镳”。
接下来的问题是,哪些足迹会“殊途同归”,哪些足迹会“分道扬镳”?
大数据的复杂性就在于这些足迹之间会发生意想不到的相互作用。大数据的“大”,不在于数据的多少,而在于相互作用,其背后折射出的则是人类行为互动中所呈现出的复杂性。所以“大数据”用更加学术化的术语来说,应该是“复杂的数据”。
既然说到“足迹”,那就来说一说与此相关的一个字,即“道”。道由“首”和“走”两部分构成。这里的“首”指的是“人脑”。这就意味着,道是人行走而形成的路。
因为人是社会化的动物,所以如果将大数据类比于“足迹”,那么这些足迹之间就存在着相互作用。
相互作用,这是理解复杂性的关键!
十多年前的一天,正在杭州做学术访问的范老师突然问我一个问题:“小庆啊,老子说的‘三生万物’的‘三’到底指的是什么?”记得我当时从“天下万物生于有,有生于无”开始,强调这里的“三”绝对不能用实体主义来解释,因为这里的“三”实际上是在“二”出现后而自然而然产生的相对相关性以及随之展开的相互作用,即“三”既意味着“关系”(阴)也意味着“作用”(阳),所以 “三生万物”也可以说成“相互作用生万物”,而这正是“一阴一阳之谓道”这七个字或者“有无相生”这四个字所想要告诉我们的。
市场经济“看不见的手”正是行为主体之间周流不息无所不在的相互关系和相互作用,也正是老子“有生于无”的“无”。之所以“看不见”,是因为相互作用的复杂性远远超出了我们的理解——本质上的无知。大数据只是行为主体所产生的“足迹”,是行为的结果,而不是行为之间的关系更不是相互作用的过程。大数据分析技术如同其他学科的分析工具一样,有助于我们理解并推测行为主体之间的相互关系和相互作用,但并不能让我们准确无误地捕捉到它们。
自从博弈论诞生以来,人们的行为互动就有了一个很好的分析工具,并诞生了诸多的均衡概念。然而,即使是像三策略的锤子-剪刀-布这样的博弈,在演化的过程仍然会出现具有吸引性的异宿环,而它揭示了一类不同于混沌现象的确定性系统的不可预测性(Nowak,2006)。
说到确定性系统的不可预测性,就说到了混沌现象。
在确定性的系统中发现混沌,改变了人们过去一直认为宇宙是一个可以预测的系统的看法。用决定论的方程,找不到稳定的模式,得到的却是随机的结果,这彻底打破了拉普拉斯决定论的幻想。
混沌现象肇始于上世纪初数学家庞加莱提出的三体问题,这是天体力学中的基本力学模型。它是指三个质量、初始位置和初始速度都是任意的可视为质点的天体,在相互之间万有引力的作用下的运动规律问题。
庞加莱最后证明了,这是一个混沌系统,任何微小的扰动都会造成不可预期的效果。
混沌系统的本质在于相互作用的非线性本质。
回到大数据。
假设行为主体是同质的完全理性的个体,因此可以将其视为物理学中的质点(因为质点和完全理性的个体的反应模式是一样的,都是刺激-反应模式),于是,根据庞加莱所揭示的,即使是三人的互动也会产生非线性的混沌系统,更不用说无数个体的互动了。
混沌系统对初始条件是高度依赖的。
数据是人们行为留下的痕迹。不管我们的测量有多么精确,这些数据都是对人的行为的一个近似记录,它不可能是行为本身,更不可能通过数据能精确窥知行为主体的认知结构、偏好等主观因素。即使技术发达到能够让我们对这些主观因素做出足够精确的估计,但毕竟也是近似值。混沌动力学告诉我们,不管初始条件多么精确,只要是近似的,对于未来的预测就毫无价值。三体问题尚且会出现混沌现象,更不用无数个体互动的结果了。这就意味着,再详尽的数据记录对于我们预测无数行为主体之间互动的长期结果都是毫无价值的。
更加令人悲观的是,行为主体不是完全理性的,他的偏好不是外生的给定的一致的稳定不变的,而是内生于相互作用的过程中。也就是说,人是“情境理性”的。
情境是在社会交往的过程中开显的,它们只能被参与社会交往的主体所感受到,所以由此所形成的偏好是内生于社会交往过程的,并且会随着社会交往的过程中不断开显的情境而演化。
即使是通过对单个行为主体的追踪,我们运用大数据技术成功捕捉到了他过去直到现在的运行“轨迹”,我们也没有办法去预测其未来的轨迹。这是因为,我们无法预知什么时候他的偏好会随着不断开显的情境而发生改变甚至逆转。
新古典经济学的很多问题都可以归结为求条件极值的数学问题。如果条件不变,目标函数不变,那么只要最大值存在,所需要的就只是算法。算法有好有坏,好的算法收敛的速度快,而坏的算法收敛的速度慢甚至不收敛。大数据不过是提供了更多的信息,从某种角度上说不过是让约束条件变得不同,从而缩小了最大值可能的存在范围,进而可以加快收敛的速度而已。
然而,偏好是情境依赖的,这意味着目标函数是不断在变化的。于是,求解经常变得不可能。
另外,实证研究表明,包括动物在内的行为主体都有“关键性的一大跳”这一适应性的行为。例如,动物在觅食的过程中,先是在局部区域做布朗运动式的随机游动,然后突然间长距离的迁徙。
不仅仅是个体会有“关键性的一大跳”,作为无数个体相互作用形成的宏观现象也会有“关键性的一大跳”。例如,无数投资者同向交易的结果会造成股指单方面的暴跌或暴涨。
这“关键性的一大跳”使得传统的统计学正态范式失效了,取而代之的是以幂律分布为代表的重尾范式——随机变量的取值失去了控制而变成了“标度自由”(scale-free)。
有效市场理论所涉及到的随机因素都是与正态分布有关,如布朗运动、白噪声等,因而是可以控制的。而经济物理学家的实证表明,实际上是与重尾分布有关,如列维飞行(Levy-Flight)等,因而常常会失去控制。
大数据分析表明,在自然界和人类社会中,绝大多数现象都是标度自由的。在统计学中,与正态变量不同,标度自由的随机变量是不可预测的。
理性的行为是一致的,而非理性的行为是五花八门的。大数据本身可能就是人们非理性行为的产物,不知道这么说能不能够让你对大数据的膜拜有所减弱。
想说的话很多,暂时写到这里。
简而言之,大数据分析技术可以帮助我们理解市场,但是在终极的意义上并不能让我们预测甚至控制市场,这就像我们可以建立方程但不一定能够求解一样。


雷达卡



京公网安备 11010802022788号







