[摘要]原本不被看好的共和党总统候选人唐纳德·特朗普后来居上,在选举人团选票方面以较大优势胜出,而成为美国第四十五任总统。事后复盘,善用社交媒体被认为是特朗普胜选的秘密武器之一。
【原编者按】
2016年11月的美国总统选举结果震惊世界。原本在几乎所有民调中都不被看好的共和党总统候选人唐纳德·特朗普后来居上,在选举人团选票方面以较大优势胜出,而成为美国第四十五任总统。事后复盘,善用社交媒体被认为是特朗普胜选的秘密武器之一。一些西方媒体进一步具体披露了大数据运用对特朗普致胜所起到的核心作用,以下译文即是这方面的一项深度调查。
本文第一作者汉斯·格拉西格尔(Hannes Grassegger)生于1980年,瑞士苏黎世大学经济学硕士,现任苏黎世德语周刊《杂志》(Das Magazin)记者。第二作者迈克尔·克劳格罗斯(Mikael Krogerus)出生于芬兰,《杂志》编辑、作家。《杂志》是瑞士全国性德语日报《每日导报》(Tages-Anzeiger)每周六出版的增刊,是瑞士发行量最大的周刊之一。
本文最初以德语刊发于2016年12月3日出版的《杂志》,后以英文于2017年1月28日刊发于美国网络媒体VICE,题为“The Data That Turned the World Upside Down”。译文由上海交通大学生物医学工程学院博士生张洁依据英文版本译出,略有简化。
文中所述细节和观点仅供参考。
2016年,11月9日上午8时30分左右,迈克尔·科辛斯基(Michal Kosinski)在苏黎世Sunnehus酒店醒来。科辛斯基今年34岁,是心理测验学(一个由数据驱动的心理学分支)领域的领军人物。他定期到世界各地就大数据和数字革命的危害性发表演讲。这次,他应邀来到瑞士联邦理工学院(ETH)发表这类演讲。打开电视时,他看到了一个爆炸性的消息:与所有主流统计学家的预测相反,唐纳德·特朗普在美国大选中获得了胜利。
科辛斯基耐心看完了特朗普的胜利庆祝活动以及各个州的选票统计结果。他突然感到,选举的结果可能与他的研究有关。最后,他深吸了一口气,关掉电视。
同一天,英国Cambridge Analytica公司(下称CA——编注)首席执行官亚历山大·尼克斯(Alexander James Ashburner Nix)发布了一份新闻稿:“我们很高兴,我们革命性的数据驱动沟通方式在特朗普非凡的胜利中发挥了不可或缺的作用。”尼克斯是位41岁的英国人,总是穿着考究的西装,戴着眼镜,一头金发整整齐齐地向后梳。他的公司在特朗普的在线竞选和英国脱欧中,均发挥了不可或缺的作用。
沉思的科辛斯基、穿着考究的尼克斯和咧嘴大笑的特朗普,这三位玩家中,一位开启了数字革命,一位执行了数字革命,而特朗普则收获了革命的成果。
大数据有多危险?
只要过去五年你没呆在外星球,你一定对大数据这个词耳熟能详。从本质上来说,大数据意味着,我们所做的任何事情,无论是线上还是线下,都会留下数字痕迹。每次刷卡购物,每次谷歌搜索,手机上的每一个操作,每一个“点赞”都会被记录下来。尤其是每一个“点赞”。很长一段时间,我们都不清楚这些数据的用途,除非我们在搜索过高血压这类关键词后,收到了高血压药物的广告。
11月9日发生的事情昭示着,这些数据的用途可能远远超乎我们的想象。负责特朗普线上活动的公司与负责英国脱欧线上早期活动的公司是同一家,即CA。为充分了解选举结果,以及未来政治传播的可能运作,我们需要从2014年科辛斯基所在的剑桥大学心理测验中心发生的奇怪事件谈起。
心理测验学,又称心理图案学,侧重于测量性格等心理特征。20世纪80年代,两个心理学家团队开发了一个模型,试图基于五个人格特质来评估个人性格。 这五个特质被称为“大五”(Big Five),包括开放性(Openness,对新经验的开放程度)、尽责性(conscientiousness,完美主义程度)、外向性(extraversion,社交活跃程度)、随和性(agreeableness,体贴和合作程度)和情绪稳定性(neuroticism,焦躁不安程度)。
基于这些维度或OCEAN(上述五个单词的首字母),心理学家就可以对一个人进行相对准确的评估,包括他的需求和恐惧,以及他可能采取的行为。现在“大五”已成为心理测验学的常规工具。但长期以来,这种方法的麻烦在于数据收集,因为它需要受试者填写一份复杂、高度个人化的问卷。然后有了互联网、“脸谱”网站(Facebook)和科辛斯基。
2008年,科辛斯基还是华沙的一名学生。这一年,他的生活发生了重大改变,他到剑桥大学的心理测验中心(Psychometrics Centre)攻读博士学位,这里是世界上最古老的心测验机构之一。当时,脸谱刚刚发布一年,还处于起步阶段。科辛斯基与同学大卫·斯蒂尔维尔(David Stillwell,现剑桥大学贾吉商学院讲师)合作,研究基于脸谱数据分析用户个性。他们开发的MyPersonality应用程序让用户填写不同的心理测验问卷,包括大五人格问卷中的一些心理问题(如“我容易恐惧”、“我与其他人矛盾”等)。然后,用户收到包括个人大五特质在内的自己的“个性简介”,并且可选择与研究人员共享个人脸谱资料数据。
最开始,科辛斯基寄希望于几十个大学朋友帮忙填写调查问卷。但在不久之后,数百,数千,然后数百万人通过脸谱为他提供了数据。两个博士生就意外拥有了全球最大、结合心理测验数据和脸谱个人简介的数据集。
科辛斯基等人在未来几年里开发了一种非常简单的方法。首先,他们以在线测验的形式向测试对象提供问卷。根据他们的回答,心理学家计算了受试者的个人“大五”分数。 然后科辛斯基的团队将结果与受试者的其他在线数据进行比较:例如,他们在脸谱上“点赞”、分享或发帖的数据,以及性别、年龄、居住地点等数据。这使研究人员能够建立特定网络行为与个性特质之间的关联。
他们发现,基于简单的在线行为可以推断出可靠的个性特质。例如,为化妆品品牌MAC点赞的男性更有可能是同性恋;异性恋的最好指标之一是为“武当派”乐队(Wu-Tang Clan)点赞。雷迪嘎嘎(Lady Gaga)的粉丝通常是外向者,而那些为哲学话题点赞的人一般比较内向。单独来看,这样的信息太单薄,不能产生可靠的预测,但是当几十、几百或几千个条这样的信息整合到一起时,就可以得到真正准确可靠的预测。(武当派是成军于纽约长岛的一只说唱乐队;雷迪嘎嘎是美国流行女歌手,以造型怪异著称。——编注)
科辛斯基和他的团队不懈地改进他们的模型。2012年,科辛斯基证明,平均基于脸谱上的68个“点赞”,就可以预测用户的肤色(准确度95%)、性取向(准确度88%)以及政治倾向(民主党或共和党,准确度85%)。可预测的内容远不止于此,还包括智力、宗教信仰,以及酒精、香烟和毒品使用。基于数据,科辛斯基甚至可以推断某人的父母是否离婚。
科辛斯基建模的实力体现在,该模型可以准确预测受试者对某些问题的答案。在不断研究和改进后,他的模型变得日益完善:仅仅基于10个点赞,他就能比受试者的同事更准确地评价受试者;70个“点赞”足以让他比受试者的朋友更了解受试者;150个点赞可以让他比受试者的父母更了解受试者;300个点赞可以让他比受试者的合作伙伴更了解受试者。基于更多的点赞,科辛斯基对受试者的了解,甚至超过受试者自己。科辛斯基发表这些调查结果的那一天接到了两个电话,一个是诉讼电话,另一是提供工作机会的电话,都来自脸谱。
几周后,脸谱的“点赞”功能默认设置为“非公开”。在此之前,点赞功能的默认设置是对任何人可见。但这对数据收集者来说不是问题:虽然科辛斯基使用数据会征求脸谱用户的同意,但许多应用软件和在线测验以用户数据共享作为进行个性测试的前提。(任何想根据脸谱的“点赞”评价自己的人都可以在科辛斯基的网站上进行评估,然后将他们的结果与经典的OCEAN问卷结果进行比较。)
网络上可用于个性测绘的数据非常之多,并不局限于点赞,甚至不局限于脸谱:科辛斯基的团队可基于用户脸谱账号的图片数目、联系人数目(外向的好指标),就可得到用户的“大五”分数。即使我们不上线,也会暴露很多个人信息。例如,我们手机上的运动传感器会显示移动的速度和旅行的距离(这与情绪不稳定性相关)。科辛斯基总结说,我们的智能手机是一张巨大的心理问卷,我们不断有意识、无意识地往上面填写答案。
最重要的是,不仅可以正向由个人数据得到个人心理档案,也可以反向由个人数据去定位特定人群:例如,所有焦虑的父亲、愤怒的内向者,甚至所有未下决定的民主党人。基本上,科辛斯基发明的是一种人的搜索引擎。他开始认识到自己工作的潜力,以及内在的危害。
对他来说,互联网就像上天的礼物。他希望能回馈、分享一些东西。数据可以复制,所以,为什么不让每个人都从中受益?这是这一代人的精神,更是一个超越现实世界的新时代的开端。但是,科辛斯基担心的是,如果有人滥用这个强大的心理测绘引擎来操控他人怎么办?他开始给自己大部分的科研工作添加警告。他警告说,他的做法可能对个人的幸福、自由,甚至生活构成威胁。但似乎没有人理解他的意思。
2014年初,科辛斯基认识了年轻的心理学系助理教授亚历山大·科根(Aleksandr Kogan)。科根说,他在代表一家对科辛斯基的方法感兴趣的公司向科辛斯基咨询,并希望访问MyPersonality数据库。科根不能透露该公司的目的,因为他签署了保密协议。
起初,科辛斯基的团队考虑同意这个提议,因为这意味着,研究所能拿到大量的钱。但后来他犹豫了。最后,科根透露了公司的名称:SCL,或“战略传播实验室”(Strategic Communication Laboratories)。科辛斯基谷歌了一下SCL,该公司网站上写着:“[SCL是]最领先的选举管理机构。”SCL基于心理建模提供营销,核心业务是影响选举。影响选举?科辛斯基十分困惑。这是什么样的公司?这些人打算做什么?
科辛斯基当时并不知道的是,SCL是一群公司的母公司。SCL的真正拥有者及其多元的分支机构尚不清楚,因为公司结构非常复杂。一些SCL子公司参与了乌克兰、尼日利亚等国的选举,帮助尼泊尔国王镇压叛乱分子,而其他子公司则帮助影响东欧和阿富汗公民对北约的态度。在2013年,SCL新成立了一家公司即CA,来影响美国大选。
科辛斯基对这一切一无所知,但他有一种不详的感觉。“整个事情开始朝坏的方向发展”,他回忆说。经进一步调查,他发现亚历山大·科根秘密注册了一家公司,与SCL开展业务。据2015年12月《卫报》(The Guardian)的一则消息,以及《杂志》周刊(Das Magazin)的内部文件,SCL从科根那里学习了科辛斯基的心理测绘方法。
科辛斯基怀疑,科根的公司模仿了基于脸谱的大五心理测验工具,以便将其卖给SCL这个影响选举的公司。他立即停止了与科根的联系,并通知研究所的主任,这引发了剑桥大学内部的复杂冲突。研究所非常担心这件事会影响机构声誉。之后,亚历山大·科根搬到新加坡结婚,并改名为斯派柯特(Spectre)博士。迈克尔·科辛斯基取得了博士学位,得到了斯坦福大学的工作机会,并搬到了美国。(迈克尔·科辛斯基现任美国斯坦福大学商学院组织行为学助理教授。依网络检索结果,亚历山大·科根目前以亚历山大·斯派柯特之名担任英国剑桥大学心理学系讲师。——编注)