大数据互联网为心理学研究带来机遇和挑战
如今大数据互联网时代给我们带来了巨大的便利的同时,也给许多传统的行业带来了新的机遇和挑战。大数据的意义是由人类日益普及的网络行为所伴生的,受到相关部门、企业采集的,蕴含数据生产者真实意图、喜好的,非传统结构和意义的数据。所以就以大数据时代下心理学研究为例,看看为心理学研究带来机遇和挑战。
众所周知,传统心理学研究的数据收集方式通常采用观察法、访谈法、问卷法以及实验法等,这些方法多数是在控制的情境中让被试被动地产生符合研究人员要求的数据,以这些数据为基础经由统计分析得到的结论往往因为数据的非真实性难以推广到真实情景中去,因而缺乏外部效度。在大数据时代,数据的产生方式发生了变革,由被动产生变为主动生成,我们无时无刻不在主动产生着数据,这为提升心理学研究的外部效度提供了解决之法。另外,传统心理学研究的逻辑是先提出假设再验证假设,这是属于先验的;而在大数据背景下研究是以数据驱动的方式得出结论,利用相应的算法直接从数据中获取知识信息,属于后验。数据驱动的研究方式可以增强心理学研究的科学性。再者,传统心理学研究中的数据类型仅仅是经由实验或者测量所获得,大致包括称名数据(nominal data)、顺序数据(ordinal data)、等距数据(equal interval data)和等比数据(ratio data)四种,而在大数据时代所获得的数据类型呈现多样化、多维化,包括网络文本、音频、视频、生理数据等,依据这些多样化的数据能得到更多可用的研究信息。最后,传统心理学研究通常基于样本信息进行,这些样本容量有限,虽然心理研究者们采用随机抽样等方式力求获取代表性样本,但基于样本信息的统计分析还是存在较大误差,以致影响结论的获得。依靠大数据技术可以对研究总体进行直接分析,保障了分析的可靠性。
大数据在为心理学研究带来机遇的同时,也带来了诸多挑战。首先,大数据时代的数据来源范围较广,主要包括网络视频以及各类社交网站上传的图片、音频、网络日志、网页信息等,对这些大多非结构化数据的采集和储存需要心理学工作者至少掌握一门计算机语言,如Python、R、Matlab、Java等。其次,在处理结构复杂的数据时,往往会形成数据立方体,掌握数据立方体的运算就要求心理学工作者能够深入学习矩阵运算和线性代数等知识。再次,以往传统的心理学研究大多是基于统计学中的T检验、F检验、方差分析、结构方程模型等方法来进行的,而在大数据时代心理学研究分析多采用聚类分析、文本分析、多媒体分析等,对于这些方法的了解和熟练掌握也为心理学研究者带来了挑战。最后,若要做到将大数据技术与心理学研究很好地结合,数据挖掘相应算法也是需要了解和掌握的,如神经网络(Neural Networks)、遗传算法(Genetic Algorithm)、粗糙集(Rough Sets)、模糊集(Fuzzy sets)、决策树(Decision Tree)、随机森林(Random Forests)、朴素贝叶斯方法(Naive Bayesian)等。
大数据的产生、发展与研究还催生了心理学相关研究领域的拓展,如心理健康系统的建立、网络心理学、认知诊断评估系统的建立、消费者心理预测、交通心理学、环境心理学、通过社交网络分析人格等。心理学研究者应该抓住这样的机遇,将大数据分析技术广泛应用于心理学的研究中,开拓心理学研究的视野并促进心理学研究的发展。