wanggc023 发表于 2013-5-16 08:55
王老师,您好!
现在big data 在社会上引起了广泛的关注,包括统计学和机器学习,计算机等领域的很多专家。 ...
这是一个很好的问题。
(1)首先,我认为“Big Data”是一个被过度爆炒的商业概念,就像是房地产泡沫。所有的企业、科研单位,都在从对自己有利的角度解读什么是Big Data。我认为数据分析,就是数据分析,有不同的情景,不同的问题。That's it。跟数据是否Big or Small,没多大关系。
(2)但是,现在的数据确实和几十年前的不一样的,对传统的统计方法有挑战。主要表现在:维度高了,结构复杂了(网络数据),非结构化了(文本,图形,声音),等等。这些对传统的统计分析是有挑战的。
(3)我认为,现在社会需要的数据分析者需要具备三种能力:第一、大规模数据采集整理的能力(爬虫、SQL,API),第二、数据分析能力(数学、统计),第三、商业理解的能力(营销、管理、经济学)。这三个能力被普通大学割裂在三个不同的学院中,无法发挥集体优势。而统计学专业对这方面的研究是落后的,原因是:我们不具备大规模数据采集和整理的能力。我们输在起跑线上。因此,跨学科的合作,非常必要。我本人的研究团队中,就一定要有计算机专家。