近年来,随着我们社会工业化进程的加快,股票指数、银行利率、平均房价、个人所得税……“数字”日益成为与我们生活息息相关的一个话题。前几天官方权威部门公布的2008年度国家财政收入数据,财政部提供的数据是54219.62亿元,而国家统计局的数据则是57862亿元,二者的差距达到3500多亿元。这一巨大差异甫一公布,就引发部分民众对中国统计数据真实性的质疑。对此,财政部新闻发言人胡静林七日在此间接受采访时表示,数据差异主要是“统计口径不同”。
那么,作为一个普通民众而言,我们要如何理解这个“统计口径”?报表、柱状图、百分比、增长率……在充斥网络和现实的数据洪流面前,我们应该如何辨别真假,练就一双“火眼金睛”?
美国著名统计学家达菜尔•哈夫的名著《统计数字会撒谎》或许能让我们对于统计中的这些问题有比较深入的认识。自1954年出版至今,这本书多次重印,历久弥新。达菜尔举出许多活生生的案例,向我们一一解读了统计中的陷阱,读起来很有味道。
达莱尔提出,当你面对统计数据时,先要问自己5个问题:谁说的?他是如何知道的?遗漏了什么?是否有人偷换了概念?这个资料有意义么?
很多时候,那些真实的数据会给我们制造出不真实的假象。达莱尔以很多生动有趣而又极富有代表性的事例,为我们深入剖析了统计数据中的“重重内幕”。就平均收入这个我们息息相关的问题来说:一个小区的人均收入,地产商在宣传时的统计数据是10000美元,但是住在小区里面的人却以他们人均收入只有2000美元为由,集体签名申请见面税种。那么到底是谁错了呢?其实他们都没有错,区别在于统计方法的不同。通常计算均值有三种方法:平均数、中数和众数。平均数最好理解,就是把小区所有人的收入加起来除以总人数;中数就是小区里面收入处于最中间的那个数字,众数则是在统计时出现最多的那个数字。某种程度上,这三种计算方法都能够反映小区的人均收入。现在我们明白了:开发商为了提高小区的知名度,好把他的房子卖掉,所以故意采用了平均数这种计算方法;而小区居民们则用了中数或者是众数。实际上小区里面大多数居民还是处于低收入水平的,但是有一两个富翁的存在就把平均收入大幅度提高了。而他们或许平均一年都懒得来一次!
上面的故事说明计算方法不同,造成的差异能够有多惊人。而下面这个故事则为我们说明了选取足够多的样本的重要性。当初美国某大学有一个惊人的统计数字,据调查该校物理系有50%的女生和男教师同居,校方大为震惊。经过仔细调查,确实如此,该系有两名女生,其中一人与男教师堕入爱河……显然,这以后你肯定能够明白选取10个样本和1000个样本之间的区别。
如上所见,统计者只要在统计样本的选择上有意无意地做出一些“猫腻”来,就能够得到预期的统计结果。
统计的另一个陷阱在于统计之后的分析过程,在分析中,统计者是否遗漏了什么?或者忽视了统计所依赖的条件?哈夫在书中举了个例子:“某年公布的数据显示,该年4月的零售额高于去年同期,于是证明经济开始进入复苏阶段,但遗漏的内容是前一年的复活节在3月,而该年的复活节在4月,所以复活节带来的消费高峰在4月”。暂时的消费高峰显然不能代表经济的转向。
以突发事件代替常态,以小样本推广到大样本,再加上有意或无意的忽略,如果忽视了这些重要的因素,分析过程就会产生缺陷。即使是正确的统计数字也未必能得到正确结论。
桑普拉斯说,统计分析让一切假象原形毕露。英国前首相本杰明·迪斯雷利却说“有三种谎言:谎言、糟糕透顶的谎言和统计资料。” 达菜尔•哈夫的《统计数字会撒谎》这本书,让我们明白统计未必能够揭示真实,有时候还可能制造假象。当我们面对生活中形形色色的统计数据的时候,千万多保持一些理智和清醒。长此以往,必然能够慢慢炼就一双“火眼金睛”,不至于被形形色色的统计数据所迷惑。
《统计数字会撒谎》
●揭秘最隐蔽的数据造假方法,畅销美国50年的伟大时代经典,世界统计学普及读物第一畅销书
●像“故事书”一样生动精彩, 充满了“马克吐温”式的幽默讽刺案例
●“25本投资经典之一”、“经典社会学读本”
●商业人士必知的数据造假权威读本,公开统计专家才明白的专业统计知识
●莞尔一笑中让你知晓深奥的统计学基本原理,炼就揭露“虚假数据”的火眼金睛
假数据也可以披上羊的外衣!房价,工资,增长率,利润率……你都有可能被这些统计数字狠狠地忽悠一把!
然而,假的真不了!翻翻报纸,《房价数据满天飞 市民抱怨看不懂》《“平均工资水平”有多少可信性?》、《长春白领月薪1500?标准太低数据存疑》、《平均工资越高越令人恐惧》……类似于这样的质疑越来越多,我们要如何才能够看清这些漫天飞舞的数据背后的谎言?
《统计数字会撒谎》正是这样一本能让你辨清真假数据的首选必读书。
《统计数字会撒谎》一书是由美国统计专家达莱尔·哈夫写就的传世之作,该书引发的“编造虚假信息”话题受到美国社会持续普遍的关注和美国权威媒体的激烈争论。它自50年代出版以来就不断一版再版,并被翻译成多种文字,在世界的影响力持久不衰,被誉为美国商业人士、研修人员的重要入门必修书之一。书里面大胆地揭露了至今仍然被销售员、广告撰稿人、记者甚至专家频频使用的大量的统计操纵技巧,同时还配有别具一格的风趣插图以及众多幽默的案例。神秘的统计学在这里被哈夫像讲故事一样一一道来,莞尔一笑中让你知晓深奥的统计学基本原理,掌握揭露“虚假数据”的最有力武器……
桑普拉斯曾说过,统计分析让一切假象原形毕露。但遗憾的是,统计未必能够揭示真实,有时候还可能成为假象的帮凶。当我们面对生活中形形色色的统计数据的时候,还要多保持一些理智和清醒,并要有所保留地看待问题。因为“如果一个人以种种肯定的立论开始,他必将终止于各种怀疑;但如果他愿意抱着怀疑的态度开始,那么他必将获得肯定的结论。” (培根语)
http://product.dangdang.com/product.aspx?product_id=20509805
[此贴子已经被作者于2009-4-1 14:43:40编辑过]