论坛 VIP服务 论文检测 案例库 期刊 毕业论文库
vvb
vv
cc
您的位置 > 数据挖掘

数据挖掘论文范文

社会统计结论中存在的一些解释性矛盾问题透析来源:原创 作者:李武选,樊根耀,王丽萍 时间:2015-11-02

  

  

社会统计结论中存在的一些解释性矛盾问题透析1

 

李武选 樊根耀 王丽萍

(长安大学 经济与管理学院  西安 710064

摘 要

在日常生活中,我们经常会碰到一些具有统计性质的结论,让人们产生怀疑甚至担心社会稳定,其中一个重要原因是忽略了统计学中的一个深层次问题,统计结论本身未必真正正确,实际上统计推断结论往往回答的是,样本的特征指标与总体的相应指标是否一致的问题,而不是回答正确与错误的问题,它不能完全保证结论的确定与否定,它不是给人们不是这个就是那个的问题。本文试图通过一个简单的例子对这中“瑕疵”进行申辩,这种申辩将会对统计学的发展是一次打击还是一次革新,望同行专家进行进一步讨论。

 

关键词:社会学;政治学;统计结论;实际结论;矛盾性透析

中文图书编号:C81C91D09   中图标识码:A

1.引言

非随机抽样和随机抽样的统计结论多数情况下是截然不同的,即使是随机抽样,其可信性也是很值得商榷的,不具有科学性的单个样本其研究结论本身就存在缺陷,下面我们通过实例试图来澄清这个问题。

2.实际问题

2.1常见统计问题的一个实例

    一个社区82.8%的人接受了“某某”学说的宣传,认为该学说是讲真、善、美的,劝化人的心灵,而只有11.2%的人认为是邪恶的,其余的人未发表意见即无表述结果。

2.2结论的表述

2.2.1普通人的“社会学”结论

按照社会学的解释即一般的结论是应该接受82.8%的人的回答结果:即既然有那么多人都认为是正确的,那么应该遵从少数服从多数的决策原则[1],该学说是讲真、善、美的,劝化人的心灵!在此我们先不谈错在什么地方!

[1] 基金项目:中央高校基本科研业务费专项资金重点项目 (2013G6231004)。

2 作者简介:李武选(1962-),男,陕西兴平人,长安大学经济与管理学院副教授,硕士生导师。研究方向:现代统计学理论与方法,计量经济分析,数据分析方案设计,服务质量与管理等。

樊根耀(1964-),男,陕西周至人,管理学博士,教授,研究方向:企业管理和服务管理;

王丽萍(1978-),女,陕西西安人,管理学博士,讲师。研究方向:服务营销。

2.2.2统治者的“政治学”结论

   这个学说是是冠以真、善、美,劝化人的心灵之名,鼓动善良的人们或存有不良意识的人通过自残方式,胁迫和故意引起社会矛盾的邪恶的东西,应当坚决予以取缔、铲除,这种以政治稳定[2]为目的的管理方式,最终被大众予以接受。

2.2.3一般学者的“统计学”结论

从统计学角度来看,根据存在理解有误的统计推断理论 [3],既然在一个总体(暂且不关心这个总体的总体单位数量多少,对全国所有社区而言是一个样本,无论大样本还是小样本)有超过82%人都认为是该学说是讲真、善、美的,劝化人的心灵,那么从一般学者(非专业统计学的)“一般意义上”——“虚假的”错误理解小概率事件原理[4],小概率事件在一次实验中不可能发生,也就是在100次“实验”中已经有82次回答认为上述问题的阐述是对的,既然有超过一半的都发生了,那么,根据研究这个的观察,就不应该拒绝上述结论,即似乎应当接受这一结论。

暂且不讨论其实际上正确与否!

2.2.4本问题的实际结论——真实的统计学结论

实际上,科学的统计推断理论还有一个风险函数问题[5],及任何一种统计推断都存在一定的风险,这个风险的大小就是对结论的弃真和取伪做出一个保证性说明,这个问题的实际结论是仅有11.8%的人的认识结论可能是正确的:即这个学说是邪恶的。

3.实际问题上述结论的矛盾性根源透析

3.1对同一问题的不同结论矛盾表现比较

对于同一问题持不同观点的根源往往会因人而异,因为每个个人的专业倾向性差异很大,这本身并不存在异议。理由是,之所以区分不同的学科,也正是因为各学科研究的对象和方法不同,各自的发展规律也几乎是完全不同,但是一个研究对象自身的发展规律却是一个不可争议的事实,那么对同一个问题的研究角度实际上成为各个研究者做出各自学科结论自然就会存在差异。实际上,每一个种观点都有其可坚持性的基本理由,这正是不同学科的局限性所致,也正是不同学科存在的基础,基于不同角度应该会有差异较大甚至相反的认识。下面是对本文最初所给出问题具有不同结论的一些表现及其依据分析。(具体见表3-1

 

 

 

 

 

 

 

 

3-1   同一问题的不同结论矛盾表现比较表

不同人的不同角度

不同的结论

诊断依据分析

普通人的社会学

82.8%人的回答应该是正确的!

普遍认识原则:少数服从多数

 

统治者的政治学

鼓动善良的人们或存有不良意识的人通过自残方式,胁迫和故意引起社会矛盾,是反动的。

以国家政治为重:危害国家政治稳定与安全,破坏国家运行正常秩序。

 

一般学者的统计学

有超过82%人都认为是正确的,那么从统计学的一般意义上,我们应当接受这一结论。

集中大多数的意愿:统计学的众数特征所指的共同认识结论是一个从众结果,这迎合了社会学的判断依据。

 

专业学者的统计学

11.8%的人的认识结论可能是正确的。

这个社区不代表全部全国的所有社区,仅是一个社区个体,实际上是一个子样本,而且并非科学取样的。实际上即使是随机抽样的子样本其分布形式也不一定与总体分布一致。

 

3.2对同一问题不同结论的矛盾根源性透析

3.2.1普通人的社会学结论透析

普通的社会人的一般解释是以大多数人的回答结果来表明多数人的一种客观(回答的人数的比例数据)心愿的,这种多数人共同的心愿不一定总是正确的,但一般来说大多数人意见的正确概率会比一个人或少数人意见的正确概率要高一些[ = 1 \* Arabic 1]。而至于这种存在个人心理判断的个体意识是否真正正确与错误却是不能保证的,因为通常情况下,个人的理性判断是有限的,更多的是考虑了个人得失。即使是这个全部社区的人的都是上述的回答结果也是如此,仍不能保证这个结论的正确性。

3.2.2统治者的政治学结论透析

统治者政治管理目的只有一个,维护国家秩序有序化、稳定化、安全化,追求权力执行结果的一致性,这种结论具有十分明确的政治统治的统一性的目的,在这里不能考虑结论的真实性到底是错还对,而是追求一个国家或是一个组织在政治上和国家安全上的权力高度集中,权威性是首屈一指的。也就是说只要危害人民群众的生命和利益,违反国家政策、法令根本性体制,影响国家秩序有序、稳定和安全的一律被定性为是不道德的、反动的,应当坚决予以取缔。

3.2.3一般学者的统计学结论透析

一般学者的统计学结论是出自于样本对总体(实际总体或者说原始总体)的推断,它是基于在科学抽样的基础上获得所有样本中的一个样本个体(相对样本总体(在这里是指按照数理统计学的观点抽取的每一个子样本所构成的子样本集合体,根据总体的相对性可以称之为样本总体或者抽样总体)而言),实际上这个样本本身并不是随机抽取的,即是说不是科学抽取的,在某种意义上,它是一种典型样本,其结论严格来说它的结果不具有推断性,因为典型样本不是统计推断的代表性样本。

实际上在统计学研究中还存在另一个问题就是统计学悖论,下面是一个著名的例子。

某商场调查了100名顾客,询问她们对A,B,C三种化妆品的喜好情况,得到结果如下:

1)有2/3的顾客喜欢A而不喜欢B,

2)有2/3的顾客喜欢B而不喜欢C.

问是否喜欢A而不喜欢C的顾客最多?

A)   对   B )  不对

这个问题的选择结果是,无论选择对与不对都是可行。实际上也是不可行的,也就是说其结论无法确定。

这个问题来源于著名的阿诺悖论,肯尼思.阿诺由此证明,一个十全十美的民主选举系统是不可能实现的,1972年获诺贝尔经济学奖.[2]

3.2.4专业学者的统计学结论透析

    对本问题而言,统计学中数据处理的结论是解决谁胜谁负的问题,并不完全解决谁错谁对的问题。

为什么在这个社区里里会仅有11.2%的结论可能是正确的,这个问题原因在于这个样本所得到的回答可能正是所有子样本中代表性最差的一个样本,也就是说任何一个其他的子样本的结论都比这个样本所得到的回答更接近总体的实际结果。实际上从专业统计学学者或者研究者的观点来看,这一点我们仍然是无法十分保证的。

关于这些回答或者建议真正的正确与否则是另外一个问题即相信了“传道士”的诱导和宣传甚至“误导”的影响。

少数服从多数的决策原则的价值取向是“合理的”,但不一定是“正确”的,就如同法学观点上的合情、合理与合法之间的矛盾是一样的。

4.结语

研究启示

对于一个实际问题的正确与否作出结论性判断,这与研究问题的性质和最终目的有直接关系,但真实统计学上的结论一定要遵循科学的分析法则,不能“以点带面”,尤其是不能以偏概全,拘于仅有的有限视野,而妄下结论。有的人说一说也就算了,这不会影响国家或者组织的整体利益,那就无关紧要;有的人做出的结论将会影响他人的生命财产(比如说医学有极大副作用药物疗效问题;若处在政治导向的国度中,可能危害更甚),那就是做人(学问的道德基础不够)也做得不够;所以作为统计学人尤其有影响的权威人士或机构发表重要问题的结论和建议时,一定要慎之又慎!以科学的结论示人,才能赢得科学学人的尊重!

从本质上来说统计学的真正意义正如英国著名遗传学家Galton (1822-1911)提出的观点一样: 当人类科学探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计工具可为其开辟一条前进的通道没有统计,其它科学可以存在,但是很渺小。因此准确的理解统计理论和正确的使用统计方法时,作出一个最终结论,更需要特别谨慎。

需要说明的问题

这里,我们没有给出这一问题的具体的统计科学结论,原因是:一方面,这是一个多学科的争辩问题,争辩就要有对手,要在一个大家共同认可的公共基础上进行;另一方面,具体的统计科学结论涉及到未回答该问题的情况,这具体是一比例推断问题,要用到总体方差或者其估计值或者样本方差,如果忽略掉未回答的人,那么按照通常的比例推断来解决就是一个比较简单的问题。

参考文献

[1] 张晓燕. 民主执政与少数服从多数民主原则的重新解读[J].中国党政干部论坛,200511):40+7.

[2]邓伟志.变革社会中的政治稳定[M].上海:上海人民出版社,p36.

[3] 童新元.医学统计学[OB/J].中国人民解放军总医院20051012http://wenku.baidu.com/view/6620b21d59eef8c75fbfb340.html

[4]郝俊霞,万方义,宋笔锋.基于小概率事件的飞行器结构健康监控机械设计与制造 [J]. 200712): 87-88

[5]G. A. Young and R. L. Smith. Essentials of Statistical Inference. Cambridge  University  Press,2005,p5,p65

Social statistics in conclusion there are some explanatory problem dialysis

 

 LI Wu-xuan  FAN Gen-yao  Wang Li-ping

(School of economics and management, Chang’an University, Xi’an 710064, China)

 

abstracts

In daily life, we often meet some conclusion, let people doubt even worry about social stability, one of the important reasons is to ignore the statistics of a deep problems, statistical conclusion itself is not necessarily true, in fact, statistical conclusion is often not completely sure. This paper, through a simple example to the defects in position, the answer will be on the development of the statistics is a hit or a innovation, hope experts for further discussion.

 

Key words: Sociology; Political science; Statistics; The actual conclusion; Contradictoriness dialysis


参考文献:
   [1] 张晓燕. 民主执政与少数服从多数民主原则的重新解读[J].中国党政干部论坛,2005(11):40+7. [2]邓伟志.变革社会中的政治稳定[M].上海:上海人民出版社,p36. [3] 童新元.医学统计学[OB/J].中国人民解放军总医院2005年10月12日http://wenku.baidu.com/view/6620b21d59eef8c75fbfb340.html [4]      

  
  

最新论文

推荐论文

gg333