《统计学论文》
摘要
本文主要是对统计学的一个大概的综合论述,以更好的了解统计学以及统计工作的相关内容,帮助我们作好在以后的学习中的准备工作。
其关键词:“统计”“数据”“统计调查与问卷设计”
前言
在当今社会数据是一切发展的基础,然而大数据时代给统计学的发展带来了巨大的机遇和挑战,对统计数据的收集、整理和分析等面都带来很大的影响。为了适应大数据的需要,我国对数据处理方面的人才更是不可或缺的。为了更好地学习有关统计方面的知识,首先要对其有一个初步的了解,下面就是有关统计工作方面的大体论述。
正文
统计
统计最初来源于国情调查,分为政治统计、商业统计、民事统计三大类。统计学最早被称为国情学,广义的统计包括三个部分:统计工作、统计资料以及统计科学。统计学的原意是“国家显著事项的比较和记述”或“国势学”,是一门关于国家事项的学问。其基本概念是指对某一现象有关的数据的搜集整理、计算分析、解释与表述等活动。
统计学发展
统计最早起源于17世纪英国,当时被称为“政治算术”
最早用“统计学”名词的是一位德国国势学派阿亨瓦尔提出,但那时是用文字记述方法进行研究而不是以数据信息,这点与现今统计方法差异较大。
后来统计学出现社会统计学派,德国克尼斯曾提出统计学是独立的社会科学。
再到数理统计学派创始人来自比利时的凯特勒将概率论和统计方法引入社会经济方面的研究。
最后社会不断发展科技不断进步提出大数据时代的概念。
专业培养目标
数理基础,科学思维训练
勇于质疑
具备计算机专业知识
掌握统计软件
学会调查设计、问卷设计、数据采集、录入、编写审核与预处理等基本技能
具备数据维护、管理、预测、与决策的能力
掌握社会学,经济学等基础知识
熟悉国家发展实情
掌握资料查询,文献检索等技能
就业方向
政治部门
金融部门
市场研究公司/大公司市场部
互联网公司等
数据
1.数据可视化
数据
“数据本无大小,但运用数据的立场却分出大小,是谓大数据。”
定义:大数据中“数据”不仅仅指狭义的数字,而是一种新的经济资产类别,是数量大,结构复杂,类型众多的大型数据的集合。
特点:(4V)数量大Volume、形式多样Variety、运算高效Velocity、产生价值Value.其最显著特点即数量大,进而种类多,在处理如此多而复杂的信息得到的结果也是实时高校的利于从中萃取更多的职能的有价值的真正有用信息,最终对企业甚至国家产生价值。萃取分为三个步骤即数据输入——数据处理——数据输出。
可视化
是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理理论,方法和技术。是数据美观、新颖、充实、高效的呈现在读者面前,我们也可以因此获取新的知识,并从中培养自己的洞察力,获取大量的有效信息。
数据可视化呈现的6种形式:将指标值图形化、将指标图形化、将指标关系图形化、将时间和空间可视化、将数据进行概念转换、让图表“动”起来(交互、联动)。
2.数据挖掘
数据挖掘技术是一种数据处理的技术,是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中、人们事先不知道又潜在有用信息和知识的过程。
需要根据数据仓库中的数据信息,选择合适的分析工具,应用统计方法、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法的方法处理信息,得出有用的分析信息。数据挖掘过程是一个反复循环的过程,每一个步骤如果没有达到预期目标,都需要回到前面的步骤,重新调整并执行。
统计调查与问卷设计
(一)方法及注意事项
统计分析的步骤有选题、拟定分析提纲、搜集整理资料、进行分析归纳和文字表述。
1、选题。一般出于两种原因一是研究者对某种现象已关注较长时间并有一些自己的观点己见解在此基础上进行更深入的统计分析。二是研究者对某事物认识不深接触较少,需要组织小组调查或小型辅助调查进行探索调查,这类题目通常要求分析要有深度,时效性也要求较高。
2、 拟分析提纲。分析提纲既是分析思路的设想,又是一张工作任务表。有助于分析者理清思路,找到切入点和突破口;亦可增强文章逻辑性减少语言的重复。而且提纲应随资料的搜集以及对问题的认识而进行调整与修改。
3、 搜集整理资料。不应仅局限于问题本身还应注意搜集相关的文献资料。
4、 分析与归纳。分析是依照统计的,经济的,社会的和其他学科的成熟理论、方法对整理后的资料进行多角度,广范围的分析,切不可仅仅偏向某一个人观点展开分析。
归纳则是最关键的一环节,是将不同层次、各个指标组群的初步分析结果的评价,定性定量的论排出来,进而进行更深入的研究分析和比较。
5、文字表述。文字表述应符合简洁明了,逻辑严密,定量定性清晰,结论严谨,依据充分等要求
(二)统计调查
统计调查包括普查、抽样调查、统计报表(对调查对象进行登记、搜集原始资料的表 格)、重点调查以及综合分析(根据事物间内在联系,采取科学推算,测算与专家评估等形式,对统计数据的精确性进行分析研究和综合性评价的方法)等。
统计调查活动中的社会调查 其狭义定义为随着抽样方式和问卷方法的发展而形成结构化信息收集方法,而广义上是对某种事实现象及其规律进行完整认识过程。
1、社会调查的分类
性质:应用性调查、理论性调查
目的:描述性调查、探索性调查、解释性调查
范式:定性研究(定质)、定量研究
时间:横向调查、纵向调查
工具:纸笔、电话、网络
2、调查的基本步骤
选题阶段:委托或自拟
准备阶段:问卷或抽样
实施阶段:收集数据
分析阶段
总结阶段
(三)问卷设计
问卷设计的好坏直接影响数据的收集质量和效率,其最高标准就是心理学上的“量表”
问卷质量标准:倍度即测量的稳定性,效度即测量的有效性
2.问题类型
目的:特征问题、行为、目的、态度
方式:开放式问题、封闭式问题(单选、多选、排序题、等级评选题、配对比较题等)
3.问卷的措辞
首先要注意简单明确,不可使用专业用语,确保问卷术语避免一语双关是被调查者答非所问;避免引导性问题;要使每一个选项的问题的理解都能一致;还不能让调查对象回忆时间过长等事项。
4.问卷的质量
问卷质量的评估大体从四个方面入手即定类尺度;定序尺度;定距尺度;定比尺度。
(四)常用的软件
1.SAS:是目前国际上最为流行的一种大型统计分析系统,被誉为统计分析的标准软件。尽管价格不菲,SAS已被广泛应用于ZF行政管理,科研,教育,生产和金融等不同领域,并且发挥着愈来愈重要的作用。在我国,国家信息中心,国家统计局,卫生部,中国科学院等都是SAS系统的大用户。
2.SPSS:作为仅次于SAS的统计软件工具包,在社会科学领域有着广泛的应用。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件。
3.Excel:严格说来并不是统计软件,但作为数据表格软件,必然有一定统计计算功能。
4.S-plus::统计学家喜爱的软件。不仅由于其功能齐全,而且由于其强大的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。
5.Minitab
6.Statistica
7.Eviews:主要处理回归和时间序列
结论
从古至今,从结绳记事到一个小小的U盘就能存储大量信息,从飞鸽传书快马加急到只需轻巧按键就能和地球另一端面对面......在时代变更如此飞速的信息时代,仅仅吸取过去的经验,遵从祖宗传下来的方法已经无法满足步伐节奏日益加快的时代的需要。无创新不进步。数据是一切发展不可或缺的重要信息,我们不仅要用它来总结过去,更重要的是利用这些信息以及相应工具去发明,去创新,来更好地满足当代人们的需要,只有这样在大数据时代的背景下,才能紧跟时代的步伐不落后,做时代的领先者。
参考文献
《数据挖掘》《数据之巅》