摘 要
在这个大数据到来的时代,社会各行各业对数据分析需求大幅度上升,对数据进行采集、分析、表达、翻译从而挖掘数据的潜在价值,以达到数据的高效利用。而大数据时代的到来也给统计学带来了新的挑战。本书的重点主要以Excel软件作为主要工具,以SPSS软件为辅助工具,以提高读者运用统计方法分析和解决实际问题的能力为目的,以“大统计”学科建设的思想构建。
前 言
统计的发展历史可追溯到原始社会,但真正的发展为一门系统的科学——统计学,却只有三百多年的历史。而在现代化管理和社会生活中统计学都地位日夜重要,人们的日常生活和一切社会生活都离不开统计。无论是自然科学还是社会科学,统计学都是各个领域中不可或缺的一部分。所以现在的我们要如何了解统计学的应用和发展是非常重要的。而《统计学——以Escel为工具》以Escel为主要工具,SPSS为辅助工具,能够使读者很快忘记数学公式给他们留下的艰深的印象,进入统计学这个神奇而富有魅力的空间。
第一章 绪论1.1 统计(statistics)1.1.1 统计发展历史1.1广义:①统计工作 ②统计学 ③统计数据
狭义:统计学
1.2发展:统计在1500年从德国兴起,1900年在开始与概率结合,2008年大数据在美国被提出。
1.1.2 统计的分类①政府统计 ②商业统计 ③民事统计
1.2 统计学定义1.2.1是一种方法论科学,是搜集、处理、分析和解释数据并从数据当中得出结论的科学。
1.2 .2 统计学的发展
(1)统计学的创立时期:统计学的萌芽在欧洲,17世纪中叶至19世纪初是统计学的创立时期。
(2)统计学的发展时期:19世纪中叶至19世纪末是统计学的发展时期。
(3)统计学的完善时期:20世纪初以来,科学技术迅猛发展,社会发生了巨大变化,57统计学进入了快速发展时期。
1.2.3统计学的发展趋势
(1)依赖和吸收数学方法越来越多.
(2)向其他学科不断渗透,以统计学基础向边缘学科不断形成.
1.2.4统计学的应用
统计学在经济学方面应用于经济统计学,在美学方面应用于可视化,而在计算机和人工智能方面应用于数据挖掘。
1.3统计数据的类型
1.3.1数据的计量
(1)定类尺度:又名亦称列名尺度,是最粗略、计量层次最低的计量尺度。它是按照客观现象的某种属性对其进行的分类。
(2)定序尺度:亦称为顺序尺度,它是对客观现象各类之间的等级差或顺序差的一种测度,是比定类尺度更高一级的计量尺寸。
(3)定距尺度:亦称为间隔尺度,它是对现象类别或次序之间间距的测度,是比定序尺度更高一级的计量尺度。
(4)定比尺度:亦称为比率尺度,是比定距尺度更高一级的计量尺度。
1.3.2数据的类型
统计数据的框图:
统计数据的类型 |
|
|
|
按计量尺度 | 分类数据 | 顺序数据 | 数值型数据 |
按搜集方法 | 观测数据 | 实验数据 |
|
按时间状况 | 截面数据 | 时间序列数据 |
|
1.3.3数据的来源
(1)数据的直接来源:来源于直接的调查和科学实验。
(2)数据的间接来源:商业和政府机构、营销研究公司和计算机数据库提供的信息。
1.3.4数据的整理与显示
(1)我们通过各种渠道获得统计数据后,应对这些统计数据进行加工处理,使之系统化、处理化,以符合分析的需要。
(2)数据整理通常包括数据的预处理、分类或分组、汇总等几个方面的内容。
自我总结:时代的不断变化,数据的不断产生。让统计在我们的生活中的应用不断提升,统计时时刻刻都与我们的生活相联系。而社会的各行各业数据也逐渐变多变复杂,我们可以从各行各业中获得数据,但为了更好的处理数据,我们要学习处理数据的各种手段和方法是非常重要的。
第二章 统计调查与问卷设计及统计软件2.1 统计调查
2.1.1(1)统计调查的概念:根据统计研究的目的,采用一定的方式方法,有计划,有组织地向调查单位搜集原始资料的工作过程。
(2)统计调查的种类
①按调查对象包括范围的不同,统计调查分为全面调查和非全面调查。
②按调查登记的时间是否带有连续性,统计调查分为经常性调查和一次性调查。
③按调查的组织形式不同,统计调查分为统计报表和专门调查。
④按搜集资料的方法不同,统计调查分为直接观察法、报告达、采访法和通讯法等。
2.1.2 统计调查方案
①确定调查目的
②确定调查对象和调查单位
③确定调查内容(调查表)
④确定调查时间
⑤制定调查工作的组织实施计划
2.1.3统计调查的组织方式
①统计报表制度
②普查
③重点调查
④典型调查
⑤抽样调查
2.2问卷设计2.2.1问卷设计基础
(1)定义:问卷用于测量人的特征、行为和态度等而精心设计的由一系列问题、备选、答案和说明组成的一览表。问卷设计的好坏直接影响数据搜集的质量和效率。
(2)最高标准——量表(心理学)
(3)质量的标准
①信度:测量的稳定性
②效度:测量的有效性
2.2.2问卷设计的原则
主题明确;结构合理;通俗易懂;问题适当;便于汇总。
2.2.3问卷设计的程序
确定主题和资料范围;分析样本特征;拟定并编排问题;进行试问试答;修改和付印。
2.2.4问卷的结构
由开头部分和正文和辅助部分组成
2.3统计软件
主要有Escel、SPSS、SAS、Eviews、Matlab等
第三章 数据挖掘和数理统计
3.1数据挖掘数据挖掘是指人们将事先不知道的,潜在有用的知识和信息从大量的、随机的、摸糊的、有噪音的、不完整的数据中提取出来的过程,数据又被成为数据融合、数据分析,从数据中发现知识等。
3.2数理统计⑴试验的设计和研究,即研究如何更合理更有效地获得观察资料的方法;
⑵统计推断,即研究如何利用一定的资料对所关心的问题作出尽可能精确可靠的结论,当然这两部分内容有着密切的联系,在实际应用中更应前后兼顾。但按本专业的总体设计,我们的数理统计课程只讨论统计推断。数理统计以概率论为基础,根据试验或观察得到的数据,来研究随机现象统计规律性的学科
总结:数据挖掘可以让我们更加利用数背后价值,发挥数据高效利用。通过了解和搜寻让我了解到数理统计可以让我们理解统计推断检验等方法并能够应用这些方法对研究对象的客观规律性作出种种合理的估计和判断。更加快掌握总体参数的点估计和区间估计。掌握假设检验的基本方法与技巧。理解平方差分析及回归分析的原理,并能运用其方法和技巧进行统计推断。
结 论随着经济的发展,人类已跨入一个知识经济新时代,数据的不断的产生,我们生活中的每一天都会遇到大量统计问题。人们可以通过数据了解社会的一些问题,可以通过数据解决问题。如今,统计在生活中发挥着越来越大的作用,已成为认识社会最有力的武器之一,步入统计的新时代,我们会发现和遇到许多实用而有趣的东西。
参考文献
《统计学——以Escel为工具》——作者刘辉 周丽
《新编——统计学》——李英枫 欧阳培峰 张文超
《统计学》——曾五一