大家最好用好压这个软件解压!
内容简介 《SAS统计分析与数据挖掘》基于SAS9.2版本编写,从SAS编程出发,用案例形式介绍SAS数据挖掘在各领域的广泛应用,全书分为SAS基础篇、提高篇及应用篇,每章均给出大量分析案例。具体内容为SAS软件与数据挖掘简介,SAS编程基础,图形与报表制作,描述性分析,假设检验,回归分析,方差分析与因子分析,相关分析与对应分析,判别分析,聚类分析,生存分析,时间序列分析,以及SAS在具体数据挖掘项目中的应用等。
《SAS统计分析与数据挖掘》最大特点是抛弃了其他同类书籍中只说理论、缺少案例分析的弊病,全书给出大量数据挖掘分析案例,为读者展示SAS在数据整合、数据挖掘、商业智能、金融数据分析、金融风险管理等项目中的强大应用技术。
配套光盘中有实例的操作视频以及相关源程序文件。
编辑推荐 《SAS统计分析与数据挖掘》SAS——全球最为著名的统计分析软件,SAS——金融、科研、数据挖掘领域必备之软件,基础知识-实训实例-工程实例,实例操作视频教学,轻松学习。
目录 第1章 数据挖掘概述 1
1.1 数据挖掘简介 1
1.1.1 数据挖掘的含义 1
1.1.2 数据挖掘的起源 2
1.1.3 统计学与数据挖掘 2
1.1.4 数据挖掘相关的一些问题 5
1.2 数据挖掘用途 10
1.3 数据挖掘过程 11
1.3.1 数据挖掘用户 11
1.3.2 数据挖掘工具 14
1.3.3 数据挖掘步骤 14
1.4 SAS——数据挖掘领域的领导者 15
1.5 SAS在各种商业解决方案中的应用 16
1.5.1 SAS数据挖掘技术的实现 17
1.5.2 SAS在商业领域中的应用 18
第2章 SAS模块概述 20
2.1 SAS简介 20
2.1.1 SAS的设计思想 21
2.1.2 SAS的功能 21
2.1.3 SAS的特点 22
2.2 SAS软件安装、启动与退出 22
2.2.1 SAS软件的安装 22
2.2.2 SAS软件的启动 22
2.2.3 SAS软件的退出 23
2.3 SAS界面 24
2.3.1 Explorer窗口 25
2.3.2 Editor窗口 25
2.3.3 Results窗口 26
2.3.4 Log窗口 27
2.3.5 Output窗口 27
2.4 SAS模块介绍 28
2.4.1 SAS/BASE模块 30
2.4.2 SAS/ANALYSIS模块 31
2.4.3 SAS/ASSIST模块 32
2.4.4 SAS/INSIGHT模块 34
2.4.5 SAS/EM模块 36
第3章 SAS程序设计基础 38
3.1 SAS编程基础 38
3.1.1 SAS语言基础 39
3.1.2 SAS语言构成 43
3.1.3 SAS结构化编程语句 46
3.1.4 SAS程序编写规则 48
3.2 SAS程序的数据步 49
3.2.1 DATA语句 49
3.2.2 INPUT语句 50
3.2.3 CARDS与CARDS4语句 50
3.2.4 INFILE语句 51
3.2.5 SET语句 52
3.2.6 MERGE语句 53
3.3 SAS数据步循环与转移控制 54
3.3.1 IF语句 54
3.3.2 SELECT语句 55
3.3.3 DO语句 56
3.3.4 GO TO语句 58
3.3.5 RETURN语句 59
3.3.6 CONTINUE语句与LEAVE语句 59
3.3.7 如何跳出选择结构和循环体 59
3.4 SAS程序的过程步 60
3.4.1 SAS过程步用法 60
3.4.2 VAR与MODLE语句 60
3.4.3 ID与WHERE语句 61
3.4.4 BY与CLASS语句 61
3.4.5 OUTPUT语句 62
3.4.6 FERQ与WEIGHT语句 62
3.4.7 LABEL与FORMAT语句 62
3.5 SAS函数 63
3.5.1 数学函数 63
3.5.2 数组函数 64
3.5.3 日期时间函数 64
3.5.4 概率分布函数 65
3.5.5 分位数函数 66
3.5.6 样本统计函数 66
3.5.7 随机函数 67
第4章 数据预处理 69
4.1 数据输入 69
4.1.1 原始数据的读取 70
4.1.2 数据导入 71
4.2 数据整理 73
4.2.1 数据集选项 73
4.2.2 整理数据集 74
4.2.3 缺失值处理 84
4.2.4 UPDATE语句更新数据集 86
4.2.5 数据清洗 87
4.3 数据步变量控制 92
4.3.1 ARRAY语句 92
4.3.2 INFORMAT语句与FORMAT语句 93
4.3.3 LABEL语句 94
4.3.4 ATTRIB语句 96
4.3.5 DROP语句与KEEP语句 97
4.3.6 RENAME语句与RETAIN语句 97
4.4 数据修改与选择 98
4.4.1 赋值语句 98
4.4.2 累加语句 98
4.4.3 DELETE语句与LOSTCARD语句 99
4.4.4 STOP语句与ABORT语句 100
4.4.5 WHERE语句 101
4.4.6 REMOVE语句与REPLACE语句 101
4.4.7 MISSING语句 102
第5章 数据汇总与报表制作 103
5.1 使用过程PRINT制作报表 103
5.1.1 基本用法 104
实例5-1 PROC PRINT操作实例 104
5.1.2 使用中文列标题 106
实例5-2 修改标题实例 107
5.1.3 标题和脚注 107
实例5-3 修改标题实例 107
5.1.4 用BY语句分组处理 108
5.2 使用过程TABULATE制作汇总报表 109
实例5-4 汇总报表实例 110
实例5-5 绘制统计量表格 112
第6章 SAS绘图 114
6.1 GPLOT过程 114
实例6-1 GPLOT过程绘制图形编程操作 115
6.2 GCHART过程 115
实例6-2 GCHART过程绘制条形图 116
实例6-3 GCHART过程绘制GDP数据的BLOCK图形 117
6.3 G3D过程 118
实例6-4 绘制二维正态分布曲面图形 118
实例6-5 绘制函数的三维图形 120
第7章 数据描述 123
7.1 统计图 124
7.1.1 直方图 124
实例7-1 GCHART过程绘制直方图 124
7.1.2 条形图 126
实例7-2 GCHART过程绘制条形图 126
7.1.3 散点图 127
实例7-3 GPLOT过程绘制散点图 128
7.1.4 饼图 129
实例7-4 GCHART过程绘制饼图 129
7.1.5 盒形图 130
实例7-5 BOXPLOT过程绘制盒形图 131
7.1.6 茎叶图 132
实例7-6 UNIVARIATE过程绘制茎叶图 132
7.1.7 时间序列图 133
实例7-7 TIMEPLOT过程绘制时间序列图 133
7.2 统计量 135
7.2.1 集中趋势 135
实例7-8 利用MEAN函数求平均数 136
7.2.2 离散程度 137
实例7-9 利用函数VAR和STD求方差和标准差 139
7.2.3 分布状态 141
实例7-10 利用SKEWNESS 和KURTOSIS函数求偏度和峰度 142
7.3 数据分布 143
实例7-11 SAS中的部分概率分布函数的应用 144
第8章 描述性统计分析 146
8.1 SAS编程进行统计分析 146
8.1.1 基本概念 147
8.1.2 FREQ过程 149
实例8-1 频数表的生成实例 151
实例8-2 绘制实验数据表格 153
8.1.3 MEANS过程 154
实例8-3 求平均增长率 156
实例8-4 利用MEANS过程求各种统计量 156
8.1.4 UNIVARIATE过程 159
实例8-5 利用UNIVARIATE过程求各种统计量 160
实例8-6 求样本的极差、上四分位数和下四分位数 161
8.1.5 TABULATE过程 162
实例8-7 制作数据表格 162
8.2 其他描述性统计过程 165
8.2.1 产生描述性统计值的输出文件:PROC SUMMARY 165
实例8-8 SUMMARY语句实例 165
8.2.2 统计值的图形表示:PROC CHART 166
实例8-9 绘制数据分布图形 168
实例8-10 利用CHART过程的VBAR及HBAR命令绘制条形图 169
8.2.3 一般制图:PROC PLOT 171
实例8-11 PLOT过程绘制图形 172
第9章 ANALYST模块 173
9.1 ANALYST模块概述 173
9.1.1 ANALYST模块简介 173
9.1.2 ANALYST菜单介绍 177
9.2 数据集的窗口操作 177
9.2.1 数据集输入 177
9.2.2 数据表修改 178
9.2.3 数据保存 180
9.3 绘制统计图 180
9.3.1 条形图 180
9.3.2 饼图 181
9.3.3 散点图 183
9.4 统计分析 184
第10章 参数估计与假设检验 187
10.1 参数估计和假设检验概述 187
10.1.1 参数估计 187
10.1.2 假设检验 189
10.2 假设检验的SAS过程 190
10.2.1 UNIVARIATE过程 190
10.2.2 MEANS过程 191
10.2.3 TTEST过程 192
10.3 不同类型的均值和方差的检验 192
10.3.1 单变量均值t检验 192
实例10-1 TTEST过程的实例数据分析 193
实例10-2 总体均值检验 194
10.3.2 样本均数与总体均数差异的t检验 194
实例10-3 均值的显著性差别检验 195
10.3.3 配对资料的t检验 195
实例10-4 乳酸饮料实验数据的配对t检验 195
实例10-5 均值有无差异的检验 197
10.3.4 两样本均数比较的t检验 198
实例10-6 均数差别的显著性检验 198
实例10-7 数据比例的显著性检验 198
10.4 正态性检验 200
实例10-8 样本数据的正态性检验实例1 200
实例10-9 样本数据的正态性检验实例2 201
第11章 方差分析与协方差分析 204
11.1 方差分析的基本原理 204
11.1.1 自由度与平方和分解 206
11.1.2 F检验 207
11.2 单因素方差分析 208
11.2.1 单因素方差分析步骤 208
11.2.2 判断与结论 210
11.2.3 ANOVA过程 210
实例11-1 分析饲料营养效果是否有明显差异 211
实例11-2 分析不同实验室试制的纸张光滑度有无差异 212
实例11-3 研究6种棉花种子包衣剂对棉花生长的影响 214
11.3 双因素方差分析 216
11.3.1 只考虑主效应的多因素方差分析 217
11.3.2 存在交互效应的多因素方差分析 219
实例11-4 某药物对某癌细胞株增殖影响的研究 221
11.4 协方差分析 222
实例11-5 分析三种饲料的营养价值之间有无显著性差别 225
第12章 回归分析 230
12.1 线性回归 230
12.1.1 线性回归模型 231
12.1.2 回归方程的显著性检验 231
12.1.3 预测问题 233
12.2 REG过程 234
实例12-1 分析我国内地可支配收入和消费性支出之间的关系 237
实例12-2 利用多元线性回归分析学生肺活量及有关变量的关系 240
12.3 多项式回归 243
12.3.1 曲线回归的基本原理 243
12.3.2 RSREG过程 243
实例12-3 确定最佳经济用肥量的多项式回归模型 244
12.4 逐步回归 246
实例12-4 人体血糖、胰岛素及生长素的多元线性回归关系 246
12.5 LOGISTIC回归 248
12.5.1 逻辑回归模型概述 249
12.5.2 LOGISTIC过程 250
实例12-5 对照研究单因素两暴露水平及多暴露水平资料的统计分析 251
12.6 非线性回归 255
12.6.1 非线性回归分析的基本原理 255
12.6.2 NLIN过程 256
实例12-6 酵母种群增长的拟合生长模型 257
实例12-7 最佳生长模型的LOGISTIC拟合 259
第13章 主成分分析与因子分析 262
13.1 主成分分析 262
13.1.1 主成分分析的数学原理 263
13.1.2 用PRINCOMP过程进行主成分分析 264
实例13-1 我国2006年经济发展情况的主成分分析 265
13.2 因子分析 270
13.2.1 因子分析的基本原理 271
13.2.2 因子分析的基本步骤和过程 273
13.2.3 利用FACTOR过程进行因子分析 274
实例13-2 中国房地产经济区的研究分析 276
13.3 主成分分析和因子分析的区别 282
第14章 相关分析和对应分析 284
14.1 相关分析 284
14.1.1 相关关系 285
14.1.2 相关图形和相关系数 286
14.1.3 简单相关分析的CORR过程 287
实例14-1 简单相关系数的计算 288
14.2 典型相关分析 290
14.2.1 典型相关分析的基本原理 290
14.2.2 典型相关分析的CANCORR过程 291
实例14-2 城市竞争力与基础设施的典型相关分析 292
实例14-3 城镇居民收入和支出的典型相关分析 298
14.3 对应分析 305
14.3.1 对应分析的基本原理 306
14.3.2 对应分析的CORRESP过程 307
实例14-4 对应分析在市场细分中的应用 308
第15章 判别分析 313
15.1 判别分析的基本原理 313
15.1.1 判别分析的含义 314
15.1.2 判别分析的数学模型与判别方法 315
15.2 判别分析的SAS过程 317
15.2.1 DISCRIM过程 317
15.2.2 CANDISC过程 319
15.2.3 STEPDISC过程 319
15.3 综合实例 321
实例15-1 国内各省市农民家庭收支情况的研究 321
实例15-2 基于判别分析法的上市公司财务分析研究 328