案例文件的说明(3)
- recidivism.sav。该假设数据文件涉及某ZF执法机构在了解其管辖区域内的屡犯率方面的举措。每个个案对应先前的一名罪犯,并记录其人口统计信息和第一次犯罪的详细资料;如果在第一次被捕后两年内又第二次被捕,则还将记录两次被捕间隔的时间。
- recidivism_cs_sample.sav。该假设数据文件涉及某ZF执法机构在了解其管辖区域内的屡犯率方面的举措。每个个案对应在 2003 年 6 月期间第一次被捕释放的先前的一名罪犯,并记录其人口统计信息和第一次犯罪的详细资料,及其第二次被捕的数据(如果发生在 2006 年 6 月底之前)。根据 recidivism_cs.csplan 中指定的抽样计划从抽样部门选择罪犯;该计划使用与大小成正比 (PPS) 方法,因此,还有一个文件 (recidivism_cs_jointprob.sav) 包含联合选择概率。
- rfm_transactions.sav。 此假设数据文件包含购买交易数据,即每笔交易的购买日期、购买商品和消费金额。
- salesperformance.sav。这是关于评估两个新的销售培训课程的假设数据文件。60 名员工被分成 3 组且都接受标准的培训。另外,组 2 接受技术培训;组 3 接受实践教程。在培训课程结束时,对每名员工进行测验并记录他们的分数。数据文件中的每个个案代表一名单独的受训者,并记录其被分配到的组以及测验的分数。
- satisf.sav。该假设数据文件涉及某零售公司在 4 个商店位置所进行的满意度调查。总共对 582 位客户进行了调查,每个个案代表一位单独客户的回答。
- screws.sav。该数据文件包含关于螺钉、螺栓、螺母和图钉的特征的信息(Hartigan, 1975)。
- shampoo_ph.sav这是关于某发制品厂的质量控制的假设数据文件。在规定的时间间隔对六批独立输出的产品进行检测并记录它们的 pH 值。目标范围是 4.5–5.5。
- ships.sav。在别处被提出和分析的(McCullagh 和 Nelder, 1989)关于波浪对货船造成的损坏的数据集。在给定了船的类型、建造工期和服务期后,可以根据以泊松比率发生来为事件计数建模。在因子交叉分类构成的表格中,每个单元格的分类汇总服务月数提供遇到风险的值。
- site.sav。该假设数据文件涉及某公司在为扩展业务而选择新址方面的举措。该公司聘请了两名顾问分别对选址进行评估,除了提供长期报告外,他们还要以“前景颇佳”、“前景良好”或“前景不佳”来对每个选址进行总结。
- smokers.sav。该数据文件摘自 1998 年全国家庭药物滥用调查并且是美国家庭的概率样本。(
http://dx.doi.org/10.3886/ICPSR02934) 因此,分析该数据文件的第一步应该是对数据进行加权以反映总体趋势。
- stocks.sav 该假设数据文件包含某一年的股票价格和成交量。
- stroke_clean.sav。该假设数据文件包含某医学数据库在经过“数据准备”选项中的过程清理后的状态。
- stroke_invalid.sav。该假设数据文件包含某医学数据库的初始状态及一些数据输入错误。
- stroke_survival。此假设数据文件涉及正在研究结束缺血性中风后复元计划的患者存活时间的研究人员面临着很多挑战。中风后,记录心肌梗塞、缺血性中风或出血性中风的发生及其时间。样本为左侧截短,因为只包含在中风后管理的复元计划结束后存活的患者。
- stroke_valid.sav。该假设数据文件包含在使用“验证数据”过程检查值后,某医学数据库的状态。它仍包含潜在异常个案。
- survey_sample.sav。此数据文件包含调查数据,包括人口统计学数据和各种态度测量。它基于 1998 NORC 综合社会调查的变量子集,但某些数据值已经过修改,并添加了其他虚拟变量以供演示用途。
- telco.sav。该假设数据文件涉及某电信公司在减少客户群中的客户流失方面的举措。每个个案对应一个单独的客户,并记录各类人口统计和服务用途信息。
- telco_extra.sav。该数据文件与 telco.sav 数据文件类似,但删除了 "tenure" 和经对数转换的客户消费变量,代替它们的是标准化的对数转换客户消费变量。
- telco_missing.sav。 该数据文件是 telco.sav 数据文件的子集,但某些人口统计数据值已被缺失值替换。
- testmarket.sav。该假设数据文件涉及某快餐连锁店为其菜单添加新项目的计划。有三种可能的促销新产品的活动,所以会在多个随机选择的市场中的地点引入新的项目。在每个地点采用不同的促销方式,并记录新项目前四周的每周销售情况。每个个案对应单独地点的一周。
- testmarket_1month.sav。该假设数据文件是在数据文件 testmarket.sav 的基础上加上了每周销售“累计”,所以每个个案对应一个单独的地点。所以,一些每周更改的变量消失了,而且现在记录的销售是为期四周的研究过程中的销售之和。
- tree_car.sav。该假设数据文件包含人口统计和车辆购买价格数据。
- tree_credit.sav。该假设数据文件包含人口统计和银行贷款历史数据。
- tree_missing_data.sav 该假设数据文件包含具有大量缺失值的人口统计和银行贷款历史数据。
- tree_score_car.sav。该假设数据文件包含人口统计和车辆购买价格数据。
- tree_textdata.sav。这是一个只有两个变量的样本数据文件,主要打算在指定测量级别和值标签之前显示变量的默认状态。
- tv-survey.sav。该假设数据文件涉及由某电视演播室进行的一项关于是否要继续制作一档成功的节目的调查。906 位调查对象被问及他们在各种情况下是否会收看该节目。每行代表一位单独的调查对象;每列代表一种单独的情况。
- ulcer_recurrence.sav。此文件包含某项研究的部分信息,该研究旨在比较两种用来防止溃疡复发的治疗的功效。它提供了区间数据的优秀示例并且已在别处被提出和分析(Collett, 2003)。
- ulcer_recurrence_recoded.sav。该文件重新组织 ulcer_recurrence.sav 中的信息以允许为研究的每个区间的事件概率建模而不是简单地为研究结束事件概率建模。它已在别处被提出和分析(Collett, 2003)。
- verd1985.sav。该数据文件涉及某项调查(Verdegaal, 1985)。该调查记录了 15 个主体对 8 个变量的响应。需要处理的变量被分成 3 个集。数据集 1 包含 年龄 和 婚姻;数据集 2 包含 宠物 和 新闻;数据集 3 包含 音乐 和 居住。宠物被尺度化为多名义而年龄被尺度化为有序;所有其他变量都被尺度化为单名义。
- virus.sav。该假设数据文件涉及某因特网服务提供商 (ISP) 在确定病毒对其网络的影响方面的举措。他们从发现病毒到威胁得以遏制这段时间内跟踪其网络上受感染的电子邮件的流量的(近似)百分比。
- wheeze_steubenville.sav。这是关于空气污染对儿童健康影响的纵向研究的一个子集(Ware, Dockery, Spiro III, Speizer, 和 Ferris Jr., 1984)。这些数据包含儿童的气喘状况的重复二分类测量(这些儿童来自 Steubenville,Ohio,年龄为 7 到 10 岁),以及母亲在研究的第一年中是否为吸烟者的固定记录。
- workprog.sav。该假设数据文件涉及一份尝试为弱势群体提供较好的工作的ZF工作计划。文件后还有一个潜在计划参与者的样本,其中一些参与者是被随机选择来参加该计划的,而其他参与者则不是。每个个案代表一位单独的计划参与者。
- worldsales.sav 该假设数据文件包含按不同大洲和产品列出的销售收入。