1.对学生数据(CLASS),用SAS菜单系统及编程完成以下练习:
(1) 计算AGE,WEIGHT, HEIGHT的相关系数
(2) 绘制AGE,WEIGHT, HEIGHT的散布图阵,并对预测均值附加85%的置信椭园.
(3) 用SAS/INSIGHT绘制WEIGHT 与HEIGHT的散布图(男女用不同颜色,不同年龄用不同的符号表示).
1. 讨论某种合成纤维的强度与拉伸倍数x的相关关系(数据见数据集DST.regE21).试用SAS菜单系统及编程完成以下练习:
(1) 建立Y (合成纤维的强度)与x(拉伸倍数)回归关系式,并给出回归系数的检验结果。
(2) 给出当x=2.2,3.2,6.2和10.2时,合成纤维的强度的预测值及线性回归预测均值的90%置信区间。
(3) 绘制Y对x的散点图,回归线及均值的95%的置信限.
2.对不同类型汽车的价格和性能的数据(DST.CARS)用SAS菜单系统及编程完成以下练习:
(1) 建立MIDPRICE(中间价)与PERFORM(使用效率--性能)回归关系式,并给出回归系数的检验结果.
(2) 给出当PERFORM=0.03,0.04, 0. 05和0.06时,中间价的预测值及线性回归预测均值的90%置信区间.
(3) 绘制MIDPRICE(中间价)对PERFORM (性能)的散点图,回归线及均值的95%的置信限.
1.对不同类型汽车的价格和性能的数据(DST. CARS)用SAS菜单系统及编程完成以下练习:
(1)建立MIDPRICE(中间价) 与citympg,cylinder,hwympg, egnsize, rpm, revl tns, fueltnk和perform的多元回归关系式,并给出各个回归系数的检验结果.
(2)由回归系数的显著性检验结果,能否指出影响中间价格的主要因素是哪些?哪几个因素是不显著的(a=0.10)?
(3) 对92辆汽车的数据用以上拟合的回归式进行预
测,并且给出均值的95%的置信区间.
1.对不同类型汽车的价格和性能的数据(DST. CARS)用菜单系统“分析员应用”及编程完成以下练习:
(1)用逐步筛选方法建立MIDPRICE与citympg,
cylinder, hwympg, egns ize, rpm, revltns, fueltnk和perform的最优回归方程,(引入和保留变量的显著性水平为0.05).
(2)计算MIDPRICE(中间价) 与citympg,cylinder,hwympg, egnsize, rpm, revltns, fuel tnk和perform的所有可能回归式.并且对每种变量个数输出最好的二个回归子集.
1.试对发动机性能数据用菜单系统及编程方法完成以下练习:
(1)绘制POWER(马力)对SPEED(用每分钟转几百转度量)的散布图,它们是满足线性关系吗?
(2)建立POWER与SPEED的线性关系式,并进行显著性检验.
(3)建立POWER与SPEED的二次多项式回归.并且与一元线性回归式比较之.用几阶多项式拟合最合适?
2.试用编程方法或SAS菜单系统对钢包浸蚀数据进行分析,假定Y与X的函数关系为①双曲函数:1/y=a+b/x;②对数函数:y=a+blogx;③幂函数: y=a+bxl/2;④负指数函数:y=ae-b/x,,试作变量变换化非线性回归为线性,并建立回归方程,并比较以上四种函数关系,找出最佳的拟合曲线.
1. 试对数据Reynolds用菜单系统及编程方法完成以下练习:
(1)建立sales与months的一元线性关系式,并绘制散布图,回归线图,sales对months和预测值的残差图,从中能否直观看出该线性模型是否适合这组数据?
(2)建立sales与months 的二次多项式回归后.绘制POWER对预测值的残差图.残差图是否较(1)中正常?
2.对不同类型汽车的价格和性能的数据CARS用SAS菜单系统Insight完成以下练习:
(1) 建立MIDPRICE(中间价)与其它7项指标的多元回归关系式,计算预测值和残差值,并添加到数据表中.找出标准化残差的绝对值大于2的观测点(可疑点)生成一个数据集(名为outlier).
(2) 计算COOKD和DFFITS统计量,并添加到数据表,然后找出强影响点.这些是否也是异常点或可疑点?
(3)检验标准化残差的正态性.