楼主: 龙潭丰乐
4708 0

sas回归方面简单总结 [推广有奖]

  • 14关注
  • 4粉丝

已卖:115份资源

讲师

50%

还不是VIP/贵宾

-

威望
0
论坛币
6 个
通用积分
0.0600
学术水平
25 点
热心指数
29 点
信用等级
14 点
经验
8649 点
帖子
457
精华
0
在线时间
466 小时
注册时间
2011-11-20
最后登录
2022-1-6

楼主
龙潭丰乐 学生认证  发表于 2013-1-17 22:24:37 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
一、Proc summary 过程
  可以从此过程中,我们可以简单的看到一些变量的统计值(默认是最大值,最小值,个数标准差以及平均值,当然关于那些统计量可以自己选定,如果看到更多的统计量可以使用univariate)。根据这些统计量,我们粗略的看到变量情况。另外我们可以使用output out=数据集  输出一些统计量。
   (此处说明个细节,proc means与proc summary 之间的区别,proc means自动打印,而proc summary需要加上print才能打印)

proc summary data=quan.baipu print;

var x1;

proc means data=quan.baipu mean max;

var x1;

run;




二、Proc corr过程
Proc corr data=data-set;
  With variable ;
   Var variable ;
可以通过此过程看出两变量之间的相关性。当然可以再corr 后面加上spearman。这里简要介绍pearson检验与spearman的区别,spearman可以检验变量间非线性关系,而pearson只能检验线性关系。

三、Proc sgplot
Sgplot过程十分强大。
Sgplot可以展示很多类型的图表,比如说散点图(scatter)、线图(seriers)、回归图(reg)、条形图(vbar、hbar)、柱状图(histogram),点图(dot)等等。当然可以很多设置,有人说sas可以做任何图。的确很强大,但是就是各种设置。比如colour:options color=(black等);

回归图

proc sgplot data=quan.baipu;

reg x=x1 y=x2/clm cli;

run;



Dot

option fmtsearch=(quan);

proc sgplot data=quan.cydc;

dot q2/group=q1;

format q1 quana. format q2 quanb.;

run;



四、Proc reg; model 因变量=自变量/option;
   做回归部分需要有一定的回归基础,比如回归的时候有很多检验,只有检验通过了才能说明模型的合理性。
  先从F检验说起吧,F检验通过说明模型整体的显著性通过。
  T检验显著性通过说明模型中的参数拒绝假设。
F、T检验在回归过程出来的结果是可以看到的,但是其它相关的东西必须要在模型后面添加。
异方差性检验
1、残差图
2、对残差做spearman相关性检验,利用残差与x之间的相关性检验。如果残差符合模型假设的话,与x之间没有关系的。也就是相关性比较低。
3、怀特检验(white)检验假设是同方差性

proc reg data=quan.baipu;

      model x2=x1/white;

run;



可以从后面的概率值得知,存在异方差性。
补救方法:加权最小二乘估计。
关于加权最小二乘需要使用宏编程,需找最合适的权数。

序列相关性检验(自相关性):即残差之间存在自相关性。
1.      通过残差图检验。
2.      D.w检验(根据计量经济学原理d.w检验有五个方面的假设)

proc reg data=quan.baipu;

model x2=x1/dw;

run;



关于D.W检验的区间段,可以判断序列间具有正、负相关。

补救方法:迭代法、差分法、科克伦-奥科特法

共线性性检验:即变量间是否存在共线性性。(vif膨胀因子检验)

proc reg data=quan.baipu;

model x2=x1 x3 x4/vif;

run;



关于膨胀因子大于10,则说明有明显的多重共线性。
补救方法:
逐步回归、主成分回归等等。
逐步回归(selection=stepwise)可以看到逐步回归过程。

其他:
Model 因变量=自变量/r(强影响点)   aic(赤持信息)cli(预测的置信区间) clm(检验的置信区间)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Univariate Selection histogram spearman Variable 标准差 平均值 最大值 统计

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-22 01:20