先引用其他帖子里的一段话做个铺垫 “从数理关系上看,控制变量和解释变量是一回事,只是说法不同。” “解释变量与控制变量都是作为自变量放在方程的右边,二者为了突出研究的问题进行了区分。解释变量是指着重研究的自变量,是研究者重点考查对因变量有何影响的变量。而控制变量是指与特定研究目标无关的非研究变量,即除了研究者重点研究的解释变量和需要测定的因变量之外的变量,是研究者不想研究,但会影响研究结果的,需要加以考虑的变量。” “ 对于调节变量而言,其目的是强调它的出现对一个或几个解释变量在某一问题中影响,因而,需要将调节变量与所要调节的解释变量相乘,将其乘积作为一个回归变量。例如,路况与交通事故的关系研究。假设路况好坏影响交通事故的发生。而下雨天促使交通事故发生的可能大大增大。那么下雨天就成为了调节变量。回归方程就写为:y=a+路况Z1+路况×下雨天Z2+e” 1、看到后边有个帖子回复说 “至于控制变量的参数则就没有那么重要了” ~是不是说,如果回归通过了F检验且拟合优度比较高,即使控制变量的t检验没有通过也可以保留这个控制变量? 2、在确定了所有影响被解释变量的因素后,如果不知道如何确定解释变量和控制变量,能不能先做回归,然后把显著性水平高的因素作为解释变量,显著性水平低的变量作为控制变量? |