楼上举例非常正确,理解起来很简单,我用理论再来做一个解释:
假设我们的核心解释变量是X(研究假设),控制变量为C,因变量为Y。在没有纳入C之前,我们看到X对Y的影响是显著的;一旦纳入C以后,这种关系不再显著。你可以画一张图,X对Y有一个箭头,C对Y有一个箭头,通过分析如果你发现C对X也有一个箭头(有显著影响),这个时候我们就能判断说:C is confounding variable and the relationship between X and Y is spurious (也就是楼上说的虚假相关).
这种时候是必然要纳入C的,因为在第一个模型中,C存在于随机误差项中,而C与Y有关,C与X也有关,如果不纳入C,就意味着违背了基本假设COV(x,e)=0,这个时候的X系数是biased,bX=bX(true)+ bC*bXC。所以这个事情的结论就是楼上帖子里讲的,在控制C后,X与Y的关系不存在,研究假设不成立。