<DIV class=quote><B>以下是引用<I>gemini69</I>在2005-3-30 2:06:37的发言:</B>
<P>Well, what do you depond on while building a model? The standard procedure in econometrics is to choose variables from the so called information set to be the explanatory variables. The choosing usually deponds on the related theories. Therefore, here the key point is.
<P>First, It is misspecification error omitting relevant variables in an estimated equation while those variables "should" be included, which are suggested by the theories. This will produce biased and inconsistent estimators. The estimated variance of error terms is in the same situation as well.
<P>Second, The problem of using principal components to be the regressor is that this estimator of regression coefficient is just a linear combination of the estimators of those variables in the original multivariate regression. What does the coefficient of principal components mean if those coefficients of multivariate regression have an interpretation? The answer is negative possibly.
<P>You can find the answer of other questions you mentioned in any "textbook" about multivariate analysis if you do not have any problem in matrix algebra and linear algebra. It might be a better way to view the multivariate analysis as one in a multi-dimensions vector space because characteristic roots and characteristic vectors are related in that way.
</P>
<P>Thanks for your reponse.
</P>
</DIV>
<P>
<P>Thank you very much,gemini69
<P>你说的建模依据,是用信息变量集去解释被解释变量。
第一点是:“如果该纳入的变量被省略了,就会产生有偏不一致的估计值,并且误差项方差也有同样的问题。
第二点是:“如果用主成份回只是原变量的线性组合,回归后的系数难以说明其含义”
<P>其实,之所以采用主成分回归,是为了避免你说的第一点,不想省略相关的解释变量,但如果自变量很多,因为自变量之间是相关的,所以多重共线性问题就使得回归系数的t值通不过,回归参数的方差很大,得不到有效的估计值。为了解决多重共线性问题,引入了主成份回归,却又带来了你说的“misspecification error ”即第一点问题。真是拆东墙补西墙啊?赫赫。这是解决问题的一个办法吗?
<P>正如我前面说的,<FONT color=#ff0000>主成份回归把它当作一个中间变换过程,不管它的意义,最后将主成份变换回原水平的Y和Xi不就可以解释其意义了吗?</FONT>我不是理工科出身的,但也了解到,数学方法中有一门叫积分变换的,纯粹是为了计算而使用的一种方法,好象有傅里叶和拉普拉斯变换几种吧,都不需要解释含义的,只要逻辑意义上行得通就可以了,你认为如何?
<P>我对数学很感兴趣,但是我本科学的管理,非理工科出身,所以,矩阵代数或线性代数学得不好,我手头上有几本《多元统计分析》,因为急着要用,也没办法从头到尾扎实地学一遍,只是重点看了其中的一些结论。因为各方面的原因,包括时间上及数学基出方面的原因,现在不太可能从头到尾细致地学一遍空间解释几何及矩阵代数,以及关注太多的多元统计上的细节,我只求会用。
<P>很希望gemini69可以给我一些好的建议,我对数学其实也是很感兴趣的,<FONT color=#0000ff>你觉得学好矩阵代数的关键在哪呢?</FONT>能在论坛上认识gemini69真是我的一大幸运啊,感谢了。
<P>最后,关于因子分析与主成份分析,它们之间的区别我是基本上清楚了的,而我想知道的是,当它们分别用于多元回归的时候,区别又在哪里呢?我在多元统计分析里头好象没找到讨论关于它们在用于回归分析时的区别的部分啊?
<P>我看的两本多元统计是:1、"Richard A Johnson & Dean W.Wichern,Applied Multivariate Statictical Analysis",中文版,清华大学出版社的。2、王学民,应用多元分析,上海财大出版社。
<P><FONT color=#ff0000>最后再重复一下我的问题:主成分与主因子得分分别<FONT color=#0000ff>用于回归分析时</FONT>,它们的区别是什么呢?回归过后,还要不要将变量返回原水平?</FONT>
<P>我见过有论文没将它们返回原水平的,而且<FONT color=#0000ff>两种方法得到了两种结果</FONT>,那是《数量经济技术经济研究》2004年第9期的一篇文章,那篇文章其实是讨论主成分分析与因子分析的区别的,而不是重点讨论将它们用于回归分析时的区别,讨论到最后,也没有说清楚得出的结论如何解释的问题,就象我问的,<FONT color=#0000ff>要不要将它们返回原水平</FONT>,那篇文章没将它们返回原水平的。
<P>Thanks a lot~</P>