*-Q1: Testing the equality of coefficients across independent areas http://www.stata.com/support/faqs/stat/testing.html# *-Q2: How can I compare regression coefficients between 2 groups? http://www.ats.ucla.edu/stat/stata/faq/compreg2.htm *-Q3: How can I compare regression coefficients across 3 (or more) groups? http://www.ats.ucla.edu/stat/stata/faq/compreg3.htm *-Q4: Comparing Regression Coefficients Across Groups using Suest *** http://www.ats.ucla.edu/stat/stata/code/suest.htm * e.g. use http://www.ats.ucla.edu/stat/stata/faq/compreg3 , clear regress weight height if age==1 est store age1 regress weight height if age==2 est store age2 regress weight height if age==3 est store age3 suest age1 age2 age3 test height= height test height= height, accum
第五章 异方差 第六节 克服异方差的方法(广义最小二乘法) 1. 直接用引起异方差的解释变量除回归式 对模型 yt = b 0 + b 1 xt 1 + b 2 xt 2 + ut (5.13) 假定异方差形式是 Var( ut ) = ( s xt 1 )2 (因为 Var( ut ) = E( ut )2 ,相当于认为 | | = s xt 1 )。用 xt 1 同除上式两侧得 yt / xt 1= / xt 1+ + b 2 xt 2 / xt 1 + ut / xt 1(5.14) 因为 Var( ut / xt 1) = (1/ xt 12) Var( ut ) = (1/ xt 12) s 2 xt 1 2 = s 2 , (5.14) 式中的随机项 ( ut / xt 1) 是同方差的。对 (5.14) 式做 OLS 估计后,把回归参数的估计值代入原模型 (5.9) 。 对 (5.14) 式应用 OLS 法(求 S ( / xt 1)2 最小)估计参数。其实际意义是在求 S ( /xt 1)2 最小的过程中给相应 ut 分布方差小的 误差项以大 的权数, ut 方差大的 误差项以小 的权数。所 以此法亦称为 加权最小二乘法,是 GLS 估计法的一个特例。 下面以矩阵形式描述克服异方差。设模型为 Y = X b + u (5.15) 其中 E( u ) = 0 , Var( u ) = E( u u ') = s 2 W 。 W 已知, b 与 s 2 未知。因为 W 1 I ,违反了假定条件,所以应该对模型进行适当修正。 因为 W 是一个 T 阶正定矩阵,所以 必存在 一个非退化 T ′ T 阶矩阵 M 使下式成立 M W M ' = I T ′ T (5.16) 从上式得 M ' M = W -1 (5.17) 用 M 左乘回归 模型 (5.15) 两侧得 M Y = M X b + M u (5.18) 取 Y * = M Y , X * = M X , u * = M u , 上式变换为 Y * = X * b + u * (5.19) 则 u * 的方差协方差矩阵为 Var( u * ) = E( u * u *' ) = E ( M u u ' M ') = M s 2 W M ' = s 2 M W M ' = s 2 I (5.20) 变换后模型 (5.19) 的 Var ( u *) 是 一个纯量对角 矩阵。对变换后模型 (5.19) 进行 OLS 估计,得到的是 b 的最佳线性无偏估计量。这种估计方法称作广义最小二乘法。 b 的广义最小二乘 (GLS) 估计量定义为 (GLS)= ( X *' X *)-1 X *' Y * = ( X ' M ' M X ) -1 X ' M ' M Y = ( X ' W -1 X )-1 X ' W -1 Y (5.21) 下面以异方差 形式 Var( ut ) = s 2 xt 2 为例,具体介绍广义最小二乘法变换结果。 (5.22) 定义 (5.23) 从而使 Var( M u ) = E ( M u u ' M ')= M s 2 W M ' = s 2 M W M ' = s 2 I ( T ′ T ) (5.24) 即对于 (5.19) 式来说 误差项已消除了异方差。 2. 利用Glejser检验结果消除异方差 假设 Glejser 检验结果是 | | = + xt 1 说明异方差形式是 Var( ut ) = ( + xt )2 s 2 。用 ( + xt ) 除原模型 (5.9) 各项 , (5.25) 则 = s 2 (5.26) 说明消除了异方差。对 (5.25) 式做 OLS 估计,把回归参数的估计值代入原模型 (5.9) 。 3. 对变量取对数消除异方差 在实际应用中,通过对变量取对数的方法常常能达到消除异方差的目的。详细请见下面的 案例分析 。 来源:http://wenke.hep.edu.cn/NCourse/jljjx/courseware/course/CourseContents/Chapter05/05_06_01.htm
l 有的说每个观察变量最好有 10 个样本,有的说 200 到 500 之间比较好。在 SEM 中,与一般的研究方法相同,样本量越大越好,但是在 SEM 中,绝对指标卡方容易受到样本量的影响,样本越大,越容易达到显著水平。 l 在结构方程建模中,在观察变量到潜在变量的路径系数中,必须规定一条为 1 做标准求的其他路径系数和潜变量的值。潜变量之间就不用规定为 1 了。 l 内衍变量和观察变量都要有一个误差量 e 。 l 指标变量包括观察变量和误差变量 l 如何让绘图区变宽:可以在 view 里面的 interfaceproperties 中点击 landscape 在进入模型检验之前,首先检验是否出现违反估计: l 负的误差方差存在 l 标准化系数超过或太接近1(通常以0.95) 验证性因素分析 信度: 建构信度 等于标准化因素负荷量和的平方 / (标准化因素负荷量和的平方 +(1- 标准化因素负荷量的平方 ) 的和) 收敛效度: 平均方差抽取量: 是指可以直显示被潜在构念所解释的变异量有多少是来自测量误差的,平均方差变异量越大,来自于测量误差越少,即因子对于观察数据的变异解释越大,一般是平均方差抽取量要大于 0.5 ,是一种收敛效度的指标。 等于标准化因素负荷量的平方之和 / 题目数目 验证性因素分析基本模型适配度检验摘要表 : l 是否没有负的误差变异量 e1e2e3 l 因素负荷量(潜在变量与观察变量之间的标准化系数)是否介于 0.5 到 0.95 之间 l V ariances 是否没有很大的标准误 ( 路径系数的标准误 ) 整体模型适配度检验摘要表: 绝对适配度指数 l 卡方值, p 大于 0.05 ,说明数据本身的协方差矩阵和模型的协方差矩阵是匹配的。 l RMR 值小于 0.05 , l RMSEA 小于 0.08 (小于 0.05 优良,若是小于 0.08 良好) l GFI 大于 0.90 ,适配优度 l AGFI 大于 0.90 (调整后的适配度 ) 增值适配度指数 l NFI 大于 0.90 l RFI 大于 0.90 l IFI 大于 0.90 l TLI( 也称为 NNFI) 大于 0.90 l CFI 大于 0.90 简约适配度指数: l PGFI 大于 0.50 l PNFI 大于 0.50 l PCFI 大于 0.50 l CN 大于 200 l 卡方自由度比小于 2.0 ,或者小于 3.0 l AIC 理论模型值小于独立模型值且二者同时小于饱和模型值 l CAIC 同 AIC 验证性因素分析的内在质量参数表 l 所估计的参数均达到显著水平 we l 所有项目的信度均达到 0.50 以上 l 潜在变量的平均抽取变量大于 0.50 l 潜在变量的建构信度(组合信度、构念信度)大于 0.60 l 标准化残差的绝对值小于 2.58 (标准化残差:协方差矩阵的残差) 修正指标: l 修正指标表中 MI 小于 5.0 是否符合正态性检验,检验是否有异常值。 根据 P2 的指标删除变异的 case ,先删除一个,逐步检验删除后的 P2 值。 直接效果和间接效果 如何操作 模型探索: