计量经济学需要知道的常识一二三 - EViews专版

1关注
37粉丝

讲师

71%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 7809 个
通用积分: 3638.8132
学术水平: 54 点
热心指数: 63 点
信用等级: 37 点
经验: 64990 点
帖子: 315
精华: 2
在线时间: 503 小时
注册时间: 2011-4-5
最后登录: 2024-4-15

楼主

leexue1991

发表于 2014-10-25 11:02:34 |只看作者 |坛友微信交流群|倒序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

第一章 计量经济学概论

一、什么事计量经济学(Econometrics)？

1. 定义

几个比较权威的定义

(1) 计量经济学是一门发展迅速的经济学分支，其目标是给出经济关系的经验内容。

(2) 计量经济学科为实际经济现象的定量分析，这种分析根据的是由适当的推断方法联系在一起的理论和观测的即时发展。计量经济学运用数理统计知识分析经济数据，对构建与数理经济学基础上的数学模型提供经验支持，并得出数量结果。

(3) 计量经济学是将经济理论，数学，和统计推断等工具应用于经济现象分析的社会科学。

综上所述，计量经济学是一门有关经济关系的经验估计的经济学分支。计量经济学依据经济理论，使用数学和统计推断等工具，用观测数据对经济和商务活动进行实证研究，测度和检验经济变量间的经验关系，从而给出经济理论的经验内容，在经济理论的抽象世界和人类活动的具体世界之间搭建桥梁。

经济理论，数学和统计学知识在计量经济学这一领域进行研究的必要前提，这三者中的每一个对于真正理解现代经济生活中的数量关系是必要的，但不是充分的，只有结合在一起才行。因此，一个优秀的计量经济学家必须是合格的数学家和统计学家，还应该是一个经过系统经济学训练的经济学家。

2. 要素

经济理论，数学和统计方法

3. 目标

计量经济学从根本上说，是对经验规律的认识以及将这些规律推广为经济学定律的系统努力，这些定律被用来进行预测，即关于什么可能发生或者什么将会发生的预测。因此，广义上说，计量经济学可以成为预测的科学。

因为使用统计学的分析方法，所以计量经济学有别于像数学那样的传统的科学，具体在以后我们会涉及到。

4. 计量经济学(Economitrics)发展

最早是在W.Petty在1690年写的《政治算术》中出现计量经济学。其观点是尽可能地排除主观因素，强调比较那些用于数据分析的数量，重量以及衡量尺度的重要性。

1911年H.L.Moore在他所著的《工资的法则》中，开始用统计的手法对工资的边界生产力进行了验证。

20世纪20年代末期资本主义世界发生了严重的经济危机，原有的经济理论失灵，产生了所谓的凯恩斯革命。在这种情况下，各国ZF出于对经济的干预政策的需要，企业管理层为了摆脱或减少经济危机的打击，在经济繁荣时期获取更多的利润，要求采取计量经济理论和方法，进行经济预测。加强市场研究，探讨经济政策的效果，因而计量经济学应运而生。同时随着科学技术的发展，各门学科相互渗透，数学，系统学，信息学，控制论等相继进入经济研究领域，使经济科学进一步数量化，有助于计量经济学的发展(在后面我们会将到计量经济学的第一步是建立模型，也就是给出一个数量间的关系，在以往定性分析中解决不了的定量关系可以得到解决)。高速电子计算机的出现和发展，为计量经济技术的广泛应用铺平了道路。

最直接的原因，个人认为是“黑色的星期四的1929年10月24日纽约华尔街股票市场出现了空前绝后的暴跌。到了第二年也就是1930年黑色星期四暴跌的恐慌还席卷着全世界。人们意识到需要一门科学，他能够从经验的角度定量地把握经济。计量经济学会(EconometricSociety)是在这样一个大的背景下，于1930年12月29日，以挪威的经济学家费里希(R.Frisch)为主，在美国成立，并在1933年开始发行学会杂志《计量经济学》(Econometrica). 费里希(R.Frisch)在杂志的刊词中明确地提出计量经济学的范围和方法，指出计量经济学是经济理论，数学和统计学的总和，但是它又不同于这三个学科中的每一个。学会的宗旨是让经济学理论与统计学和数学结合起来，并促进经济学理论的发展。从此在经济学领域里，计量经济学就获得了一个席位，并开始真正的发展壮大起来。

我国计量经济学的广泛研究和应用起步较晚，始于20世纪80年代的后期。经过这些年的发展，已经取得了长足的进步，很多ZF部门和学术机关应用了计量经济模型进行经济预测和政策分析。计量经济学在我国国民经济的发展中将发挥越来越大的作用。

特别提出的是，在诺贝尔经济学奖的获得者中也有许多学者因为对计量经济学的卓越贡献而获此殊荣，可见计量经济学的重要。

二、计量经济学的方法

1. 计量经济学方法的内容：

两大要素：理论和事实。

理论是任何计量经济学研究的基本要素，但是理论必须以一种可用的形式给出。对计量经济学来说，这种可用的形式就是模型(model)的形式。具体说就是计量经济模型。模型概括了与所研究的系统相关的理论，是理论用于实证研究的最方便的方式。任何计量经济学研究的一个必不可少的部分是模型的设定，也就是构筑一个能过恰当表示所研究现象的计量经济模型。

另外一个要素是事实(fact),指的是现实世界与所研究现象相联系的事件，这些事件导致代表相关事实的一组数据。一般来说，数据必须以各种方式进行加工，使它们能够适合于计量经济研究的使用。这种加工包括各种各样的调整，如季节调整、插值，不同数据源的合并以及使用其他信息来修正数据等，结果是一组加工好的数据。

计量经济学的核心是两个要素的结合，即用加工好的数据估计计量经济模型。

估计好的模型主要用于：结构分析，预测和政策评价。

2. 计量经济分析的流程与步骤

(1) 建立计量经济模型 (model building)

众所周知，经济学是一门经验科学。但是这并不意味着进行简单的事实收集、分类，从中就可以得出具有一般性的规律。所谓理论模型，就是能够从整体上把握经济现象的一种框架。根据框架，寻找事实来解释。所以如果不考率实际情况，会有非常多的模型。仅从收集、整理事实这项工作，不能决定一个唯一的模型。不是从现实开始寻找理论，而是先确定理论之后，再去寻找事实。

为什么描述性统计学的分析不能满足，计量经济学是建立理论模型的开始？

不考虑现实情况，会存在无数个理论模型，而结果确实只需要一种模型，它必须能够通过对观察到的事实进行比较，能够判断哪一个模型比较好。

用模型描述非常复杂的现实，只是一种美好的愿望，实际上却是实现不了的。现在的做法是：在假设基础上尝试着建立对现实简单化、抽象化的理论模型。虽然是简单、抽象的模型，但是一定要能够明确的表达现象的本质，而且还要能够推广到一般的情况种去。从没有理论基础的单纯的数量测算来阐明其中的因果关系，进一步再扩展到一般情况是不可能的。可是，通过那些经得起事实检验的模型中可以知道其中的因果关系，也可以进一步推广到一般情形之中去。

具体，

步骤1 在以经济理论为中心的先验情报(a priori information)的基础上，把复杂的经济现象以经济假说的形式简单化，利用数学知识建立模型。

步骤2 根据分析的目的，以往同类分析手法，以及拿到数据的情况等来决定函数形式（比如做个散点图(scatter diagram)判断函数的形式是线性，还是非线性等等），也就是所谓的特定化(specification).

模型选择的原则：一般尽可能地选择简单的模型进行分析，主要是应为简单的模型易于估计和检验。

数学模型和计量经济模型的区别

下图中的(日本)国内家庭消费支出的散点图中，横轴代表国内家庭消费支出，纵轴代表在饮食方面的支出，图中粉色的点代表样本数据。散点图上看，数学模型是无法拟合该样本，而计量经济模型却可以比较好地拟合该样本。

(2) 数据收集

数据可以理解为事实的一种表现，为了达到估计未知参数的目的，必须收集相应的数据。

一般数据有两类：时间序列数据(time series)和横截面数据(panel data).

时间序列数据是根据时间的推移而收集到的数据，每一个数据都与时间有关；横截面数据则是固定时间后，在同一时点收集的各变量的观察值。

(3) 估计参数

用收集到的数据对模型进行参数估计(estimation)；

进行参数估计的主要方法有参数法和非参数法两类。其中，常用的参数法有最小二乘法、最大似然法(最尤法)等。

(3) 假设检验(test of hypothesis)

利用所得的结果进行假设检验(test of hypothesis).

检验主要有三方面内容：

a. 有意性的检验

用统计学的方法评价得到的参数估计的信任程度；

b. 条件的检验

判断参数估计的符号等结果是否与经济理论一致；

c. 拟合程度的检验

对历史数据的拟合程度

一般先预留少量的历史数据，然后将得到的理论模型与实际的模型进行比较，从而判断模型的模拟程度。

(4) 预测和政策分析

三、计量经济模型及其应用

1．种类

按被说明变量的数量可以分为：单方程模型和联立方程模型。

单方程模型用于描述一个因变量与一个或几个自变量间的关系；

联立方程模型是由多个方程构成，用于描述整个经济系统或其子系统。

2．应用

(1) 结构分析

当一个或几个变量发生变化时候，会对其他变量或者整个经济系统产生什么样的影响。结构分析所采用的主要方法有弹力性分析和乘数效果分析。

通过模型和数据检验和验证经济关系来理解现实世界的经济关系。结构分析的一个结果可能是对理论的反馈影响。

(2) 预测

用估计好的模型去预测样本外的数量值。

(3) 政策评价

四、　　计量经济分析的软件

最简单的是Excel

易于掌握和应用的是TSP(Time Series Processor)和Eviews，

适用于时间序列数据的有TSP、Eviews、GAUSS等，

适用于面板数据的有Eviews, SPSS,STATA,SAS等。

1-计量经济学概论.doc (121.5 KB, 需要: 1 个论坛币)

2----计量经济分析中的统计学基础知识.doc (629.5 KB, 需要: 1 个论坛币)

3---单变量回归.doc (616.5 KB, 需要: 1 个论坛币)

4----多元回归.doc (664 KB, 需要: 1 个论坛币)

5----误差项的问题.doc (434.5 KB, 需要: 1 个论坛币)

6----联立方程组.doc (434 KB, 需要: 1 个论坛币)

7---平稳过程.doc (294.5 KB, 需要: 1 个论坛币)

8----非平稳过程.doc (210.5 KB, 需要: 1 个论坛币)

9-ARCH.doc (83.5 KB, 需要: 1 个论坛币)

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享1 收藏23 回帖

关键词：计量经济学计量经济经济学 econometrics econometrica 经济学

相关帖子

已有 3 人评分	经验	论坛币	学术水平	热心指数	收起理由
fin-qq			+ 2	+ 1	观点有启发
祝贺人大	+ 12	+ 12			精彩帖子
crystal8832		+ 12	+ 1	+ 1	精彩帖子

总评分: 经验 + 12 论坛币 + 24 学术水平 + 3 热心指数 + 2 查看全部评分

使用道具举报

沙发

leexue1991

发表于 2014-10-25 11:04:18 |只看作者 |坛友微信交流群

第二部计量经济分析中的统计学基础知识

学习目标
      随机变量﹑概率分布及其性质
      正态分布﹑二项分布等常用分布及其性质
      点估计和区间估计
      统计检验

为了更好地理解计量经济学，还是需要一些相应的统计学知识。在这一章里，对于那些在计量经济学的学习中使用频率高的统计学的知识，特别是以数据观察和整理为目的的描述性统计学(descriptive statistics) 为中心，从初步开始复习。

第一节  概率和概率分布
一．概率的概念
1.  随机实验和事件
      例如：投掷色子
      随机实验至少有两个结果，而且在实验过程中将出现哪种结果是不确定的，
      投掷的结果有这六种可能，每种出现的概率为1/6；
      一个随机实验的所有可能出现的结果的集合为样本空间或总体
总体为；
样本空间的每一个成员为样本点，如其中1，2，3，4，5，6；
事件是样本空间的子集，。
互斥事件：如果两个事件中一个事件的发生排除另一个事件的发生；
完备事件：如果若干个事件包罗了一个实验的所有可能的结果。
1．总体和样本
总体：需要观察事件的总体；
样本：
通常假定样本具备总体的特征，我们就可以通过分析样本来推断总体的一些特性。
例如：药品的质量检查，产品的寿命，学生成绩等
2．事件的概率
在一个事件发生之前该事件的相对确定的测度是这个事件的概率。
客观的标准，不以人的主观意愿为转移。
相对测度：
3．概率的性质
(1). 必须是小于1的正数或零，；
   事件A不会发生；    事件A一定发生。
(2). 如果A,B,C,…是完备事件集，则    。
(3). 如果A,B,C,…是互不相容的事件则
。

二．随机变量和概率分布
1．随机变量
可以在一个特定数集中按一定概率取值的变量叫随机变量(random variable)。
在样本空间上定义的变数；
或，决定与样本空间的样本点线对应的值。
例如：投掷色子，扔钢崩
2．随机变量的概率分布和概率密度函数
2-1 种类：离散型(discrete)随机变量和连续型(continuous)随机变量
2-2 概率分布函数(probability distribution function,PFD)，简称概率分布。
      形式：；

X       正面          反面
         Y             X=1          X=0

         正面 Y=1    1/4             1/4             1/2
         反面 Y=0    1/4             1/4             1/2

                        1/2             1/2             1
      边际概率（marginal probability）：
      定义：
      条件概率(conditional probability)
      定义：

注意：


三、描述性统计量：
（一）集中趋势测度：测量一个变量典型取值的统计量
1．算术平均 (arithmetic mean)

考察中心聚集程度
2．加权算术平均 (weighted arithmetic mean)

各个数据的重要程度体现在平均值的计算中，所以确定适当的权数是非常重要的。
3．变化率
   ，例如，收益率，单位为%。
4．几何平均  (geometric mean)

或者计算对数

一般几何平均适合计算经济成长率，工资上升率等增长率，例如：计算中国的经济成长率：7%，8%，9%，则这三年的平均经济增长为，单位也是%，但是一旦其中一个或几个数据等于0或者小于0的时候，我们就不能计算几何平均数。
5．移动平均  (moving average)
通过计算移动平均我们可以去掉不必要的变动，如循环变动，季节变动等，进而把握长期的趋势。
计算方法：例如3项移动平均；
（二）离散测度：测量一个变量所有数据的离散程度的统计量
6．方差和标准偏差  (variance and standard deviation)
作用：用来考察偏离中心的程度
方差计算方法：  总体的方差；
样本的方差；
越小说明数据的集中程度越好。
标准偏差的计算方法：  总体的标准偏差
样本的标准偏差
7．变动系数  (coefficient of variation)
计算方法：
         其中，分子  标准偏差，分母  算术平均。
作用：  可以进行相对程度的比较
8．标准化变量  (standardized variable)
计算方法：

（三）测量变量之间的变化的联系：
9．协方差(covariance)和相关系数  (correlation coefficient)
9-1 协方差：
作用：测量两个变量共同变化的程度
定义：  ；
   当 X,Y同方向变动；当 X,Y同方向变动。
。
9-2 相关系数：
作用：反映两个变量的线性相关程度
定义：

四．概率分布的特征
1．期望值(expected value, or expectation)
离散型(discrete)：
            投掷色子的期望值
            ；
连续型：，其中a为值域的下限，b为值域的上限。
例如：一样分布
   则。
2．期望的性质
2-1．常数的期望是它本身

   可以理解为X的取值范围为b和其他。概率，；则。
2-2．结合律:和的期望值等于期望值的和，即设为随机变量，和b为常数，则
   。


2-3．若为独立随机变量，则

3．方差(variance)
3-1  定义：
设为一随机变量，且，则。
具体，对于离散的随机变量，有
；
标准偏差(standard deviation)
例如，投掷色子

对于连续的随机变量， .
例如一样分布(uniform distribution)的方差

4．方差的性质
(1) ；
投掷色子
   (2) ，常数项的方差为0。
(3)
(4)  若X,Y为两个独立的随机变量，则
   ；
(5)  若X,Y为两个随机变量，则


5．协方差(covariance)
若X,Y为两个随机变量，他们的均值分别为，则
；
若X,Y为两个独立的随机变量，则； X,Y不相关；
独立不相关；不相关独立。
6．相关系数(correlation coefficient)
两个随机变量X,Y的总体相关系数定义为

是用来度量两个变量之间的线性相关程度，其值在-1和+1之间。
(1)    正的完全相关 (perfect correlation);
(2)    正相关 (positive correlation);
(3)    不相关 (not correlation);
(4)    负相关 (negative correlation);
(5) 负的完全相关 (perfect correlation)
连续型(continuous)
2-3 概率密度函数(probability density function,PDF)
      ,       ,
例如：一样分布(uniform distribution)

联合密度函数(joint density function)：
   一般的联合密度为  ；
   但是当X,Y独立；
联合概率分布 (joint probability distribution)
边际概率分布 (marginal probability distribution)
边际密度函数 (marginal density function)          ；
条件密度    ；
密度函数的转换：

五．几个重要的理论概率分布
1. 二项分布 (binomial distribution)

E(X)=np;  Var(X)=npq.
在大样本的情况下，当p非常小，二项分布可以用泊松分布来近似；当p不是非常小的时候，二项分布可以用正态分布来近似，即当n非常大的时候，二项分布B(n,p)近似于正态分布N(np,npq)。
2. 泊松分布 (Poisson distribution)
现实生活中，产品的废品率，交通事故等等那样发生一次的概率非常小，而且会做非常多的循环观察。可以用泊松分布来描述这样的分布。
把二项分布的单位，比如一天，细分为n个小单位，这样每一个细小单位内都不可能有两个事件发生。
   应用于小数事件(law of small numbers);
E(X)=m，相当于二项分布的均值np;  Var(X)=m.
泊松分布只有一个参数。
3. 正态分布 (normal distribution)
3-1  密度函数
   其中是期望值，是方差。
   形状：期望值的地方最大；随着x和的差距变大，f(x)逐渐变小；在是函数f(x)的拐点。
3-2  性质
  (1)  关于期望值的对称性
  (2)  期望值的一倍标准偏差之间为68%，两倍偏差之间为95%，三倍偏差之间为99.7%.
(3) 正态分布可以完全有均值和方差这两个参数所描述
标准正规化  ，，
其中，为标准正态分布 (standard normal distribution),其密度函数为

  (4)  正态分布的线性函数还是正态分布
   和的均值等于均值的和；和的方差也是方差的和。
例题：把一个色子扔180回，6这个面出现25回以上40回以下的概率是多大？
解体思路：根据当次数变大的时候，二项分布接近于正态分布。
解：先求出期望值，    ；
其次，求出方差，；
再次，中的随机变量 X服从于正态分布 ; 可以通过如下的方法将随机变量X标准化

其中， ;
最后，
=0.3643+0.4821=0.8664.
4.    分布  (chi-square distribution)
4-1如果为独立的标准正态分布，则 ,
其中，n为自由度，即独立量的数目。
4-2  性质
(1) 非对称性。
随着自由度的增大，其对称性会随之增大；
(2)  期望值为自由度n,方差为自由度的两倍2n；
(3)    加法性。
如果，且，则
。
5. t分布  (t-distribution)
5-1 定义
如果，则，记为；
5-2  性质
(1) 对称性
与正态分布很相似，但是尾部比较肥大；当自由度增大的时候，t-分布的形状趋向于正态分布。
(2) 均值为0，方差为
6. F分布
6-1  定义
   如果且，则
检验的目的使用F分布，，有意水准，自由度m,n的分布。其中，为临界值，在表中可以查出。
6-2  性质
(1)  非对称性。随着自由度的增大，趋近于正态分布；
(3) 均值为，方差为。

第二节．统计推断 (statistical inference)
记述性统计和推断性统计
记述性统计：只是表述样本(sample)本身的结果和分析其自身特征的统计分析；
推断性统计：基于对样本的观察，推断总体情况的统计分析。
统计分析：为了发现隐含在统计数据中的规律性而进行的分析。
统计数据：
统计学的中心问题：由样本推断总体特性的统计推断，会告诉采用什么样的方法，会差生什么样的误差。这种样本与总体的关系是统计学的中心问题。
统计学的基础：确率论。连接总体和样本的是确率关系。
一统计估计的一般问题
很多情况下，不可能用总体的信息来分析一个变量的特征，比如药品的性质，产品的性质等。
1．抽样：从总体中抽取样本的过程；
随机抽样：一种抽取方式，与其他既有相同样本数的样本的抽取机会相同的抽取方式。
与其他任何样本的选取方式相比，随机抽样更能反映取样总体的特征。
抽取样本的目的推断总体的统计特征
2．统计推断：基于样本（总体的一部分或全部）的观察，对总体的性质进行推断。
推断有两个方面：估计(estimation)和检验(testing).
估计：基于样本的观察，估计能够表达总体性质的特性值，即计算参数的大小，
估计量(estimator)；
检验：基于样本的观察，判断关于总体的假设的取舍，即判断取舍原假设问题。
需要先做个检验统计量,即检验量(test statistic)

二  抽样分布(sampling distributions)
抽样分布：一个给定的样本进行无数次重复试验，将产生指定统计量的所有可能值的一个分布；抽样分布是假设检验和参数估计的基础。

三  均值的抽样分布
1．方法：
从具有同一的均值和方差的总体中抽取样本数为n的样本，可以得到一个样本的均值。重复这样的做法，会得到一系列的均值。这些均值可能不一样，可能与总体的均值也不一样。这里我们强调一下，得到的样本的均值并不一定就要正好等于总体的均值，样本的均值与总体均值的差，称为抽样误差。当这样的实验的次数增大的时候，样本的均值会越来越接近于总体的均值。
2．中心极限定理 (central limit theorem)
无论什么样的分布，只要是从具有统一的均值和方差的总体中抽取出来的足够大的样本的均值的分布，渐进地服从于正态分布。

第三节．参数估计
参数估计的目的：由样本值估计总体参数
参数估计的种类：点估计和区间估计

一点估计(point estimate): 单一的值
问题据有什么样性质的值作为点估计比较好？
      标准1。该值不随样本的变化而变化，且最好与总体的均值一致；
      标准2。估计的误差尽可能的小。
1．点估计量和点估计值
估计值(estimate)：一个具体值
估计量(estimator)：样本的函数
2．点估计量的统计性质
2-1 小样本的性质
(1)  无偏性(unbiseness)与无偏估计量(unbiased estimator)
         无偏性：估计值的期望值就是真值，即。
注意：不能保证无偏估计量产生的每一个估计值都优于有偏估计量所产生的估计值，但是因为从无偏分布中抽取的一个估计值比起那些从有偏分布中抽取的估计值更有可能靠近总体真值。
(2)  有效性
虽然都是无偏，但是有的估计量的方差很大，因此我们还需要考察效率(efficient).
有效性：对于无偏估计，如果，则我们称比有效。
(3)  最佳线性无偏性(the best linear unbiased estimator,BLUE)
如果估计量是样本观测值的一个线性函数，则是的一个线性估计量。
如果估计量是线性的，无偏的，并且它在的所有线性无偏估计量中具有最小方差，则称是的最佳线性无偏估计量。
2-2  大样本性质
(1)  渐进无偏性
渐进无偏性：当样本数无限增大的时候，估计量的期望值趋向于他的真值，即

(2)  一致性
一致性：当样本的数量趋向于无限大的时候，估计量趋近于真值，即

一个估计量是一致估计量的充分条件是
。

二区间估计(interval eatimation)
点估计的缺点：点估计依赖于抽样分布的样本容量的大小，因此它未必接近总体真值。
更多的时候，使用区间估计。例如电视节目的收视率，有多少患者对新药有不良反应等等。
方法：把相对频度作为总体的真实的比例。
缺点：相对频度与总体比例不一致的情况比较多，
1。置信区间(confidence interval)和置信限
1-1  统计量的做法
   置信水平(confidence coefficient)95%：
假设，则，标准化
在重复抽样的情况下，95%的样本均值将落在区间，其中，，总体标准差，1.96是查正态分布表的结果。
置信区间：为的95%的置信区间；
置信限：和为的95%的置信限；
置信水平：，为估计时95%的置信水平。其中，是查标准正态分布表所得。
用正态分布图说明，一般来说，置信水平越高，置信区间越大。
   1-2  正态分布表的查法
1-3  例题解析
2  均值的置信限
2-1  统计量的做法
在已知的情况下，的置信限可由和得出；实际上是未知的，这时，将用样本的标准差代替，即，其中，是t-分布，N-1是自由度，有时候用表示置信水平为，自由度为N-1的t-值。可以在t-分布表中查处。
   2-2  t-分布表的查询方法;  2-3 例题解析。

第四节．假设检验
假设检验的方法：显著性检验和置信区间法。
一．假设检验的逻辑
显著性检验是经典的假设检验的方法，具有清晰简洁的特点。
1．前提：总体参数的任何具体估计值都来自诸估计值的一个分布或者说来自估计量的抽样分布，这个估计值仅仅是许多可能的估计值中的一个。因此由这个估计值得出的结论必须将整个分布考虑在内。
举例说明：
设有一个取自均值为的总体的样本，计算出的样本均值为  ，要检验的假设是，此均值来自于均值为100 的总体。这个假设意味着和之间的差异应该仅仅是由偶然因素造成的。根据的抽样分布，可以求出上述假设的成立情况下，即被抽样的总体的均值为的情况下，随机抽取一个样本，得到样本的均值为的概率是多少。如果此概率值很小的话，则表明从均值为的总体中不大可能抽取到均值为的随机样本。在这种情况下，说显著地不同于，因此拒绝关于此来自于一个均值为100的总体的假设。或者换个说法，样本数据不能支持总体均值为的假设，因为如果成立的话，则随机地抽取到均值为的样本的可能性非常小，是小概率事件。现在既然这种小概率事件发生了，当然有理由怀疑总体均值为100这一假设的正确性。
有上面的说明不难看出，假设检验可以说就是检验是否出现了小概率事件，如果出现小概率事件，则拒绝原来关于总体参数的假设；如果检验表明得到的样本值并不属于小概率事件，则说明假设成立，得到该样本值的概率不算小，则不能拒绝原来的假设，或者接受该假设。问题是上面提到的概率究竟小到什么程度才算小。一般说来，这取决于医院承担的拒绝一个正确的假设和接受一个错误的假设这两个方面的风险，将在后面讨论这个问题。在实践中，一般习惯于取5%作为拒绝假设的临界水平，称为5%的显著水平。

2．检验的目的：
检验是否出现了小概率事件，如果出现小概率事件，则拒绝原假设；如果检验表明得到的样本值并不属于小概率事件，则我们接受原假设。
一般来说，习惯于把5%或1%作为拒绝假设的临界水平，称5%或1%为显著性水平。

二．假设(hypothesis)检验的步骤和方法
调查样本观察的结果和相应的假设是否一致。
种类：两侧检验(two-tailed test)和单侧检验(one-tailed test)
1．建立关于总体的原假设(null hypothesis)和备择假设(alternative hypothesis)
原假设和备择假设是两个互相矛盾的假设。例如：
2．计算检验统计量
假设检验的逻辑是检验由样本数据提供的结果是否为小概率事件。
那么如何对此进行判断呢？在假设检验中，做法是构造一个统计量，这个检验统计量及其抽样分布是进行检验的基础。再用样本估计值计算出原假设成立的情况下该检验统计量的值，然后根据他的抽样分布就可以得到该检验统计量的值出现的概率，即用于检验的样本估计值出现的概率，从而可根据概率值的大小进行判断。
刚才的例子中，如果知道总体的方差的话，可以用正态分布作为检验的标准，
；
如果不知道总体方差的情况下，将用样本的方差来代替总体的方差，这时需要使用t分布，。
3．检验原假设，得出关于原假设是否合理的结论
计算出检验统计量在原假设成立的情况下的值，下一步就是根据是否出现小概率事件的原则进行判别。在进行判别之前，需要确定一个标准，什么情况下拒绝原假设，什么情况下接受原假设。5%的显著性水平就是。其含义是如果上一步计算的t统计量的值出现的概率小雨5%，则拒绝原来假设；否则接受原来假设。
具体：先确定显著水平；
               其次查出临界的t-value;
               再次比较与t-value,
如果
拒绝域：                      接受域：

三．统计假设的单侧检验
四．两种类型的错误
在刚才的例子里，拒绝了原来假设，因为样本均值110看上去与原假设不一致。这是否意味着检验的样本一定不是来自于一个均值为100 的正态总体呢？遗憾的是，这样说时候，并没有100%的把握。事实上，只有95%的把握，因为显著水平选取的是，因而并不能排除总体的均值确实为100的可能性，纯粹是由于偶然的因素而取到一个均值为110的样本。如果情况果真如此，则拒绝原假设，就是拒绝了正确的原假设，这类错误称为第一类错误；与此类似，若原假设是错误的，但是我们却错误的接受了，这种错误称为第二类错误。

五．统计假设的F检验
用于检验样本来自一个总体还是两个总体，即检验同方差性。

回归模型的检验
1． t-value
1-1  计算方法以
   ，其中是参数的最小2乘估计量
   为例
(1).  计算残差的不偏估计；
(2).  计算的方差和；


(3).  计算回归系数的标准误差和；
(4).  计算t-值    =（回归系数的估计值）/（回归系数的标准误差）=

(5).  使用t-值判断回归系数和的有意性
      有两种检验方法：两侧检验(two-tailed test) 和单侧检验  (one-tailed test)
      首先介绍几个概念：
      原假说 (null hypothesis) 和对立假说 (alternative hypothesis)
      例如原假说说明变量在被说明变量的回归中没有任何作用。
            对立假说说明变量在被说明变量的回归有作用。
      一般来说，我们把希望放弃的结果放在原假说中，把想得到支持的结果放在对立假说中。

(5-1) 两侧检验  (two-tailed test)
从t分布表中找出相应的t-值，把（4）中计算出的t-值与表中查出的t-值 ( 有意水平)相比较，       放弃原假说，也就是说说明变量是有意义的；
                  放弃对立假说，也就是说说明变量是没有意义的。
当样本数超过30shi ,习惯于把和1.96作比较，
   放弃原假说；       接受原假说。

(5-2) 单侧检验  (one-tailed test)
原假说说明变量在被说明变量的回归中没有任何作用。
   对立假说说明变量在被说明变量的回归有作用，而且是正的作用。
(6).  例题解析

2． F-value
  在多重回归，可以用F值对多个回归系数同时进行检验。
2-1  计算方法
(1).  设立原假说和对立假说
   原假说说明变量在被说明变量的回归中没有任何作用。
   对立假说说明变量在被说明变量的回归有作用。
(2).  计算F值       分子：  回归的平方和/说明变量的个数
分母：  残差平方和/（样本的数量-说明变量的个数-1）
也可以用决定系数计算F值
其中，分子：决定系数和  （样本的数量-说明变量的个数-1）
      分母： 1-决定系数  和说明变量的个数。
(3).  查表
   在F分布表中，横向表示分子的自由度，纵向表示分母的自由度。
(4).  计算的F值与查表得到的F值进行比较，判断放弃原假说与否。
         放弃原假说；          接受原假说。

2-3 例题解析

3．检验是否存在结构性变化的F-value  (Chow test)
3-1 有没有结构性的变化，对经济分析来说有着重要的意义。
3-2 方法
(1)  画散点图，确定分割时间点，并把数据分成前、后两个小样本；
(2)  分别对前期，后期和全部进行最小2乘分析，并计算出各自的残差平方和SSR1,SSR2和SSR；
(3) 计算F值
情况1

   情况2

(4)  计算出来的F值与F分布表的标准进行比较，判断原假说的取舍。
3-3  例题解析

4．预测
4-1  计算方法
(1) 进行OLS回归，并计算出回归方程式的标准误差，样本个数，平均值，和偏离程度；
(2)  计算预测开始时点的预测值；

(3)  决定预测精度1- ，通常定为95%或99%；
(4)  从t分布表查出自由度为n-2的（双侧）；
(5)  计算信赖期间

4-2  预测不理想的原因
(1)  样本太小；
(2) 回归方程式的标准误差s太大；
(3)    太小；
(4) 预测始点偏离平均太大。
4-3  例题
5．练习题

使用道具举报