〖执念30+〗计量与统计模块经典30+10问答
执念答疑一年,
只为奉献,
最好的干货!
经管之家(原人大经济论坛)自2015年成立答疑团队以来,广邀学科专家,倾力竭诚为每一位坛友提供经济学、管理学、金融学、计量经济学与统计、数据分析与挖掘、财务会计、国际贸易等领域的专业答疑解惑,高效互动,让知识更美地流动!
年末,团队为广大坛友带来我们的答疑成果,本章为第一模块:计量与统计模块。并在本帖最后给出整理的电子版下载入口。
其中包括四类内容:计量与统计版块十大热点问答贴、横截面数据类问题、纵向数据(时间序列、面板数据)问题、其他类问题。
一、计量与统计版块十大热点问答贴
本节根据查看数和评论数为主要评价指标,筛选出2015年度,计量与统计版块十大热点问答帖,其中涉及的问题都引起的坛友们热情的回复与解答,有想知道的童鞋们赶紧也来一起进补一下“学术鸡汤”吧~
示范问题:请大神看一下这个残差序列散点图是否存在异方差
查看数:1423评论数:18
链接:https://bbs.pinggu.org/forum.php?mod=viewthread&tid=3559093
编辑老师crystal8832解答:用散点图的方法只能对一些较为明显的异方差形式有所帮助。图示法是检验异方差效率很低的方法,只能为你判断异方差做一个主观上的判断,不能用来做决策,如果想用判断是否存在异方差,需要用Glesjer检验或者GQ检验或者White检验,这个才是判断异方差应该做的。
二、横截面数据类
横截面数据是在同一时间,不同统计单位相同统计指标组成的数据列。横截面数据不要求统计对象及其范围相同,但要求统计的时间相同。
本节将从模型检验出发,探讨模型初级检验(T、F检验)、二级检验(异方差、自相关、多重共线性)。
示范问题:差分,取对数为了啥?
取对数就是进行平滑,不改变趋势;差分就是看增长了多少,经济含义是增量;但是一般的处理是先取对数后取差分,这样的经济含义是增长率,默认时间序列是关于时间T连续的。
平时在一些数据处理中,经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有:
缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数字。
取对数后,可以将乘法计算转换称加法计算。
某些情况下,在数据的整个值域中的在不同区间的差异带来的影响不同。也就是说,对数值小的部分差异的敏感程度比数值大的部分的差异敏感程度更高。这
取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度,数据更加平稳,也消弱了模型的共线性、异方差性等。
在经济学中,常取自然对数再做回归,这时回归方程为 lnY=a lnX+b ,两边同时对X求导,1/Y*(DY/DX)=a*1/X, b=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X) 这正好是弹性的定义。
三、纵向数据(时间序列、面板数据)
时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。它一般采用曲线拟合和参数估计方法(如非线性最小二乘法)进行。
面板数据,即Panel Data,也叫“平行数据”,是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。
本节从时间序列数据与面板数据分析两个方面入手,从数据检验(平稳性检验、模型滞后期、协整检验、格兰杰检验)、数据模型(VAR模型、VEC模型、脉冲响应函数等)、平衡与非平衡面板比较出发探究。
示范问题:最重要最基础的!什么是面板数据?
面板数据,即Panel Data,是截面数据与时间序列数据综合起来的一种数据类型。其有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板,所以把panel data译作“面板数据”。
但是,如果从其内在含义上讲,把panel data译为“时间序列—截面数据” 更能揭示这类数据的本质上的特点。也有译作“平行数据”或“TS-CS数据(Time Series - Cross Section)”。
如:城市名:北京、上海、重庆、天津的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。
如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。
如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为:
北京市分别为8、9、10、11、12;
上海市分别为9、10、11、12、13;
天津市分别为5、6、7、8、9;
重庆市分别为7、8、9、10、11(单位亿元)。
四、其 他
本节从三个话题展开讨论:探究多元分析中因子分析与主成分分析的区别、探究变量中中介变量与调节变量的区别;探究联立方程组的适用场景。
示范问题:变量的种类中,中介变量VS调节变量
调节变量的定义:如果变量Y与变量X的关系是变量M 的函数,称M 为调节变量。
中介变量的定义:考虑自变量X 对因变量Y的影响,如果X 通过影响变量M 来影响Y,则称M 为中介变量。
如果一个变量与自变量或因变量相关不大,它不可能成为中介变量,但有可能成为调节变量。理想的调节变量是与自变量和因变量的相关都不大。有的变量,如性别、年龄等,由于不受自变量的影响,自然不能成为中介变量,但许多时候都可以考虑为调节变量。
〖执念30+〗计量与统计模块30+10经典问答电子书下载链接:
〖执念30 〗计量与统计模块30 10经典问答.pdf (725.02 KB)
——————————————本广告位由“论坛答疑”赞助———————————
“论坛答疑”账号,专治各种学术不懂。
〖答疑风暴 · 专治不懂〗“论坛答疑”客服专号成立,速找答案!
https://bbs.pinggu.org/thread-3679732-1-1.html
—————————————本广告位由“经管答疑”公众号赞助————————————
只要你有手机,一切学术问题尽在掌握之中!