楼主: michelle915lmm
1984 9

[问答] 数据处理方式对回归模型影响的问题 [推广有奖]

  • 0关注
  • 0粉丝

已卖:1份资源

本科生

60%

还不是VIP/贵宾

-

威望
0
论坛币
432 个
通用积分
1.4100
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1058 点
帖子
37
精华
0
在线时间
145 小时
注册时间
2013-8-31
最后登录
2026-1-7

楼主
michelle915lmm 发表于 2015-4-10 20:58:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教高手:假设数据是100(组)*200(观测值),两种处理方式:
1)100组数据分别算出均值,然后将这些均值放入regression中。
2)将20000条数据一起放入regression中。
请问结果相同吗?原理是什么?(自己没想清楚啊~)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:回归模型 数据处理 regression regressio regress 模型 影响

沙发
shi465456609 发表于 2015-4-10 21:05:35 来自手机
初学者的理解:第二种方法较第一种更好。第一种的方法的数据处理方法可能失去了数据原始特性,并且当各组都取平均值可能导致数据过于集中,影响回归模型的构建。但是如果每一组数据异常值较多的话,第一种方法可以使数据更平滑点。

藤椅
michelle915lmm 发表于 2015-4-10 21:16:59
shi465456609 发表于 2015-4-10 21:05
初学者的理解:第二种方法较第一种更好。第一种的方法的数据处理方法可能失去了数据原始特性,并且当各组都 ...
两种方法都是科学合理的吗?

我问这个问题的原因之一是,如果每个组内的200个样本之间有相关性,比如是时间序列数据,那么整个样本就是panel了,不适合做整体层面的regression。但是我还是想粗粗的看一下regression的结果。。。
这种情况下是不是第一种更可取些?至少不会犯原则性的错误,虽然会丢失一些信息?

谢谢!

板凳
nuomin 发表于 2015-4-10 21:44:47
第一种是分层的,第二种是混合的。差别在于第二种假装不存在组间差异。这样的问题用面板模型来估计。

报纸
michelle915lmm 发表于 2015-4-11 10:56:33
nuomin 发表于 2015-4-10 21:44
第一种是分层的,第二种是混合的。差别在于第二种假装不存在组间差异。这样的问题用面板模型来估计。
好的,谢谢!

地板
michelle915lmm 发表于 2015-4-11 11:29:27
nuomin 发表于 2015-4-10 21:44
第一种是分层的,第二种是混合的。差别在于第二种假装不存在组间差异。这样的问题用面板模型来估计。
再请教一下有没有比较好的面板数据模型的参考资料呢?比较具体的那种~:)
谢谢~

7
michelle915lmm 发表于 2015-4-11 11:29:30
nuomin 发表于 2015-4-10 21:44
第一种是分层的,第二种是混合的。差别在于第二种假装不存在组间差异。这样的问题用面板模型来估计。
再请教一下有没有比较好的面板数据模型的参考资料呢?比较具体的那种~:)
谢谢~

8
michelle915lmm 发表于 2015-4-11 11:30:14
nuomin 发表于 2015-4-10 21:44
第一种是分层的,第二种是混合的。差别在于第二种假装不存在组间差异。这样的问题用面板模型来估计。
再请教一下有没有比较好的面板数据模型的参考资料呢?比较具体的那种~:)
谢谢~

9
nuomin 发表于 2015-4-11 12:25:25
伍德里奇的《横截面和面板数据的经济计量分析》,入门不错
巴尔塔基的《面板数据计量经济分析》,高阶

10
michelle915lmm 发表于 2015-4-12 20:55:53
nuomin 发表于 2015-4-11 12:25
伍德里奇的《横截面和面板数据的经济计量分析》,入门不错
巴尔塔基的《面板数据计量经济分析》,高阶
谢谢啊~对我这个初学者帮助很大!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-28 15:03