楼主: gongrengui
6696 9

[一般统计问题] 三个问题请教一,同时使用两个公开数据,微观数据和宏观数据结合,控制虚拟变量 [推广有奖]

  • 11关注
  • 1粉丝

已卖:339份资源

硕士生

67%

还不是VIP/贵宾

-

威望
0
论坛币
289 个
通用积分
87.1339
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
4924 点
帖子
51
精华
0
在线时间
287 小时
注册时间
2015-3-15
最后登录
2025-5-21

楼主
gongrengui 学生认证  发表于 2018-4-3 12:24:34 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有三个问题请教一下:

1、最近看一文章(梁同贵.人口的乡城流动对生育水平的影响[J].南方人口,2018(01):30-47.),以前也看到类似文章。按照文章说法,这篇文章同时使用了“中国家庭追踪调查(CFPS)2010”中的成人问卷数据库与国家卫生计生委组织实施的2014年全国流动人口卫生计生动态监测调查项目中的全国个人数据库。
Q1:我想请教一下,为什么能够同时,这两个数据库不能根据某一字符合并吧。如果能用的话,该怎么操作呢,stata命令如何实现。

2、前一段时间看了另外一篇文章,作者用的CGSS数据和省级宏观数据
Q2:请问这是如何实现的呢

Q3:控制虚拟变量是什么意思?比如控制省虚拟变量,是把每一个变量都加入模型中去吗?

本人自学stata,文科专业,所以对有一些问题不是很懂,请了解的朋友解惑一下,不胜感激!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:微观数据和宏观数据 两个数据库 多个公开数据库 控制虚拟变量

沙发
oublier砚 发表于 2018-5-7 21:41:50
请问《2、前一段时间看了另外一篇文章,作者用的CGSS数据和省级宏观数据》方便把这篇文章题目或者文章直接贴出来吗?

藤椅
oublier砚 发表于 2018-5-20 20:25:50
gongrengui 发表于 2018-5-7 21:46
丁述磊. 非正规就业对居民主观幸福感的影响——来自中国综合社会调查的经验分析[J]. 经济与管理研究, 201 ...
谢谢,最近也一直在找这个宏观数据和微观数据结合的方法,貌似除了交叉验证,没有其他的,自己也没想出什么来

板凳
gongrengui 学生认证  发表于 2018-5-21 20:28:57
oublier砚 发表于 2018-5-20 20:25
谢谢,最近也一直在找这个宏观数据和微观数据结合的方法,貌似除了交叉验证,没有其他的,自己也没想出什 ...
可以选出一些工具变量

报纸
大壹子 发表于 2018-5-21 21:16:25
gongrengui 发表于 2018-5-7 21:46
丁述磊. 非正规就业对居民主观幸福感的影响——来自中国综合社会调查的经验分析[J]. 经济与管理研究, 201 ...
这两篇文章没有用到省级宏观数据吧?

地板
gongrengui 学生认证  发表于 2018-5-21 21:45:37
大壹子 发表于 2018-5-21 21:16
这两篇文章没有用到省级宏观数据吧?
省级养老保险覆盖率,应该是来自统计年鉴

7
楚阿慧 发表于 2019-4-18 09:37:06
请问楼主有没有解决上述问题?最近在做CFPS数据 想与宏观数据结合 请问该如何操作

8
ytq873465 发表于 2020-10-31 10:10:48
gongrengui 发表于 2019-5-22 11:05
找到公共部分节能结合了,如GDP、养老、医疗、城市等
你好,请问可以具体讲解一下要怎么把城市结合进去的吗?最近打算写这方面的论文,不知道怎么下手

9
123gogoup 发表于 2020-12-13 10:34:04
ytq873465 发表于 2020-10-31 10:10
你好,请问可以具体讲解一下要怎么把城市结合进去的吗?最近打算写这方面的论文,不知道怎么下手
我也是  像根据省份添加数据  不知道从哪入手

10
赵安豆 发表于 2024-11-3 16:51:50
1、合并微观数据和宏观数据通常不是直接通过一个共同的ID来完成的,因为两个数据集可能没有直接的连接字段。但是,可以通过使用地理位置信息(比如省份、城市或县)作为中介变量进行匹配。在Stata中,可以使用`merge`命令,但因为两个数据集通常是不同层次的数据,通常需要先对宏观数据按地区进行汇总,然后再与微观数据合并。例如:

```stata
use "path_to_your_micro_data", clear // 加载微观数据
// 假设CFPS数据中有省份信息叫province

// 然后加载宏观数据,并按省份汇总
use "path_to_your_macro_data", clear
collapse (mean) macro_var1 macro_var2, by(province)

merge m:1 province using "path_to_your_macro_data_collapsed"
```

注意,上述操作可能需要对数据进行一些预处理和转换。

2、CGSS(中国综合社会调查)数据与省级宏观数据的结合方式类似。你需要将宏观数据按省汇总后,通过`merge`命令将其合并到微观数据上。

3、控制虚拟变量(Dummy Variable)通常是指在回归分析中用来区分不同类别的定性变量。例如,“省份”可以被转化为一组虚拟变量,每个省份一个虚拟变量,如果观察值属于某个省份,则相应的虚拟变量为1,否则为0。这样,在模型中加入这些虚拟变量,就可以控制地区效应。但是,并不是把“每一个”变量都加入模型中,而是针对需要控制的特定定性变量创建虚拟变量并加入到模型中。

在Stata中,可以使用`i.province`这样的语法来自动处理虚拟变量的创建和加入,例如:

```stata
reg outcome var1 i.province
```

这将自动为province创建一组虚拟变量,并将其包含在回归模型中。需要注意的是,在一个线性模型中通常不同时包括所有省份的虚拟变量(因为会遇到多重共线性问题),而是选择省略一个参考组,其余省份与该参考组进行比较。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-8 08:01