楼主: xsszuel
4723 4

[数据软件处理] did异质性连续变量如何分组呢?均值还是中位数呢? [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

小学生

28%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
45 点
帖子
8
精华
0
在线时间
3 小时
注册时间
2023-9-21
最后登录
2024-1-26

楼主
xsszuel 发表于 2023-11-17 04:11:50 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1.依据年份中位数/均值划分 by year <br>
2.总样本的中位数/均值<br>
3.政策实施的前一年的中位数/样本均值,这样比较常见,但是如何写stata代码呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:连续变量 中位数 DID 异质性 Stata

沙发
sun_man 在职认证  发表于 2023-11-17 15:10:52
要按年份分组并计算中位数和均值,可以使用 Stata 中的 `egen` 命令和 `by` 前缀。
```stata
* 按年份分组并计算中位数和均值
egen median_var = median(variable), by(year)
egen mean_var = mean(variable), by(year)
在上述代码中,将 `variable` 替换为您要计算中位数和均值的变量名称,将 `year` 替换为表示年份的变量名称。这将创建两个新的变量 `median_var` 和 `mean_var`,分别包含按年份分组计算的中位数和均值。
对于 DID(Difference-in-Differences)设计中的异质性连续变量,选择使用中位数或均值进行分组,具体取决于您的研究问题和数据分布。中位数更适合处理偏斜较大的数据,而均值更适合处理对称分布的数据。
要在 Stata 中进行 DID 分析使用 `regress` 命令,并在模型中包含交互项来捕捉处理组和对照组之间的差异。
```stata
* DID 分析
regress outcome treated treated_after treated#treated_after control_vars
在上述代码中,将 `outcome` 替换为您的因变量名称,`treated` 替换为表示处理组的二进制变量名称,`treated_after` 替换为表示政策实施后的时间变量名称,`control_vars` 替换为其他控制变量的名称。交互项 `treated#treated_after` 捕捉了处理组和政策实施后的时间之间的交互效应。

藤椅
xsszuel 发表于 2023-11-18 11:00:26 来自手机
sun_man 发表于 2023-11-17 15:10
要按年份分组并计算中位数和均值,可以使用 Stata 中的 `egen` 命令和 `by` 前缀。
```stata
* 按年份分 ...
谢谢你呀!但是如果根据政策实施前一年的某连续变量的中位数分组,这样该如何写代码呢?不是所有年份的中位数分组。

板凳
wtst 学生认证  发表于 2023-11-24 14:57:14
xsszuel 发表于 2023-11-18 11:00
谢谢你呀!但是如果根据政策实施前一年的某连续变量的中位数分组,这样该如何写代码呢?不是所有年份的中 ...
我有一个想法,请看看是否合适:
1. 只保留 政策前一年 的数据
2. 分组:按指定标准分高低
3. 合并:将第2步分完组的重新合并至原数据集

报纸
xsszuel 发表于 2023-12-1 13:10:57 来自手机
wtst 发表于 2023-11-24 14:57
我有一个想法,请看看是否合适:
1. 只保留 政策前一年 的数据
2. 分组:按指定标准分高低
谢谢!是这样做的

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-7 23:56