楼主: andruw
2104 4

[学习心得] Stata tips & tricks 002: dummy for dummies [推广有奖]

  • 5关注
  • 27粉丝

已卖:807份资源

副教授

79%

还不是VIP/贵宾

-

威望
0
论坛币
6495 个
通用积分
2504.0561
学术水平
245 点
热心指数
263 点
信用等级
155 点
经验
18620 点
帖子
436
精华
0
在线时间
1396 小时
注册时间
2008-6-13
最后登录
2024-11-24

楼主
andruw 在职认证  发表于 2015-10-6 18:12:22 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

(本文为andruw原创,转载请注明出处)

很多时候,我们需要基于现有数据创建虚拟变量(dummy variable)或分类变量(categorical variable)。比如,我们拿到如下样本,需要按国家建立虚拟变量。

  1.      +------------------+
  2.      |   country   year |
  3.      |------------------|
  4.   1. |     China   2013 |
  5.   2. |     China   2014 |
  6.   3. |     Japan   2013 |
  7.   4. |     Japan   2014 |
  8.   5. |     Korea   2013 |
  9.      |------------------|
  10.   6. |     Korea   2014 |
  11.   7. |   Germany   2013 |
  12.   8. |   Germany   2014 |
  13.   9. |        UK   2013 |
  14. 10. |        UK   2014 |
  15.      |------------------|
  16. 11. | Singapore   2013 |
  17. 12. | Singapore   2014 |
  18.      +------------------+
复制代码

生成该数据的代码:

  1. clear

  2. input str20 country year
  3. China 2013
  4. China 2014
  5. Japan 2013
  6. Japan 2014
  7. Korea 2013
  8. Korea 2014
  9. Germany 2013
  10. Germany 2014
  11. UK 2013
  12. UK 2014
  13. Singapore 2013
  14. Singapore 2014
  15. end
复制代码

创建虚拟变量比较常见的有三种方法:

1.      使用generate命令

  1. gen dummy_1 = (country == "China")
  2. gen dummy_2 = (country == "Japan")
  3. gen dummy_3 = (country == "Korea")
  4. gen dummy_4 = (country == "Germany")
  5. gen dummy_5 = (country == "UK")
  6. gen dummy_6 = (country == "Singapore")
复制代码

2.      使用tabulate命令

  1. tabulate country, gen(dummy)
复制代码

3.      使用xi(factor variable,即因子变量)

  1. xi i.country
复制代码

创建分类变量比较常见的方法有:

1.      使用egen函数group

  1. egen category = group(country)
复制代码

2.      使用encode(同时还会生成数值标签)

  1. encode country, gen(category_country)
复制代码



Stata tips & tricks帖子列表:

000. “吐槽”Stata

001. Reshape! Reshape!



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Dummies Dummie Tricks Dummy Trick tricks country China 国家 2014

已有 2 人评分经验 论坛币 学术水平 收起 理由
夏目贵志 + 50 + 50 + 5 精彩帖子
dxystata + 50 + 50 + 1 精彩帖子

总评分: 经验 + 100  论坛币 + 100  学术水平 + 6   查看全部评分

沙发
auirzxp 学生认证  发表于 2015-10-6 18:15:36
提示: 作者被禁止或删除 内容自动屏蔽

藤椅
ziye304 发表于 2015-10-6 20:18:31

板凳
夏目贵志 发表于 2015-10-10 10:20:01
很巧。今天有个同事问了一个关于effect coding的问题。我才第一次知道原来使用dummy还不是唯一的方法。作为对楼主的补充。请读者们参考一下http://www.ats.ucla.edu/stat/mult_pkg/faq/general/effect.htm
两种方法各有优势。但是本质上是一样的。按需选用就好。

报纸
andruw 在职认证  发表于 2015-10-10 14:16:03
夏目贵志 发表于 2015-10-10 10:20
很巧。今天有个同事问了一个关于effect coding的问题。我才第一次知道原来使用dummy还不是唯一的方法。作为 ...
恩,要针对具体问题选择最有效的方法。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-2 08:40