楼主: jmjun85
963 5

[数据管理求助] 看了本版所有关于分组的帖子还是没有弄清楚的问题。求各位老师指导 [推广有奖]

  • 2关注
  • 5粉丝

副教授

53%

还不是VIP/贵宾

-

威望
0
论坛币
44 个
通用积分
278.7159
学术水平
4 点
热心指数
15 点
信用等级
1 点
经验
450 点
帖子
309
精华
0
在线时间
1325 小时
注册时间
2006-11-19
最后登录
2024-6-13

15论坛币
是关于数据分组的问题。我想实现这样一个目标:
现在有count和hhi两个变量,我想对其进行分组,目的是找到这两个变量都高的以及都低的那些极端值(究竟是分两组还是三组呢?也还要大家指点),都高的和都低的总共有两个组,其中一个组里的样本赋值1,一个组里的样本赋值0,也就是不用这两个指标的具体值来计算,而是根据分组构建一个虚拟变量来分析。

求各位高人了。我的币也不多,以示感谢

最佳答案

ermutuxia 查看完整内容

照你的意思可以生成2个虚拟变量,一个是都高,一个是都低。其他作为对照组。你可以根据count和hhi生成count1 hhi1两个变量,这两个变量取值都为1 2 3 4就是用四分位数将count和hhi每个变量分为四组,1 2 3 4,count1和hhi1都取1时表示都小 都取4时表示都大。这是基本思想
关键词:Count 数据分组 虚拟变量 极端值 count 样本
沙发
ermutuxia 发表于 2014-10-23 15:05:27 |只看作者 |坛友微信交流群
照你的意思可以生成2个虚拟变量,一个是都高,一个是都低。其他作为对照组。你可以根据count和hhi生成count1 hhi1两个变量,这两个变量取值都为1 2 3 4就是用四分位数将count和hhi每个变量分为四组,1 2 3 4,count1和hhi1都取1时表示都小 都取4时表示都大。这是基本思想
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
SpencerMeng + 20 + 1 + 1 观点有启发

总评分: 论坛币 + 20  学术水平 + 1  热心指数 + 1   查看全部评分

使用道具

藤椅
jmjun85 发表于 2014-10-24 12:19:35 |只看作者 |坛友微信交流群
先分为四组分别赋值1、2、3、4,然后再生成虚拟变量,如果都等于4的则赋值1,如果都等于1的则赋值0?
这样应该可以。

使用道具

板凳
jmjun85 发表于 2014-10-24 12:36:23 |只看作者 |坛友微信交流群
sort hhi
xtile hhi1=hhi, nq(4)
sort count
xtile count1=count, nq(4)
gen dum=1 if hhi1=4 & count1=4
replace dum=0 if hhi31=1 & count1=1


请大家帮我修改修改!

使用道具

报纸
jmjun85 发表于 2014-10-24 15:26:12 |只看作者 |坛友微信交流群
谁来帮我看看啊,在线等。。。。

使用道具

地板
jmjun85 发表于 2014-10-24 16:22:49 |只看作者 |坛友微信交流群
好吧,虽然我水平较差,但还是摸索了一点出来,不知道是不是正确的,但好像满足我的要求了,供参考:
set more off
set mem 128
clear
use modellast
sort hhi_v8
xtile hhi1=hhi_v8, nq(3)
sort inssum
xtile inssum1=inssum, nq(3)
gen dum=1 if hhi1==3&inssum1==1
replace dum=0 if hhi1==1&inssum1==3
save dummy,replace

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-14 19:01