[编程问题求助] STATA如何筛选家庭最高收入者以及计算数据集内各区县互联网使用率 [推广有奖]

0关注
0粉丝

已卖：1份资源

大专生

78%

还不是VIP/贵宾

威望: 0 级
论坛币: 18 个
通用积分: 0.0600
学术水平: 2 点
热心指数: 2 点
信用等级: 2 点
经验: 89 点
帖子: 6
精华: 0
在线时间: 117 小时
注册时间: 2020-4-24
最后登录: 2023-5-7

楼主

稳如泰山老司机 发表于 2022-6-25 20:42:04 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

如题，有两个问题：
第一是如何根据家庭编码pid以及个人收入pincome筛选每个家庭收入最高的人；
第二是如何根据数据集自带区县编码以及是否使用互联网01变量来计算数据集内各个区县的互联网使用率。
实现原理我大概知道，但是不知道指令是什么，在此求助各位大佬。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：Stata tata 高收入者使用率收入者

相关帖子

沙发

Jacobyou 发表于 2022-6-26 09:37:54

第一个问题：
如果你要筛选每个家庭收入最高的人的话，那么可以试着用bysort这个指令
比如：bysort pid:egen max_wage=max(pincome)，意思是在每一个不同的pid中，生成该pid中的最大个人收入，相当于一种条件。类似概率论中的(Y|X)，这里pid就是那个条件。

第二个问题：
我不知道你怎么界定互联网使用率，按我所知虚拟变量是没法界定这个的，这是两回事，虚拟变量为1说明该区/县内有互联网的使用，为0说明没有互联网的使用，而看不出具体的使用率。