楼主: jojogaotian
2666 6

求助,关于数据替换!!!紧急 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

43%

还不是VIP/贵宾

-

威望
0
论坛币
22 个
通用积分
2.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
8330 点
帖子
98
精华
0
在线时间
173 小时
注册时间
2006-5-29
最后登录
2021-1-30

楼主
jojogaotian 发表于 2010-8-5 05:03:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求助啊

两个变量   appSNam  appCtry
                 1                JP
                 1                 JP
                1                  CN
                1                  TW
                1                 JP
                2                 CA
                2                 CA
                2                 CA
                2                 JP
               3                  TW
               3                 CN
               3                 CN
对于每个appSNam, 取频率最高的appCtry,频率低appCtry的用频率最高的替代
比如,当appSNam=1时,把红字标出的CN和TW用JP代替
         当appSNam=2,把红字标出的JP用CA代替
         当appSNam=3,把红字标出的TW用CN代替
(红字是我发帖时标出的,方便解释)
最后的结果是 :
两个变量   appSNam  appCtry
                1                JP
                 1                 JP
                1                  JP
                1                  JP
                 1               JP

                2                 CA
                2                 CA
                2                 CA
                2                 CA
               3                 CN
               3                 CN
               3                 CN

求达人解答!!感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:apps App pps PCT CTR 求助 数据

沙发
jojogaotian 发表于 2010-8-6 01:11:19
额。。顶一下
我的数据太多了 手动修改不了啊。。。。郁

藤椅
sungmoo 发表于 2010-8-6 06:49:16
同一个appSNam值中,appCtry几个值频率相同,怎么办?

板凳
sungmoo 发表于 2010-8-6 06:56:32
*假设原始数据中只有appSNam、appCtry两个变量,且对于同一个appSNam值,appCtry各值频率不同
g n=1
collapse (count)n,by(appSNam appCtry)
bys appSNam: egen s=sum(n)
bys appSNam: egen m=max(n)
keep if m==n
expandcl s,cl(appSNam) gen(t)
drop n s m t
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
nlm0402 + 3 + 3 + 3 + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

报纸
jojogaotian 发表于 2010-8-6 10:56:16
非常感谢!!!
但是我的data中还有其他的变量,比如:applnIFD appCount applnFilingDate等十几个
请不要删除其他的变量,应该怎么去做呢?
再次谢谢

地板
sungmoo 发表于 2010-8-6 11:42:13
jojogaotian 发表于 2010-8-6 10:56 我的data中还有其他的变量,比如:applnIFD appCount applnFilingDate等十几个
请不要删除其他的变量,应该怎么去做呢?
*只是把appCtry的值改了,其他变量的值都不变。
*设原始数据无缺失值,对于相同的appSNam,appCtry各值的频率不同。

bys appSNam appCtry: g n=_N
bys appSNam: egen m=max(n)
g a=appCtry if m==n
gsort appSNam -a
by appSNam: replace a=a[_n-1] if a==""
replace appCtry=a
drop n m a

7
jojogaotian 发表于 2010-8-7 03:48:03
it works!!!thank you sooooooooooo much

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-27 10:09