楼主: heyrein113
2043 1

[数据管理求助] 怎样按变量值出现的累计频率生成新变量? [推广有奖]

  • 0关注
  • 0粉丝

小学生

0%

还不是VIP/贵宾

-

威望
0
论坛币
22 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
39 点
帖子
3
精华
0
在线时间
4 小时
注册时间
2015-4-16
最后登录
2015-12-16

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现在手头有一个数据集,经过简单观察发现部分变量极端值比较多,所以有个想法是先按变量值大小排序,然后把最小和最大的那部分去掉(比如头尾各掐掉2.5%),再用剩下的数据进行回归。
比如x变量异常值较多,我先生成一个可以表示其变量值累计频率的指示变量f_x,然后
reg y x if f_x<=.025 | f_x>=.975

但是不知这个过程如何实现,恳请论坛的各位大大指点一二,小弟谢过!

update:
通过查询contract命令的用法,这个问题已经基本解决:
  1. contract roa, cpercent(cp_roa)
  2. save cp_roa, replace
  3. use mix.dta, clear
  4. merge m:1 roa using cp_roa.dta
  5. drop _*
复制代码
不过感觉这样做太麻烦了。。有没有更简单的方法可以做到呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:变量值 新变量 contract replace percent contract update 最大的 如何

沙发
夏目贵志 发表于 2015-8-6 01:06:00 |只看作者 |坛友微信交流群
help pctile

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 18:20