楼主: asdfgghhj
686 4

[数据管理求助] stata按照相关系数筛选变量 [推广有奖]

  • 0关注
  • 0粉丝

初中生

52%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.0101
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
156 点
帖子
4
精华
0
在线时间
30 小时
注册时间
2021-1-14
最后登录
2024-3-22

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教各位,如果我想要筛选出与被解释变量相关程度大的变量,drop掉相关性较小的变量(比如当相关系数小于0.4的时候就drop掉),该怎么处理?因为变量有几百个,一个个删会很费时间,所以想搞个循环,可是系统一直报错。数据如下(假设ALogP是被解释变量,然后需要检验ALogp2 AMR apol分别与ALogP的相关程度,当相关系数小于0.4的时候就drop掉该变量):

  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double(ALogP ALogp2 AMR apol)
  4.            1.0862       1.17983044            92.55 49.0674809999999
  5. 1.08299999999999 1.17288899999999          97.1126 52.1610669999999
  6. 2.67199999999999 7.13958399999999         114.8536 54.4186879999999
  7.             1.465         2.146225          86.7767 44.0203089999999
  8. .463799999999999 .215110439999999          93.2047 42.4131369999999
  9. .847499999999999 .718256249999999          87.8537         39.41793
  10. 2.50049999999999 6.25250024999999         121.8996 55.7386879999999
  11.            2.4546       6.02506116         117.8451 54.4118949999999
  12. -.766199999999999 .587062439999999          96.9884 48.4511019999999
  13. .778899999999999 .606685209999999         106.8961 48.8639299999999
  14. 2.53699999999999 6.43636899999999         132.8015 68.2274109999999
  15.            1.3586       1.84579396 106.239399999999 50.7211019999999
  16. 2.04779999999999 4.19348483999999         114.3654 53.3554809999999
  17. .380499999999999 .144780249999999          78.1812 39.0719299999999
  18.            1.9875       3.95015625          92.8791 52.8070319999999
  19. 2.76459999999999 7.64301315999997         135.9738 77.0817549999999
  20.            2.7804       7.73062416          93.8526 44.2693089999999
  21.            2.7804       7.73062416          93.8526 44.2693089999999
  22. 3.15389999999999      10.34136964         105.7986 50.5662739999999
  23.             .8807        .77563249 90.7594999999999 43.8611019999999
  24. end
复制代码



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 相关系数 tata generated generate

沙发
qianchen 发表于 2022-1-24 10:46:21 |只看作者 |坛友微信交流群
sysuse auto,clear



foreach v of varlist mpg rep78 length {
        corr price `v'
         if abs(r(rho)) <0.4 {
                 drop `v'
         }
}
参照这个 此处假设price为因变量

使用道具

藤椅
黃河泉 在职认证  发表于 2022-1-24 15:17:33 |只看作者 |坛友微信交流群
若你是要做研究 (而不是练习 Stata),这应该不是一个一般人会做的事。

使用道具

板凳
asdfgghhj 发表于 2022-1-25 21:34:37 |只看作者 |坛友微信交流群
qianchen 发表于 2022-1-24 10:46
sysuse auto,clear
谢谢您,问题解决了

使用道具

报纸
asdfgghhj 发表于 2022-1-25 21:38:09 |只看作者 |坛友微信交流群
黃河泉 发表于 2022-1-24 15:17
若你是要做研究 (而不是练习 Stata),这应该不是一个一般人会做的事。
谢谢您的回复!有一道作业题需要这样子处理数据,因为最近也在学习stata,所以就想试试用stata可不可以处理

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 19:08