楼主: jq279
8647 7

[问答] r中截取subset的问题, 谢!! [推广有奖]

  • 0关注
  • 0粉丝

准贵宾(季)

大专生

11%

还不是VIP/贵宾

-

威望
0
论坛币
2856 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
402 点
帖子
41
精华
0
在线时间
39 小时
注册时间
2008-1-15
最后登录
2019-4-26

楼主
jq279 发表于 2012-9-5 04:59:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在r中用subset找出一个data.frame 的subset后,看到如下频度统计表,
为什么那些频度为0的还在呢?df的维度已经改变了吧?


summary(df1.lowrisk$Ticker)
    DBR    FRTR  NETHER  EURHYP     BGB     OBL   PBBGR    BTNS    RAGB     BHH    LBBW  WLBANK    AARB   BYLAN  DEXGRP     HVB    RFGB     DPB     BKO
     33      17      17      16      14      11      11       9       9       7       7       7       6       6       6       6       6       5       4
     DB     DHY      GE  HESLAN  MUNHYP   DGHYP   DKRED    HSHN     NAB   NDASS  SHBASS    HSBC  INGDIB      PG  RABOBK  RDSALN    ROSW   STLNO   TOTAL
      4       4       4       4       4       3       3       3       3       3       3       2       2       2       2       2       2       2       2
WESTLB   ALVGR     ANZ   BZLNZ   CADES   CBAAU     COE  COREAL    EFSF     EIB      EU     KFW   LBANK     LGB     MRK     NDB  NOVNVX   POHBK  RENTEN
      2       1       1       1       1       1       1       1       1       1       1       1       1       1       1       1       1       1       1
WESTIB     WMT    WSTP   AALLN   ABBEY   ABESM   ABIBB  ABNANV   ACAFP  AEMSPA  AMXLMM  ASSGEN   ATLIM    BACR   BASGR  BATSLN  BAYNGR    BFCM     BMW
      1       1       1       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
    BNP  BPCEGP    BPLN    BTPS       C    CAFP   CARLB    CCCI   CEIFP   CEZCP    CMZB      CS   DAIGR  DANBNK   DNBNO     DPW      DT   EADFP     EDF
      0       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
ELEPOR    ENBW  ENELIM    ENFP (Other)
      0       0       0       0       0

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Subset subs Set SUB UBS 统计表

沙发
qoiqpwqr 发表于 2012-9-5 13:33:33
你这让大伙怎么帮你呢?

藤椅
zhangyangsmith 发表于 2012-9-9 05:49:49
I guess that's due to the variable Ticker is a factor. Use class(df1.lowrisk$Ticker) to confirm this. If so, check the possible choices you have for the factor using levels(df1.lowrisk$Ticker). The results should be the same if you call levels to the original data.frame, i.e. more than what you actually have in df1.lowrisk.

板凳
jq279 发表于 2012-9-11 01:57:46
To zhangyangsmith,
Yes, you are right. Is it possible to reduce the factors for the subset?
Thanks,

报纸
zhangyangsmith 发表于 2012-9-11 04:59:04
Not in this case. I would suggest to use character instead. Add
  1. options(stringsAsFactors = FALSE)
复制代码
before set up your data.frame. After you subset the dataset you keep the Ticker variable as character. Calling summary() afterwards will implicitly transform the character into factor before calculating the frequency.
已有 1 人评分热心指数 收起 理由
qoiqpwqr + 1 热心帮助其他会员

总评分: 热心指数 + 1   查看全部评分

地板
jq279 发表于 2012-9-18 23:11:31
Thanks  a lot!!!

7
stephen7 发表于 2012-11-27 02:43:33
在subset()外面套一个droplevels()就可以了

8
sun999bd 发表于 2012-11-28 17:33:39
nice!!!!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 22:03