楼主: kiclee
21093 19

[问答] R如何计算多选题的频次?交叉表 [推广有奖]

  • 0关注
  • 1粉丝

等待验证会员

小学生

85%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
538 点
帖子
8
精华
0
在线时间
8 小时
注册时间
2013-12-25
最后登录
2014-2-19

楼主
kiclee 发表于 2013-12-25 14:54:07 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有一个数据表如下。如何统计C3这个题目的频次或百分比?
C3_1,C3_2,C3_3,C3_4表示C3是一个多选题,且有4个选项。单元格中的0表示未选中,1表示选中。
希望得到的table格式为:(也就是C3的4个选项,被选中的频次,且和Age交叉)
  Age
C3   1  2  3
  1 59 73 54
  2 57 69 61
  3 61 81 77
  4 65 68 66


原始数据如下:
GenderAgeHageC1C2C3_1C3_2C3_3C3_4

2

2

28

4

2

1

0

0

1

1

2

28

3

7

1

1

1

0

2

2

29

1

1

0

0

1

0

2

2

21

4

1

0

1

1

1

2

1

13

4

1

0

1

1

1

1

2

24

2

3

1

0

1

0

1

3

42

5

3

0

1

1

1

2

3

30

4

4

1

1

0

1

2

2

21

5

6

0

0

0

0

2

3

39

2

5

0

0

1

1



谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:多选题 Gender Table 原始数据 ABLE 百分比 数据表 如何 统计

沙发
kiclee 发表于 2013-12-25 19:31:37
没人知道吗?感觉挺常用的啊

藤椅
CRouGD 发表于 2013-12-25 19:51:37
假设你的原始数据放在data的对象中。。
data1<-data[,c(2,5,6,7,8)]  #提取age,c1~c4的数据框
用reshape包里面的melt函数。
data2<-melt(data1,id=('age'))   #得到的data2是一个有3列的数据框
data3<-data2[which(data2[,3]==1),]
table(data3)
这里关键是melt的函数,你可以看看《R语言实战》中文版的,5.6部分。有比较详细解释。
这只是一个针对你题目的方法。。如果在工作中常用的,人们应该会自己编写一个函数去求出的。。
初学的,如果不正确的地方,请见谅。。。
已有 3 人评分经验 学术水平 热心指数 收起 理由
李会超 + 20 热心帮助其他会员
科伟 + 1 + 1 精彩帖子
qoiqpwqr + 1 热心帮助其他会员

总评分: 经验 + 20  学术水平 + 1  热心指数 + 2   查看全部评分

板凳
yywan0913 在职认证  发表于 2013-12-25 20:00:45
  1. t=read.table("11.txt",sep="\t",header=T)
  2. Age=t[,2]
  3. a=unique(Age)
  4. tt=matrix(ncol=4,nrow=length(a))
  5. for(i in 1:length(a)){
  6. tt[i,]=apply(t[Age==i,][6:9],2,sum)
  7. }
  8. colnames(tt)=colnames(t)[6:9]
  9. rownames(tt)=a
  10. tt
复制代码
已有 1 人评分论坛币 热心指数 收起 理由
qoiqpwqr + 20 + 1 热心帮助其他会员

总评分: 论坛币 + 20  热心指数 + 1   查看全部评分

是什么给了你自信

报纸
yywan0913 在职认证  发表于 2013-12-25 20:02:22
yywan0913 发表于 2013-12-25 20:00
擦      傻逼了   路径都写了   
是什么给了你自信

地板
yywan0913 在职认证  发表于 2013-12-25 20:25:47
CRouGD 发表于 2013-12-25 19:51
假设你的原始数据放在data的对象中。。
data1
melt 果然好    跟merge 差不多了    不过这两个函数我都用不好,唉
是什么给了你自信

7
qoiqpwqr 发表于 2013-12-25 20:57:39
yywan0913 发表于 2013-12-25 20:02
擦      傻逼了   路径都写了
你可以改自己的帖子。

8
yywan0913 在职认证  发表于 2013-12-25 21:07:56
qoiqpwqr 发表于 2013-12-25 20:57
你可以改自己的帖子。
老给我论坛币   我都不好意思了
是什么给了你自信

9
kiclee 发表于 2013-12-26 17:34:55
感谢yywan0913和CRouGD的分享。
对于CRouGD的方法,得到结果如下,但如果数据量大,会出2个table(一个是, , value = 0,一个是, , value = 1),不过可以用table(data3)[,,2] #取第2个table(等于1的交叉表)
, , value = 1
   variable
Age C3_1 C3_2 C3_3 C3_4
  1    0    1    1    1
  2    3    2    4    2
  3    1    2    2    3

对于yywan0913的方法,得到的结果如下。感觉对于Age的顺序有问题,是否缺少一次排序?
  C3_1 C3_2 C3_3 C3_4
2    0    1    1    1
1    3    2    4    2
3    1    2    2    3

10
yywan0913 在职认证  发表于 2013-12-26 20:21:18
kiclee 发表于 2013-12-26 17:34
感谢yywan0913和CRouGD的分享。
对于CRouGD的方法,得到结果如下,但如果数据量大,会出2个table(一个是, ...
  1. t=read.table("11.txt",sep="\t",header=T)

  2. Age=t[,2]

  3. a=sort(unique(Age))
  4. tt=matrix(ncol=4,nrow=length(a))

  5. for(i in 1:length(a)){

  6. tt[i,]=apply(t[Age==a[i],][6:9],2,sum)

  7. }

  8. colnames(tt)=colnames(t)[6:9]

  9. rownames(tt)=a

  10. tt
复制代码
抱歉    感觉楼上方法挺好的
是什么给了你自信

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 12:37