人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛 › R如何计算多选题的频次？交叉表

发帖

楼主: kiclee

21263 19

[问答] R如何计算多选题的频次？交叉表 [推广有奖]

0关注
1粉丝

等待验证会员

小学生

85%

还不是VIP/贵宾

威望: 0 级
论坛币: 0 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 538 点
帖子: 8
精华: 0
在线时间: 8 小时
注册时间: 2013-12-25
最后登录: 2014-2-19

楼主

kiclee 发表于 2013-12-25 14:54:07 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

有一个数据表如下。如何统计C3这个题目的频次或百分比？
C3_1,C3_2,C3_3,C3_4表示C3是一个多选题，且有4个选项。单元格中的0表示未选中，1表示选中。
希望得到的table格式为：(也就是C3的4个选项，被选中的频次，且和Age交叉)
  Age
C3 1  2  3
  1 59 73 54
  2 57 69 61
  3 61 81 77
  4 65 68 66

原始数据如下：

Gender	Age	Hage	C1	C2	C3_1	C3_2	C3_3	C3_4
2	2	28	4	2	1	0	0	1
1	2	28	3	7	1	1	1	0
2	2	29	1	1	0	0	1	0
2	2	21	4	1	0	1	1	1
2	1	13	4	1	0	1	1	1
1	2	24	2	3	1	0	1	0
1	3	42	5	3	0	1	1	1
2	3	30	4	4	1	1	0	1
2	2	21	5	6	0	0	0	0
2	3	39	2	5	0	0	1	1

谢谢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：多选题 Gender Table 原始数据 ABLE 百分比数据表如何统计

相关帖子

沙发

kiclee 发表于 2013-12-25 19:31:37

没人知道吗？感觉挺常用的啊

藤椅

CRouGD 发表于 2013-12-25 19:51:37

假设你的原始数据放在data的对象中。。
data1<-data[,c(2,5,6,7,8)] #提取age，c1~c4的数据框
用reshape包里面的melt函数。
data2<-melt(data1,id=('age')) #得到的data2是一个有3列的数据框
data3<-data2[which(data2[,3]==1),]
table(data3)
这里关键是melt的函数，你可以看看《R语言实战》中文版的，5.6部分。有比较详细解释。
这只是一个针对你题目的方法。。如果在工作中常用的，人们应该会自己编写一个函数去求出的。。
初学的，如果不正确的地方，请见谅。。。

已有 3 人评分	经验	学术水平	热心指数	收起理由
李会超	+ 20			热心帮助其他会员
科伟		+ 1	+ 1	精彩帖子
qoiqpwqr			+ 1	热心帮助其他会员

总评分: 经验 + 20 学术水平 + 1 热心指数 + 2 查看全部评分

板凳

yywan0913

发表于 2013-12-25 20:00:45

t=read.table("11.txt",sep="\t",header=T)
Age=t[,2]
a=unique(Age)
tt=matrix(ncol=4,nrow=length(a))
for(i in 1:length(a)){
tt[i,]=apply(t[Age==i,][6:9],2,sum)
}
colnames(tt)=colnames(t)[6:9]
rownames(tt)=a
tt

复制代码

已有 1 人评分	论坛币	热心指数	收起理由
qoiqpwqr	+ 20	+ 1	热心帮助其他会员

总评分: 论坛币 + 20 热心指数 + 1 查看全部评分

是什么给了你自信

报纸

yywan0913

发表于 2013-12-25 20:02:22

yywan0913 发表于 2013-12-25 20:00

擦傻逼了路径都写了

是什么给了你自信

地板

yywan0913

发表于 2013-12-25 20:25:47

CRouGD 发表于 2013-12-25 19:51
假设你的原始数据放在data的对象中。。
data1

melt 果然好跟merge 差不多了不过这两个函数我都用不好，唉

是什么给了你自信

7楼

qoiqpwqr 发表于 2013-12-25 20:57:39

yywan0913 发表于 2013-12-25 20:02
擦傻逼了路径都写了

你可以改自己的帖子。

8楼

yywan0913

发表于 2013-12-25 21:07:56

qoiqpwqr 发表于 2013-12-25 20:57
你可以改自己的帖子。

老给我论坛币我都不好意思了

是什么给了你自信

9楼

kiclee 发表于 2013-12-26 17:34:55

感谢yywan0913和CRouGD的分享。
对于CRouGD的方法，得到结果如下，但如果数据量大，会出2个table（一个是, , value = 0，一个是, , value = 1），不过可以用table(data3)[,,2] #取第2个table（等于1的交叉表）
, , value = 1
variable
Age C3_1 C3_2 C3_3 C3_4
  1 0 1 1 1
  2 3 2 4 2
  3 1 2 2 3

对于yywan0913的方法，得到的结果如下。感觉对于Age的顺序有问题，是否缺少一次排序？
  C3_1 C3_2 C3_3 C3_4
2 0 1 1 1
1 3 2 4 2
3 1 2 2 3

10楼

yywan0913

发表于 2013-12-26 20:21:18

kiclee 发表于 2013-12-26 17:34
感谢yywan0913和CRouGD的分享。
对于CRouGD的方法，得到结果如下，但如果数据量大，会出2个table（一个是, ...

t=read.table("11.txt",sep="\t",header=T)
Age=t[,2]
a=sort(unique(Age))
tt=matrix(ncol=4,nrow=length(a))
for(i in 1:length(a)){
tt[i,]=apply(t[Age==a[i],][6:9],2,sum)
}
colnames(tt)=colnames(t)[6:9]
rownames(tt)=a
tt

复制代码

抱歉感觉楼上方法挺好的

是什么给了你自信

返回列表

12 下一页

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[问答] R如何计算多选题的频次？交叉表 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

初级热心勋章

初级信用勋章

初级学术勋章

中级热心勋章

高级热心勋章

本版微信群

[问答] R如何计算多选题的频次？交叉表 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

初级热心勋章

初级信用勋章

初级学术勋章

中级热心勋章

高级热心勋章

本版微信群

扫码加我拉你入群