楼主: kanzongxuan
2368 2

[问答] 求助:如何按行对数据框进行频数统计,并生成新的数据表 [推广有奖]

  • 0关注
  • 0粉丝

大专生

6%

还不是VIP/贵宾

-

威望
0
论坛币
276 个
通用积分
2.0358
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
412 点
帖子
22
精华
0
在线时间
43 小时
注册时间
2015-6-8
最后登录
2024-11-22

楼主
kanzongxuan 发表于 2018-2-27 15:00:24 |AI写论文
20论坛币
数据格式如下,希望按行进行统计每个值出现的频数,最终生成一个二维表。

原始数据格式:
rownames

B73.AGPv3

X100462248

X100462250

146943

G

T

T

146945

A

C

C

146987

C

A

A

146994

A

A

A

146995

C

A

A


希望得到的结果:
rownames

A

T

G

C

146943

2

1

146945

1

2

146987

2

1

146994

3

146995

2

1


最佳答案

xing035400 查看完整内容

library(dplyr) library(xlsx) library(reshape2) setwd("C:\\Users\\Administrator\\Desktop") data% select(-2) %>% dcast(rownames~value,length,fill = NULL,drop=TRUE) 因为有缺失值所以分类中出现NA,你可以在数据清洗时,按自己意愿修改缺失部分。
关键词:数据表 数据框 Names name 数据格式

沙发
xing035400 在职认证  发表于 2018-2-27 15:00:25
library(dplyr)
library(xlsx)
library(reshape2)
setwd("C:\\Users\\Administrator\\Desktop")
data<- read.xlsx2("snp1.xlsx",1)
data <- data %>%
        melt(id.vars = c("rownames"))  %>%
        select(-2) %>%
        dcast(rownames~value,length,fill = NULL,drop=TRUE)

QQ截图20180228111458.png


因为有缺失值所以分类中出现NA,你可以在数据清洗时,按自己意愿修改缺失部分。

藤椅
cheetahfly 在职认证  发表于 2018-2-27 15:40:32
  1. library(tidyverse)
  2. read.table("clipboard", header = TRUE) %>%
  3.   gather(type1, type2, 2:ncol(.)) %>%
  4.   select(-2) %>%
  5.   count(rownames, type2) %>%
  6.   spread(type2, n)
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 19:23