楼主: happyxiajie
8432 3

[问答] R语言如何做多次重复的统计分析,求教! [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

小学生

21%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
30 点
帖子
1
精华
0
在线时间
9 小时
注册时间
2014-10-6
最后登录
2014-10-26

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
   芯片实验,得到高通量的数据,大概几十万个位点,想对每个位点的数据做统计分析,如T检验、线性回归,
需要重复几十万次,并且要把运算的结果,如P-value,以数据框的形式输出,再做出筛选。请问如何解决
这个问题呢?如果需要编程,可以告诉我大概的框架吗?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:统计分析 计分析 R语言 p-value value 高通量数据 如何 统计

沙发
yzhlinscau 发表于 2014-10-6 18:55:39 |只看作者 |坛友微信交流群
量太大,建议用c或fotran编写代码,不过这个我不懂。

少量的话,可以用for等循环。
一个简单的代码,仅供参考
  1. P=0;j=1
  2. for (i in 46:55){  
  3.   fit <- lm(y ~ x, data=df, subset=Fam==i) # Fam作为循环变量,取值在46:55
  4.   f <- summary(fit)$fstatistic
  5.   p <- pf(f[1],f[2],f[3],lower.tail=F)
  6.   attributes(p) <- NULL
  7.   P[j]=p
  8.   j=j+1
  9. }
复制代码

已有 1 人评分论坛币 学术水平 热心指数 收起 理由
admin_kefu + 20 + 1 + 2 热心帮助其他会员

总评分: 论坛币 + 20  学术水平 + 1  热心指数 + 2   查看全部评分

使用道具

藤椅
weixiaoyan 学生认证  发表于 2016-12-29 11:52:07 |只看作者 |坛友微信交流群
啊我也想知道!楼主知道了吗?教一教 啊!

使用道具

#假如你做了一万个位点的实验
slopes =numeric(10000)
intercepts =numeric(10000)
P.intercepts=numeric(10000)
P.slopes=numeric(10000)

for(i in 1:10000){
lmod=1m(y ~ x,data=yourdata[id==i])
intercepts =coef(lmod)[1]
slopes = coef(lmod)[2]
P.intercepts=summary(lmod)$coef[1,4]
P.slopes=summary(lmod)$coef[2,4]
}
#查看你回归模型的斜率、截距、还有相应的p值的前十个数据,数据的顺序代表你位点的数字序号
head(intercepts,10)
head(slopes,10)
head(P.intercepts,10)
head(P.slopes,10)
#选取截距的p值小于0.05的数据
P.intercepts[P.intercepts<=0.05]
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
admin_kefu + 20 + 2 + 2 热心帮助其他会员

总评分: 论坛币 + 20  学术水平 + 2  热心指数 + 2   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 02:26