大家好,我最近在用Affymetrix芯片数据做实验,我拿到的数据是33个样本,54675行(探针),但是匹配基因名后,发现不重复基因只有22486个,将近一半,所以需要将对应一个基因的多个探针的表达值取平均,也就是需要在做差异基因筛选前就做,那么问题出现了,如果对预处理后的数据eset直接先匹配基因名,然后依据基因名做探针匹配得到矩阵X,那后面用limma包做差异筛选时,它第一步要求线性拟合fit <- lmFit(object, design) ,此处的object就不是eset而是X,但X不符合这一步要求的数据格式,所以问问大家有没有知道如何解决这个探针折叠问题的?


雷达卡


京公网安备 11010802022788号







