楼主: kgyl2030
1283 1

[问答] 求助R里的批量抽取和批量合并 [推广有奖]

  • 0关注
  • 0粉丝

小学生

7%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
23 点
帖子
2
精华
0
在线时间
6 小时
注册时间
2018-10-25
最后登录
2018-12-15

10论坛币
我在做一个数据模拟,需要用到抽样和合并,因为数据量大用循环来进行合并太慢了,我的数据运行了一个多星期也不行。请教各位大神,有没有能批量进行合并的方法。
原始数据是100行770000列的,我截取了10行100列。在附件中
数据10行表示10个观察,100列是因子,每10个因子作为一个block,分别可以称为block1、block2.....block10,
我现在需要从这些数据里抽取block组成新的模拟观察值,每个新的观察的第一个block是从10个观察的block1里随机抽取一个,第二个block也是从10个观察的block2里抽取,依次共抽取10个组成一个模拟观察值。
我自己用for循环写的,小的数据还行,但大数据就不行了,可以是因为我里边用了大量的基本的cbind和rbind命令。

想请教大神,有没有方法可以直接一次性的抽取和合并的命令?可以提高效率?

附件内容如下:
C C A A A A A A A A G G A A C C C C A A G G G G G G G G C C A A G G A A A A A A A A G G A A A A A A A A A A A A G G G A G G G A A G G A G A A A G G G G G G G G G G C C G G G G G G G G G G G G G G G G C
C C A A A A A A A A G G A A C C C C C C G G G G A A A A A C G A A G A A A A G G G A A G A A C A A A G A A A A A G G A A G G A A G G A A A A A A G G G G G G G G G G A C A G A G A G A G A G G G G G A G C
C C A A A A A A A A A G A A C C C C A A G G G G G G G G C C A A G G A A A A A A A A G G A A A A A A A A A A A A G G G G G G G G A A G G G G A A G G G G G G G G G G C C G G G G G G G G G G G G G G G G C
C C 0 0 A A A A A A G G A A C C C C A A G G G G G G G G C C A A G G A A A A A A A A G G A A A A A A A A A A A A G G G G G G G G A A G G G G A A G G G G G G G G G G C C G G G G G G G G G G G G G G G G C
C C A A A A A A A A G G A A C C C C C C G G G G A A A A A A G G A A A A A A G G G G A A A A A A A A G G A A A A G G A A G G A A G G A A A A A A G G G G G G G G G G C C G G G G G G G G G G G G G G G G C
C C 0 0 0 0 A A A A A G A A C C C C A A G G G G G G G G C C A A G G A A A A A A A A G G A A A A A A A A A A A A G G G A G G G A A G G A G A A A G G G G G G G G G G C C G G G G G G G G G G G G G G G G C
C C A A A A A A G A A G 0 0 C C A C A C G G G G A A A A A C G A A G A A A A G G A A G G G A C C G A A A G A C A A G A A A G G A A G A A A A G A A G G G G G G G G G A C A G A A A A A A A G A G G G A G C
C C G A A A G A G A A G A A C C C C A C G G G G G A G A A C G A A G A A A A A G G A A G A A A A A A G A A A A A G G A A G G A A G G A A A A A A G G G G G G G G G G C C G G G G G G G G G G G G G G G G C
C C G A 0 0 A A A A A G A A C C C C A C G G G G G A G A A C G A A G A A A A A G G A A G A A A A A A G A A A A A G G G A G G G A A G G A G A A A G G G G G G G G G G C C G G G G G G G G G G G G G G G G C
C C A A A A A A A A A G A A C C C C C C G G G G G A G A C C A A G G A A A A A G A A G G A A C A A A A A A A A A G G G A G G G A A G G A G A A A G G G G G G G G G G A C A G A G A G A G A G G G G G A G C

test.txt

1.98 KB

关键词:原始数据 提高效率 随机抽取 数据模拟 观察值
把你的类似的所有文件放到一个文件夹里如xx
cat ./xx/* > ./1.t

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 14:58