楼主: freerunning_sky
1294 6

[问答] 现在我有一个大的数据集 [推广有奖]

  • 0关注
  • 3粉丝

博士生

54%

还不是VIP/贵宾

-

威望
0
论坛币
718 个
通用积分
1.9496
学术水平
14 点
热心指数
19 点
信用等级
11 点
经验
7309 点
帖子
210
精华
0
在线时间
375 小时
注册时间
2011-10-26
最后登录
2020-6-28

楼主
freerunning_sky 在职认证  发表于 2012-2-24 17:09:12 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据量大概有5亿,但是连接的那个数据库经常会出点问题,全量读取经常中间会断掉。
我现在的想法是把数据集分成几块读出来

如:
data a1;
     set total(firstobs=1,obs=50000000);
run;

data a2;
    set total(firstobs=50000001,obs=100000000);
run;

。。。。。。。。。。。。。

但是读到后面的时候效率会很低,请问firstobs和obs结合的工作原理
大家有没有什么好的办法把这数据读出来?
谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 First Total FIRS Data 数据

沙发
yunqingwang 在职认证  发表于 2012-2-24 17:30:50
来学习学习,顶你一下

藤椅
freerunning_sky 在职认证  发表于 2012-2-24 20:46:20
没有人理我。。。

板凳
jinlin2009 发表于 2012-2-24 23:40:36
同问,我以前碰到类似问题,后来换了个内存条

报纸
bx2008 发表于 2012-2-25 09:49:11
这么多的数据啊

地板
sl122113 发表于 2012-2-27 15:38:58
帮顶帮顶!
Let Our Life Be Magic And Open

7
chendonghui1987 发表于 2012-3-3 20:39:59
顶楼主,我也需要

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-19 22:44