楼主: bjpucl
11741 25

数据集观测条数几百万条,PROC SORT效率低、占用资源大,如何破? [推广有奖]

21
Tigflanker 发表于 2015-5-22 08:58:53
zhengbo8 发表于 2014-1-8 11:03
hash表,试试。
另外我问下,hash的add方法,是按照指针的方式插入的吗?

还是随意的插入到了底部?

22
zhengbo8 发表于 2015-5-22 09:51:34
最近忙,好久没研究这个了,忘了。有兴趣了,可以一起研究。
{:2_39:}主要是我这也没这样的数据用来测试,要不就只有自己写写模拟的数据了。

23
zhengbo8 发表于 2015-5-22 09:52:11
Tigflanker 发表于 2015-5-22 08:58
另外我问下,hash的add方法,是按照指针的方式插入的吗?

还是随意的插入到了底部?
最近忙,好久没研究这个了,忘了。有兴趣了,可以一起研究。
{:2_34:}主要是我这也没这样的数据用来测试,要不就只有自己写写模拟的数据了。

24
zhengbo8 发表于 2015-5-22 10:02:34
Tigflanker 发表于 2015-5-22 08:58
另外我问下,hash的add方法,是按照指针的方式插入的吗?

还是随意的插入到了底部?
Sort with SAS and BigData.ppt (637.5 KB)
A Sort of a Mess — Sorting Large Datasets on Multiple Keys.pdf (105.22 KB)

希望有一些帮助或启发。

已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
Tigflanker + 5 + 3 + 3 + 3 各种谢满地谢!!

总评分: 论坛币 + 5  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

25
learsaas 发表于 2015-5-22 10:06:01
应该很快啊,怎么要这么长时间,你把代码贴出来。看看你的排序到底是在哪里进行的。

26
zhengbo8 发表于 2015-5-22 10:12:56
Tigflanker 发表于 2015-5-22 08:58
另外我问下,hash的add方法,是按照指针的方式插入的吗?

还是随意的插入到了底部?
再贴两篇。
A Method for Sorting a Large Data Set with Limited Memory.pdf (8.44 KB)
Sorting a Large Data Set When Space is Limited.pdf (158.34 KB)
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
Tigflanker + 5 + 3 + 3 + 3 再各种谢,满地谢;我这边有进展了,贴给你

总评分: 论坛币 + 5  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-19 19:20