楼主: fixedincome
9870 23

[讨论]SAS处理大容量数据还是太慢 [推广有奖]

  • 0关注
  • 4粉丝

已卖:432份资源

硕士生

48%

还不是VIP/贵宾

-

威望
0
论坛币
942 个
通用积分
6.7057
学术水平
7 点
热心指数
8 点
信用等级
8 点
经验
1197 点
帖子
113
精华
0
在线时间
161 小时
注册时间
2006-5-1
最后登录
2015-9-8

楼主
fixedincome 发表于 2009-5-4 17:09:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

在普通的PC机上,用SAS处理大容量数据,速度还是太慢。比如处理A股市场的分笔交易数据(1999~2007),大概300多G,有时算几个指标需要几天,太痛苦了。

不知道有没有好的解决方法。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:A股市场 交易数据 解决方法 不知道 有没有 数据 讨论 SAS 容量

回帖推荐

fixedincome 发表于9楼  查看完整内容

如果只是用ORACLE管理数据,数据处理仍然用SAS(通过ODBC来使用),速度仍然难以提高。WIND金融工程数据库就是用ORACLE管理的,没觉得快多少。SAS主要作为统计计量软件使用,兼有数据库管理系统功能,这既是它的优点——方便,但也是它的缺点——数据库管理功能弱于专门软件。请教了一些高手,目前处理高频数据最快可能是KDB,但问题它做统计或计量远没有SAS方便,除非自己是统计计量&编程高手,能够胜任复杂的计量编程工作。

本帖被以下文库推荐

沙发
librooks 发表于 2009-5-4 17:26:00
等着更加强劲的CPU出来吧,呵呵

藤椅
nkwilling 发表于 2009-5-4 19:25:00
300G,差不多有几千万条记录了,如果只有几个字段的话,所以一般的PC机无法处理很正常.

板凳
fixedincome 发表于 2009-5-4 19:37:00

这300多G的分笔交易数据并不仅仅是一个文件,而是进行了分割,某个交易所某个月(甚至是半个月)的全部公司的数据归集为一个文件,即使如此,在2007年,沪市半个月的数据也会超过4G。我在处理数据时,是以这种小文件为处理单元,不停循环处理的。

可能SAS并不适合处理这种数据,有高手说KDB+Q是一个好的解决方案,不过这意味着又得学习一个新语言。

报纸
爱萌 发表于 2009-5-4 19:39:00

呵呵,关键是SAS需要把所有的数据都读入内存,你们怎么处理不听跳出来的,保存等对话框,谢谢

最恨对我说谎或欺骗我的人

地板
edwardhuanghz 发表于 2009-5-4 19:58:00

用oracle ,现在台式机装ORACLE,还是可以的,ORACLE+SAS,大型的计算,我都是加ORACLE里面实现的,

7
myxixi 发表于 2009-5-4 21:26:00

那种感觉和自己写小程序完全不一样

oracle不会呀,公司也没用这的

8
eijuhz 发表于 2009-5-5 05:54:00

应该用个数据库+SAS分析。

9
fixedincome 发表于 2009-5-5 12:14:00

如果只是用ORACLE管理数据,数据处理仍然用SAS(通过ODBC来使用),速度仍然难以提高。WIND金融工程数据库就是用ORACLE管理的,没觉得快多少。

SAS主要作为统计计量软件使用,兼有数据库管理系统功能,这既是它的优点——方便,但也是它的缺点——数据库管理功能弱于专门软件。

请教了一些高手,目前处理高频数据最快可能是KDB,但问题它做统计或计量远没有SAS方便,除非自己是统计计量&编程高手,能够胜任复杂的计量编程工作。

已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

10
kuhasu 发表于 2009-5-6 02:04:00
以下是引用fixedincome在2009-5-4 19:37:00的发言:

这300多G的分笔交易数据并不仅仅是一个文件,而是进行了分割,某个交易所某个月(甚至是半个月)的全部公司的数据归集为一个文件,即使如此,在2007年,沪市半个月的数据也会超过4G。我在处理数据时,是以这种小文件为处理单元,不停循环处理的。

可能SAS并不适合处理这种数据,有高手说KDB+Q是一个好的解决方案,不过这意味着又得学习一个新语言。

没多少。SAS应付应该问题不大。

 

你说的高手是谁,介绍认识下:)速度的话,现在的内存数据库不少,oracle也有。

起名字叫固定收益,邮箱都是两个策略,楼主是不是太敬业了,连一点儿自己的个性都没有了。。。。

[此贴子已经被作者于2009-5-6 2:06:41编辑过]

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-24 18:48