楼主: 爱萌
61349 194

大家来讨论一下,SAS怎样才能读入就处理,这样能够处理无限大的数据   [推广有奖]

181
Sweetyhong 发表于 2012-10-20 12:09:05
额,这个SAS还没有开始真正着手研究,真是惭愧

182
佛印 发表于 2012-10-27 09:51:41
sas目前支持变量已突破2**32-1,可以直接处理多种数据。许多数据库可以与之直接沟通,odbc,真是很强大。oracle应该也支持sas直接访问吧?

183
我要考东财 发表于 2012-11-3 11:57:14
真心表示你很猛

184
yger 在职认证  发表于 2012-11-11 16:08:45
看看。。。

185
sabin 发表于 2014-1-9 00:03:02
总体处理还是抽样?这个还真得商榷一番。能不抽样自然都不愿意抽样,问题是现在的数据是越来越大了,举例来讲,一个热门APP的后台日志,一个月下来动则上T,如果不抽样,SAS已经很难对总体的原始数据做处理,而通过hadoop等方式进行预处理的话,又往往容易忽略一些有用的信息,这个别笑话,很多问题都是在数据探索过程中逐步显现的,所以还是希望直接处理原始数据,而在这种情况下,抽样的做法似乎已经不可避免。

186
tracymicky 发表于 2014-1-9 11:44:00
有没有可能将SAS和数据库连接起来  先在数据库读数然后做一些简单的筛选排序运算 然后导出到SAS做分析

187
Roger1989 发表于 2014-1-10 10:53:03
金币    回帖不会给金币的吧、??

188
fengw417 发表于 2015-1-27 15:07:17
kaizhang 发表于 2010-10-13 17:51
我处理过80G的数据。我是用SAS软件把数据切割成小的CSV文件,然后利用SQL语言进程处理。
我对SAS不太熟,现在需要处理一个20的数据,我也想分割成几个小数据集,但不知道如何操作,请指点一下,谢谢!

189
爱萌 发表于 2015-1-28 10:02:54
sabin 发表于 2014-1-9 00:03
总体处理还是抽样?这个还真得商榷一番。能不抽样自然都不愿意抽样,问题是现在的数据是越来越大了,举例来 ...
看来,你在实践中已经尝试过,我也有这种经历,目前我看到了Twitter,google的一些分享后,基本倾向于做抽样,除非是各种报表,否则模型我都愿意抽样来解决

190
sabin 发表于 2015-3-24 09:30:08
爱萌 发表于 2015-1-28 10:02
看来,你在实践中已经尝试过,我也有这种经历,目前我看到了Twitter,google的一些分享后,基本倾向于做抽 ...
我自己目前都是用抽样在作,搞定了就发布出来做应用。模型只是揭示一种规律,本身也只是营销上的一个环节,达成最后的购买不光是靠模型输出名单的,力求但不强求

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-26 11:39