楼主: ncut224
4600 15

[实际应用] SAS 做客户细分的一些实际问题,求解答 [推广有奖]

11
hgz2373294 发表于 2014-11-16 20:38:35
建议放在HADOOP里直接运用SAS连接HADOOP,就可以计算了.
不需要抽样.如果有HADOOP系统处理这各大数据很方便的.

12
ncut224 发表于 2014-11-18 14:36:53
hgz2373294 发表于 2014-11-16 20:38
建议放在HADOOP里直接运用SAS连接HADOOP,就可以计算了.
不需要抽样.如果有HADOOP系统处理这各大数据很方便 ...
这个是,不过目前客户的Hadoop平台还不是很成熟,所以这个只能作为参考。
另外:如果SAS要连接到Hadoop, 还需要安装SAS的什么模块吗?类似SAS/Access 连接关系库的这种?

13
hgz2373294 发表于 2014-11-19 13:04:43
SAS BASE
SAS® SPD Engine
SAS® LASR
SAS Data Integration Studio
这几个都可以连接到HADOOP,如果经常做这种大数据分析我建议还是搞个HADDOP会方便以后所有类似的工作.当然只有一个工作,意义就不大.

14
tangor 在职认证  发表于 2014-12-16 11:59:02
ncut224 发表于 2014-11-13 17:03
嗯,那我需要将整个结果集先由Oracle 复制到SAS中,再进行探索和数据插补吗?
拿过来肯定是好,效率会高 ...
不好意思,回复晚了,估计项目已经做完了吧,哈哈,可以直接联系我,qq2935225
如果是2亿条客户记录,我觉得是业务理解上或需求上没有考虑好,一般来说你应该聚焦一下目标客群,起码休眠用户,低价值用户什么的都可以滤掉吧,这样下来估计就几千万了;再建议一下硬过滤在oracle侧做,导到SAS几千万数量级还是可以的。初步探索建议在oracle做,查补建议在SAS里二次探索再确定处理策略。

15
tangor 在职认证  发表于 2014-12-16 12:00:36
ncut224 发表于 2014-11-13 17:05
嗯,是的。另外,是先做数据插补和标准化,再做抽样?还是先做抽样,再进行数据插补和标准化呢?
这个没有明确标准,要根据实际情况,我一般是先抽样,再差补。

16
tangor 在职认证  发表于 2014-12-16 12:02:55
ncut224 发表于 2014-11-13 17:18
这个不太了解,我的服务器是装在Linux下的,能不能用Shell 来调。如果可以的话,是怎么做呢?谢谢啊
SAS本身有调度服务的,不知道你有没有订购。
如果没有的话就用系统调度,win server下我用过,linux下应该也有,我没用过。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-13 01:42