楼主: niuwussc
1174 3

[实际应用] 200论坛币寻优秀方案,这个零售数据如何分析和写SAS code? [推广有奖]

  • 0关注
  • 0粉丝

本科生

21%

还不是VIP/贵宾

-

威望
0
论坛币
1096 个
通用积分
0.6000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1738 点
帖子
52
精华
0
在线时间
106 小时
注册时间
2005-10-26
最后登录
2025-8-28

楼主
niuwussc 发表于 2012-12-19 23:07:00 |AI写论文
200论坛币
应用场景描述:
客户的购物清单数据:
    1. 现在每个客户一张表,假设以data0037861 (数字为客户ID)分别命名。
    2. 客户数量是在不断增加的,因此所有客户的数据表 data0000001 --  datan,其中的n是在不断变化的。
    3. 每个客户表中,存储的主要信息包括 交易时间(tractime)、goods(商品名称,以逗号分隔,文本形式放在一起)等。因时间的变化,因此每个客户的数据是动态变化的。

应用分析需求:
    1. 指定某个时间段,比如2012年11月11日到2012年12月12日,要求分析生成这个时间段内,交易的所有商品的客户覆盖比例表。举例说明:如果其中有“牛奶” 这个商品,分析发现这段时间有82.6%客户买过牛奶,那么“牛奶”的客户覆盖比例就是82.6%。

程序要点:指定时间点、多张表格(每个客户一张)、动态交易数据、找出所有的交易商品名,计算百分比。

拿出200论坛币,一点小小心意,希望各位老鸟、能人,提供分析思路及SAS code样例,希望能满足高效的需求,实现实时分析,迅速处理巨大的数据。

谢谢了先!

关键词:200论坛币 code 0论坛币 论坛币 COD 零售 论坛 如何

沙发
playmore 发表于 2012-12-20 09:11:09
简单说一下,lz做参考,不一定对
既然用了SAS,就要利用sql,那就要用关系型数据库创建尽量满足最高范式的数据表
你在这里一个客户一张表明显是在视图阶段做的事情
现在要做的就是一张客户表,一张产品表,一张销售流水表
然后在这三张表上你爱做什么做什么了
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
niuwussc + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

playmore邀请您访问ChinaTeX论坛!!!进入ChinaTeX论坛

藤椅
niuwussc 发表于 2012-12-20 12:12:22
playmore 发表于 2012-12-20 09:11
简单说一下,lz做参考,不一定对
既然用了SAS,就要利用sql,那就要用关系型数据库创建尽量满足最高范式的 ...
我以前只有二维表数据的分析经验,您说的东西对我比较新,我消化一下先。

板凳
niuwussc 发表于 2012-12-21 19:15:28
顶起来,继续求。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 17:09