楼主: sparc10
2830 5

求助-频数分析问题 [推广有奖]

  • 0关注
  • 0粉丝

博士生

2%

还不是VIP/贵宾

-

威望
0
论坛币
322 个
通用积分
25.2707
学术水平
6 点
热心指数
6 点
信用等级
1 点
经验
3654 点
帖子
88
精华
0
在线时间
357 小时
注册时间
2010-2-11
最后登录
2021-1-25

楼主
sparc10 发表于 2010-11-9 15:17:16 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
关于频数分析的问题,请高手指点一二:

手里有一张Excel的表,数据量比较大,2万多行,列数不重要,如下:

anything1   主叫号码      anything2
-------------------------------------------------
XXXX         139xxxxx       XXXX
XXXX         138xxxxx       XXXX
...
...
--------------------------------------------------

在主叫号码一列,同一数据(同一手机用户)可能多次出现,但是anything1字段及anything2字段的数据不一样。

现在需要把出现次数比较多的用户数据(整行)提取出来,生成另一张Excel表(同样3个字段)。

关于实现的方法:
1,JMP
本人习惯偷懒,做频度分析喜欢用JMP的Parate图功能,直观,好用,但是这次由于数据量太大,做Parate图时
必须不停地加长X轴才能看清楚,很不方便(每天都要做)。可否利用JSL写一个脚本,只保留出现次数超过某个
设定门限的记录(用户)?

2,Excel
如果能用Excel本身实现,哪位指点一下?我毫无头绪,见笑!

3,SAS或者SPSS?
同上。

还望各位不吝赐教,多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:分析问题 频数分析 anything 用excel Excel表 求助 分析问题 频数

回帖推荐

sopching 发表于2楼  查看完整内容

我这是用SAS做的,方法有点笨,抛个砖: test3既是你想要的。然后在proc export出去就OK了。。 BTW,2万数据对SAS来说算小的了。

本帖被以下文库推荐

沙发
sopching 发表于 2010-11-9 16:29:27
我这是用SAS做的,方法有点笨,抛个砖:
  1. data test;
  2.       input x1 x2 tel $11.;
  3.       cards;
  4.         2 3 12345678912
  5.         7 2 12453534523
  6.         6 3 13535973249
  7.         3 7 12345678912
  8.         9 7 12345678912
  9.         3 5 12345678912
  10.         8 1 13535973249
  11. ;
  12. run;
  13. proc sql;
  14.         create table test2 as
  15.         select *,count(*) as n
  16.         from test
  17.         group by tel;
  18.   quit;
  19. proc sql;
  20.         create table test3 as
  21.         select x1, x2, tel
  22.         from test2
  23.         where n=(select max(n) from test2);
  24. quit;
复制代码

test3既是你想要的。然后在proc export出去就OK了。。       BTW,2万数据对SAS来说算小的了。
已有 1 人评分热心指数 收起 理由
crackman + 1 比较热心

总评分: 热心指数 + 1   查看全部评分

藤椅
liudeng2005 发表于 2010-11-9 16:43:36
期待完整步骤,包括到导出
我就是我@!

板凳
sparc10 发表于 2010-11-9 21:53:34
非常感谢sopching,SAS一直在用分析家(偷懒。。。),编程刚入门,以后要多多向大家学习了!

报纸
sparc10 发表于 2010-11-10 15:09:01
完整步骤:

data guangzhou;
set tu.v600;      //原始数据,由excel导入
where _COL2 is NOT NULL and _COL3="广州";       //读入广州地区的非空字段
run;

proc sql;
create table gz1 as
select *,count(*) as n from guangzhou group by _COL2; //按主叫号码分组,计数
run;

proc export data=gz1 (where=(n>5))   //取出频数大于5的记录,并输出到新的Excel文件中
outfile="C:\Users\项目资料\guangzhou.xls"  //输出的字段为_COLn,手动替换成原中文字段即可
dbms=excel
replace;
run;
quit;

地板
sparc10 发表于 2010-11-10 15:20:38
Restriction: PROC EXPORT does not support writing labels as column names. However, SAS does support column names up to 32 characters.

遗憾啊。。。
试过用ODS+Proc Print输出,部分字段的数据超过1024字符,总是有问题。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-25 17:57