求助各位大虾
我收集了一批数据,共5个变量,共1300条记录。每个变量的取值为1-150
现在我想找出,这5个变量组合中,出现的频率最高的是哪一种组合?
请问用sas应该怎么编程呢,谢谢
我试了一些proc freq,但是由于变量较多,记录数较多,变量的分类也太多(1-150),sas软件没法算出结果
应该怎么弄呢
楼主: shenshen0455
|
12008
26
[原创博文] 请教sas对于频数统计的问题,难!! |
博士生 6%
-
|
回帖推荐meishanjia1900 发表于5楼 查看完整内容 举个例子,你的原始数据集为your_data,其中有两个变量V1与V2。你想统计第一个变量V1中出现频率最高的数字,实现方法有很多,我想出来的方法是排序之后再用保留变量统计,完整程序如下:
data your_data;
input v1 v2;
cards;
1 2
3 4
5 6
7 8
7 9
3 2
5 4
5 6
5 1
7 0
;
proc sort data=your_data(keep=v1) out=var1_data;
by v1;
run;
data report_data;
set var1_data;
by v1;
retain sum ...
shenshen0455 发表于6楼 查看完整内容 谢谢指点啊!
不过我这里是想求出组合频率的次数,比如你的数据中,
1 2 的组合出现1次,则频数为1
3 4的组合出现1次,频数为1
5 6的组合出现1次,频数为1
不知道我有没有说清楚呢
另外,如果变量取值为字符型的,这个程序也适用吗
本帖被以下文库推荐
| ||
| ||
| ||
aabbcc
|
||
| ||
| ||
| ||
aabbcc
|
||
| ||||||||||||
京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明 免责及隐私声明