楼主: mmume
1509 2

[问答] SAS文本平频率统计,分析微博用,求大神指点 [推广有奖]

  • 1关注
  • 1粉丝

初中生

19%

还不是VIP/贵宾

-

威望
0
论坛币
278 个
通用积分
0
学术水平
17 点
热心指数
17 点
信用等级
17 点
经验
231 点
帖子
10
精华
0
在线时间
9 小时
注册时间
2010-7-10
最后登录
2016-6-3

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我用爬萌软件抓取的微博数据,格式如下
var1 var2 var3
1     你好  @小明
2     我好  @小刘,@小张,@小明
3     他好  
4     嘿嘿  @小张
5     呵呵  @小刘,@小明
6     哈哈
.........

数据结构如上文所示,现在我想统计此人微博@最多的频率,求问用SAS程序该怎么写

我写的如下,但是显然是错误的:
%let data=sasuser.cm;
%let var=var3;
proc freq data=&data order=freq ;
tables &var;
run;


哪位大神指点一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:sasuser tables Order Table sas程序 统计 微博 程序 软件

沙发
playmore 发表于 2013-7-31 13:27:26 |只看作者 |坛友微信交流群
大概写了个整理数据至规范型式的代码,见下
随后的分析用各种统计过程就方便了

data have;
informat id 8.;
informat content $500.;
input id name $ content $;
datalines;
1 小张 @小王,@小李,@小赵
2 小王 @小李,@小张
3 小林 @小周
;
run;

data want(drop=i content);
set have;
do i=1 to COUNT(content,'@');
name_at=SUBSTR(SCAN(content,i,','),2);
output;
end;
run;
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
Imasasor + 80 + 80 + 4 + 3 + 3 精彩帖子

总评分: 经验 + 80  论坛币 + 80  学术水平 + 4  热心指数 + 3  信用等级 + 3   查看全部评分

playmore邀请您访问ChinaTeX论坛!!!进入ChinaTeX论坛

使用道具

藤椅
mmume 发表于 2013-7-31 15:13:20 |只看作者 |坛友微信交流群
playmore 发表于 2013-7-31 13:27
大概写了个整理数据至规范型式的代码,见下
随后的分析用各种统计过程就方便了
哈哈哈哈  太谢谢您了  

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 21:36