楼主: carol1222
4894 3

关于模糊匹配或者部分截取的问题 [推广有奖]

  • 5关注
  • 0粉丝

硕士生

41%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1283 点
帖子
157
精华
0
在线时间
74 小时
注册时间
2010-5-6
最后登录
2014-11-13

楼主
carol1222 发表于 2014-3-27 17:02:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有一系列的URL地址,但是我只需要主要地址比如,www.baidu.com不需要剩下的。
在SAS里面有什么方法可以截取吗?

截图00.jpg

如果截取的方法不行,有没有其他方法可以可以模糊匹配,比如我有一列包含了www.baidu.com,然后在这个URL里面寻找匹配的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:baidu 什么方法 COM url 有没有

花有再开日 人无再少年

沙发
carol1222 发表于 2014-3-27 17:22:40
自己用了excel里面的vlookup。解决了
花有再开日 人无再少年

藤椅
learsaas 发表于 2014-3-27 20:00:37
不知道这个能否满足您要求:
  1. data result;
  2.     set webtile;
  3.     length base_url $256;
  4.     retain prxID;
  5.     if _n_=1 then prxID=prxparse('m/^https{0,1}:/');
  6.     base_url=ifc(prxmatch(prxId,url),scan(url,2,'/'),scan(url,1,'/'));
  7. run;
复制代码

板凳
farmman60 发表于 2014-3-28 09:49:20
data have(drop=pid start length);
infile cards truncover;
input web $100.;
retain pid;
if _n_=1 then pid=prxparse('/^https?:\/\/\w+\.\w+\.\w+(?=\/)/');
call prxsubstr(pid,web,start,length);
  if start>0 then do;
    site=substr(web,start,length);
        output;
  end;
cards;
http://www.baidu.com/index.php?tn=monline_5_dg
https://communities.sas.com/thread?start=20
https://bbs.pinggu.org/forum-68-1.html
https://www.google.com/webhp?source=search_app
;
run;



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 15:46