楼主: edwardzxf
1890 8

用sas抓取网络的上的数据--正则表达 [推广有奖]

  • 0关注
  • 2粉丝

已卖:32份资源

讲师

26%

还不是VIP/贵宾

-

威望
0
论坛币
222 个
通用积分
0.4203
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
3991 点
帖子
242
精华
0
在线时间
375 小时
注册时间
2010-7-30
最后登录
2021-5-25

楼主
edwardzxf 学生认证  发表于 2012-12-7 14:38:44 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我在了解用sas抓取网络的上的数据,其中利用正则表达式去除<>部分  , 的代码如下:
data work.temp02;                         

         length content_new $10 flag 8;        
         set work.temp01;        
         retain flag;        flag + 1;        
/*去除所有被<>包含的代码及其所有空格*/      
          pattern2 = 's/<.+?>//s';      
         retain pattern_id;        
         pattern_id = prxparse(pattern2);      
         call prxchange(pattern_id, -1, content);        
           content_new =compress(content);run;
Run;

请问 那个pattern id s/<.+?>//s 是如何解释呀,为什么这样写,那位帮我分解下,好不,谢啦!                                                                                                                                                                                                





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:PrxChange compress Pattern Content RXPARSE content 表达式 如何

回帖推荐

ziyenano 发表于3楼  查看完整内容

's///s' 开始的s表示替换,.匹配除了\n之外的所有字符,+表示匹配1到多次,而?表示匹配模式是非贪婪的,最后将匹配的字符替换为两个斜线//之间的字符,这里为空,起到了删除作用

本帖被以下文库推荐

沙发
奥迪A4 学生认证  发表于 2012-12-7 14:56:49
恭喜!再接再厉!

藤椅
ziyenano 发表于 2012-12-7 15:03:15
's/<.+?>//s'
开始的s表示替换,.匹配除了\n之外的所有字符,+表示匹配1到多次,而?表示匹配模式是非贪婪的,最后将匹配的字符替换为两个斜线//之间的字符,这里为空,起到了删除作用
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

板凳
edwardzxf 学生认证  发表于 2012-12-7 15:06:16
ziyenano 发表于 2012-12-7 15:03
's///s'
开始的s表示替换,.匹配除了\n之外的所有字符,+表示匹配1到多次,而?表示匹配模式是非贪婪的
非常感谢,如何可以能否再详细些,我刚涉及这部分,还不是很懂

报纸
ziyenano 发表于 2012-12-7 15:24:49
edwardzxf 发表于 2012-12-7 15:06
非常感谢,如何可以能否再详细些,我刚涉及这部分,还不是很懂
http://msdn.microsoft.com/zh-cn/library/ae5bf541(VS.80).aspx
这里正则语法讲得比较全

地板
edwardzxf 学生认证  发表于 2012-12-7 16:42:47
ziyenano 发表于 2012-12-7 15:24
http://msdn.microsoft.com/zh-cn/library/ae5bf541(VS.80).aspx
这里正则语法讲得比较全
谢谢,难道不同语言程序里的正则表达式的方法都一样不?

7
ziyenano 发表于 2012-12-7 17:11:28
edwardzxf 发表于 2012-12-7 16:42
谢谢,难道不同语言程序里的正则表达式的方法都一样不?
正则表达式是通用的,可能不同的软件,调用上有点不同

8
edwardzxf 学生认证  发表于 2012-12-8 13:14:30
ziyenano 发表于 2012-12-7 17:11
正则表达式是通用的,可能不同的软件,调用上有点不同
谢谢,顺便请教下您,我用 filename 抓取网页的时候,很多情况下都说报错,说什么找不到主机名。 我想问问你,这个问题可以怎样得到处理或缓解,如这个: filename etf url 'http://finance.sina.com.cn/realstock/company/sz000799/nc.shtml'  RECFM=v lrecl=1000;

感激涕零!

9
ziyenano 发表于 2012-12-8 14:36:23
edwardzxf 发表于 2012-12-8 13:14
谢谢,顺便请教下您,我用 filename 抓取网页的时候,很多情况下都说报错,说什么找不到主机名。 我想问问 ...
用dos好像也ping不通,说找不到主机

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-6 08:25