楼主: louis_bai
2086 5

[学习分享] 如何利用正则函数提取多个指定字段 [推广有奖]

  • 0关注
  • 1粉丝

本科生

54%

还不是VIP/贵宾

-

威望
0
论坛币
1079 个
通用积分
2.0011
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
867 点
帖子
23
精华
0
在线时间
143 小时
注册时间
2018-7-23
最后登录
2021-3-9

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
程序如下
  1. data a;
  2.   a='jack like jack';
  3.   pattern=prxparse('/jack/o');
  4.   start=1;
  5.   stop=length(a);
  6.   call prxnext(pattern,start,stop,a,position,length);
  7.   array num(2) $ ;
  8.   do i=1 to 2 while (position>0);
  9.     num(i)=substr(a,position,length);
  10.     call prxnext(pattern,start,stop,a,position,length);
  11.   end;
  12. drop pattern start stop i position length;
  13. run;
复制代码
问题在提取多个指定字段的时候利用了array,但前提是知道该字符串中有多少个目标字段,才可以设置 i 的上限。笔者在实际应用中利用的count函数做识别字段计数来做,希望网友有更好的方法来计数目标字段。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:实际应用 字符串 应用中

回帖推荐

沙发
louis_bai 在职认证  发表于 2018-9-20 10:47:17 |只看作者 |坛友微信交流群
还有一种方法,就是不使用array,改用output,但会将每一个目标字段形成一个新的观测。
  1. data a;
  2.   a='jack like jack';
  3.   pattern=prxparse('/jack/o');
  4.   start=1;
  5.   stop=length(a);
  6.   call prxnext(pattern,start,stop,a,position,length);
  7.   do  while (position>0);
  8.     num=substr(a,position,length);
  9.         output;
  10.     call prxnext(pattern,start,stop,a,position,length);
  11.   end;
  12. drop pattern start stop position length;
  13. run;
复制代码

使用道具

藤椅
lovexialulu 发表于 2018-9-20 14:49:14 |只看作者 |坛友微信交流群
  1. data b;
  2. length a $50.;
  3. a='jack said jack like   jack';output;
  4. a="Jack love JACK's sister";output;
  5. a='jaack said jacck like jeack';output;
  6. run;

  7. %let repeat_var=jack;
  8. %let replace_var=#;

  9. data c;
  10. set b;
  11. length num num1 num2 $50.;
  12. if prxmatch("/&replace_var/",a)
  13. then put "WAR" "NING: the intermediate replace variable is exist in raw strings, please change another one,eg. * or !";
  14. if prxmatch("/&repeat_var/i",a) then num=prxchange("s/&repeat_var/&replace_var/i",-1,a);
  15. if prxmatch("/&replace_var/i",num) then do;
  16.    num_=countw(num,"&replace_var") ;
  17.    num1=prxchange("s/[^&replace_var]//i",-1,num);
  18.    num2=prxchange("s/&replace_var/&repeat_var /i",-1,num1);
  19. end;
  20. run;
复制代码

使用道具

板凳
louis_bai 在职认证  发表于 2018-9-20 16:22:16 |只看作者 |坛友微信交流群
lovexialulu 发表于 2018-9-20 14:49
感谢您的回复,学习了。

使用道具

报纸
louis_bai 在职认证  发表于 2018-9-20 16:23:50 |只看作者 |坛友微信交流群
lovexialulu 发表于 2018-9-20 14:49
感谢您的回复,学习到了。这我最近困扰我的一个新问题,还麻烦您看一下有没有好的解决方法。

如何利用正则函数只提取汉字或者只匹配中文标点符号
https://bbs.pinggu.org/forum.php? ... mp;from^^uid=10993030

使用道具

地板
lovexialulu 发表于 2018-9-20 16:40:04 |只看作者 |坛友微信交流群
汉字 用正则匹配 容易出错吧,汉字是4-byte编码,用 K function 试试, 比如 kscan, kupcase, ksubstr

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 18:58