楼主: 李真LZ
1598 10

[问答] 提取不规则字符 [推广有奖]

  • 0关注
  • 0粉丝

大专生

55%

还不是VIP/贵宾

-

威望
0
论坛币
1050 个
通用积分
0
学术水平
1 点
热心指数
2 点
信用等级
0 点
经验
833 点
帖子
33
精华
0
在线时间
49 小时
注册时间
2015-8-13
最后登录
2021-3-18

100论坛币
想在“remarks”中提取“百度移动客服、 今日头条 53、 神马竞价 53 、手机APP、 自媒体 、搜狗竞价留言 ”,并把它们存放在新建的列中,如下图格式:

客户信息.png (17.11 KB)

客户信息.png

NO_SOURCE.xlsx

10.93 KB

最佳答案

l1i2n3i4n5g 查看完整内容

data test1; RegEx_ID = PRXPARSE ('/(百度移动客服|今日头条\s?53|神马竞价\s?53|手机APP|自媒体|搜狗竞价留言)/'); set test; call prxsubstr(RegEx_ID,remarks,position,length); if position ^=0 then match=substr(remarks, position, length); run;
关键词:百度移动 神马 手机 新建
沙发
l1i2n3i4n5g 在职认证  发表于 2017-4-22 11:03:09 |只看作者 |坛友微信交流群
data test1;
RegEx_ID = PRXPARSE ('/(百度移动客服|今日头条\s?53|神马竞价\s?53|手机APP|自媒体|搜狗竞价留言)/');
set test;
call prxsubstr(RegEx_ID,remarks,position,length);
if position ^=0 then match=substr(remarks, position, length);
run;

使用道具

藤椅
李真LZ 发表于 2017-4-23 10:33:07 |只看作者 |坛友微信交流群
l1i2n3i4n5g 发表于 2017-4-22 20:21
data test1;
RegEx_ID = PRXPARSE ('/(百度移动客服|今日头条\s?53|神马竞价\s?53|手机APP|自媒体|搜狗竞价 ...
我想用SAS程序把下图中A列红色字符提取出来,并放在C列,这个程序如何编写,谢谢大神~

字符提取.png (20.96 KB)

字符提取.png

使用道具

板凳
foocares 发表于 2017-4-23 10:41:29 |只看作者 |坛友微信交流群
李真LZ 发表于 2017-4-23 10:33
我想用SAS程序把下图中A列红色字符提取出来,并放在C列,这个程序如何编写,谢谢大神~
楼上大佬已经告诉你逻辑了啊(调用了一个perl库函数?)
你把你的原始数据读进来到他的示范例子test1里,他输出的结果叫match,你愿意把子字符串放哪列输出就放哪列

使用道具

报纸
李真LZ 发表于 2017-4-23 13:45:59 |只看作者 |坛友微信交流群
l1i2n3i4n5g 发表于 2017-4-22 11:03
data test1;
RegEx_ID = PRXPARSE ('/(百度移动客服|今日头条\s?53|神马竞价\s?53|手机APP|自媒体|搜狗竞价 ...
高手~
真的是太实用了~
感谢感谢

使用道具

地板
李真LZ 发表于 2017-4-23 13:46:24 |只看作者 |坛友微信交流群
foocares 发表于 2017-4-23 10:41
楼上大佬已经告诉你逻辑了啊(调用了一个perl库函数?)
你把你的原始数据读进来到他的示范例子test1里, ...
谢谢谢谢~

使用道具

7
李真LZ 发表于 2017-4-23 15:59:15 |只看作者 |坛友微信交流群
l1i2n3i4n5g 发表于 2017-4-22 11:03
data test1;
RegEx_ID = PRXPARSE ('/(百度移动客服|今日头条\s?53|神马竞价\s?53|手机APP|自媒体|搜狗竞价 ...
大神,我的另外一张表里面“remarks”是含有电话号码的,现在运用刚才的程序,无法读出数据,怎么办?

使用道具

8
l1i2n3i4n5g 在职认证  发表于 2017-4-23 17:03:52 |只看作者 |坛友微信交流群
李真LZ 发表于 2017-4-23 15:59
大神,我的另外一张表里面“remarks”是含有电话号码的,现在运用刚才的程序,无法读出数据,怎么办?
大神不敢当,你把问题说得详细些

使用道具

9
李真LZ 发表于 2017-4-24 09:12:38 |只看作者 |坛友微信交流群
l1i2n3i4n5g 发表于 2017-4-23 17:03
大神不敢当,你把问题说得详细些
我除了要提取客户来源字段,还要提取客户电话号码,如图 电话号码提取

字符提取.png (46.4 KB)

字符提取.png

使用道具

10
foocares 发表于 2017-4-24 10:54:07 |只看作者 |坛友微信交流群
李真LZ 发表于 2017-4-24 09:12
我除了要提取客户来源字段,还要提取客户电话号码,如图
如果每一行都会有电话号码这个信息,那还不如从原始数据着手,把它单独辟为一列,这样每次字符匹配满足你前面的要求后,输出时把相关记录的电话号码这一列也跟着输出就是了,因为你并不关心电话号码的任何匹配,所以它是另一个独立变量。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 22:42