楼主: 邢不行
4265 7

[有偿编程] sas提取网页源代码内容 如何删除字符串中特定两个字符之间的内容? [推广有奖]

院士

5%

还不是VIP/贵宾

-

威望
1
论坛币
26743 个
通用积分
135.2153
学术水平
485 点
热心指数
505 点
信用等级
456 点
经验
44525 点
帖子
547
精华
26
在线时间
1111 小时
注册时间
2010-4-30
最后登录
2024-4-1

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现有一段字符串如下:

  环保板块午后持续下跌,<span id=stock_sz300187><ahref=http://finance.sina.com.cn/realstock/company/sz300187/nc.shtmlclass="keyword" target=_blank>永清环保</a></span><spanid=quote_sz300187></span>冲上跌停,<spanid=stock_sz300070><a href=http://finance.sina.com.cn/realstock/company/sz300070/nc.shtmlclass="keyword" target=_blank>碧水源</a></span><spanid=quote_sz300070></span><spanid=stock_sz300190><ahref=http://finance.sina.com.cn/realstock/company/sz300190/nc.shtmlclass="keyword" target=_blank>维尔利</a></span><spanid=quote_sz300190></span><spanid=stock_sh600008><ahref=http://finance.sina.com.cn/realstock/company/sh600008/nc.shtmlclass="keyword" target=_blank>首创股份</a></span><spanid=quote_sh600008></span><spanid=stock_sz002616><a href=http://finance.sina.com.cn/realstock/company/sz002616/nc.shtmlclass="keyword" target=_blank>长青集团</a></span><spanid=quote_sz002616></span><spanid=stock_sz002573><ahref=http://finance.sina.com.cn/realstock/company/sz002573/nc.shtmlclass="keyword" target=_blank>国电清新</a></span><spanid=quote_sz002573></span>等跌幅居前。


很明显这是网页源代码,我想删除所有'<'和'>'之间的内容,请问各位大神应该怎么办?

还有,用sas提取html源代码中的内容有什么好的方法嘛?


万分感谢!



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:源代码 字符串 环保板块 首创股份 HTML 如何 碧水源 环保板块 源代码 target

不管去哪里 只要在路上
沙发
ena7777 发表于 2012-3-26 14:31:19 |只看作者 |坛友微信交流群
这个东东看着很有意思啊,我学习学习

使用道具

藤椅
邢不行 在职认证  发表于 2012-3-26 18:18:36 |只看作者 |坛友微信交流群
ena7777 发表于 2012-3-26 14:31
这个东东看着很有意思啊,我学习学习
谢谢你的顶贴。。。
不管去哪里 只要在路上

使用道具

板凳
rainfall2003 发表于 2012-4-18 10:56:27 |只看作者 |坛友微信交流群
同问

使用道具

no pay no reply!

使用道具

地板
yongjiang2 发表于 2012-6-28 14:43:08 |只看作者 |坛友微信交流群
学习

使用道具

7
275769263 发表于 2013-1-28 18:20:37 |只看作者 |坛友微信交流群
感觉用正则表达式还行,比如你的例子:
data _null_;
change = prxparse('s/<.*?>//');
txt='<ahref=http://finance.sina.com.cn/realstock/company/sz300187/nc.shtmlclass="keyword" target=_blank>永清环保</a></span><spanid=quote_sz300187></span>冲上跌停,<spanid=stock_sz300070><a href=http://finance.sina.com.cn/realstock/company/sz300070/nc.shtmlclass="keyword" target=_blank>碧水源</a></span><spanid=quote_sz300070></span>、<spanid=stock_sz300190><ahref=http://finance.sina.com.cn/realstock/company/sz300190/nc.shtmlclass="keyword" target=_blank>维尔利</a></span><spanid=quote_sz300190></span>、<spanid=stock_sh600008><ahref=http://finance.sina.com.cn/realstock/company/sh600008/nc.shtmlclass="keyword" target=_blank>首创股份</a></span><spanid=quote_sh600008></span>、<spanid=stock_sz002616><a href=http://finance.sina.com.cn/realstock/company/sz002616/nc.shtmlclass="keyword" target=_blank>长青集团</a></span><spanid=quote_sz002616></span>、<spanid=stock_sz002573><ahref=http://finance.sina.com.cn/realstock/company/sz002573/nc.shtmlclass="keyword" target=_blank>国电清新</a></span><spanid=quote_sz002573></span>等跌幅居前。';
call prxchange(change,-1, txt);
put txt;
run;
具体方面还得看需求。
求工作..求工作..求工作..求工作...

使用道具

8
junhuliu 发表于 2013-4-4 10:11:25 |只看作者 |坛友微信交流群
我以前用matlab经常做这东西,提取的数据直接对应输入到excel 里面。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 19:10