楼主: addahello
6409 12

[原创博文] 用sas下载网页数据 [推广有奖]

  • 2关注
  • 0粉丝

已卖:21份资源

副教授

8%

还不是VIP/贵宾

-

威望
0
论坛币
5127 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
342 点
帖子
277
精华
0
在线时间
654 小时
注册时间
2009-10-19
最后登录
2023-6-17

楼主
addahello 发表于 2010-12-14 17:04:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求高人指点如何从网页:http://vip.stock.finance.sina.com.cn/moneyflow/
上下载数据,谢谢谢谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Finance Financ 求高人指点 money Finan 网页 如何

回帖推荐

论坛数据分析 发表于3楼  查看完整内容

找到一些资料: SAS使用技巧- 动态抓取外部URL的网友内容使用之前先要注意一下SAS的版本,SAS8的话需要打补丁,并且好像SAS网站上没有直接的补丁,需注意了,9版当然就没有这问题了。 其实实现这已内容很简单,就是通过SAS的DATA STEP来实现 首先:需做一个逻辑文件名引用到该URL地址 然后通过DATA STEP都该文件名即可把内容读取出来 代码如下: filename 引用名 url 'URL地址' RECFM=v(读取格式,V表以文本格式读取) l ...

本帖被以下文库推荐

沙发
chouxiangdaishu 发表于 2010-12-15 09:43:34
以前好像有看过用SAS抓取url里面内容的,但是好像很费劲。
SAS很牛,但他不是万能的。

藤椅
论坛数据分析 发表于 2010-12-16 13:55:05
找到一些资料:
SAS使用技巧- 动态抓取外部URL的网友内容使用之前先要注意一下SAS的版本,SAS8的话需要打补丁,并且好像SAS网站上没有直接的补丁,需注意了,9版当然就没有这问题了。

其实实现这已内容很简单,就是通过SAS的DATA STEP来实现

首先:需做一个逻辑文件名引用到该URL地址
然后通过DATA STEP都该文件名即可把内容读取出来
代码如下:
filename 引用名 url 'URL地址' RECFM=v(读取格式,V表以文本格式读取) lrecl=N(每行最长的记录) ;
data 表名;
file _webout;
infile 引用名 LINESIZE =N pad ;
length content $32766. ;
input content $char32766.;
run;

即可实现抓取URL所指向的网页内容,但是很奇怪的是,联系运行上面代码会造成SAS崩溃,真是奇怪,后来把代码改成如下:

filename 引用名 url 'URL地址' RECFM=v(读取格式,V表以文本格式读取) lrecl=N(每行最长的记录) ;
data 表名;
file _webout;
infile 引用名 ;
length content $32766. ;
input content $varying32766.;
run;
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

老夫聊发少年狂

板凳
addahello 发表于 2010-12-16 18:46:06
非常感谢楼上,这个方法我试过,但这样处理的结果是,所有内容都会被放在一个变量里,而不是各自区分开来,期待有更好的解决办法!!谢谢!!

报纸
viterbi 发表于 2010-12-17 10:27:36
尝试用input 控制字段

地板
addahello 发表于 2010-12-18 10:37:00
如何控制呢,能不能给个具体的程序,谢谢谢谢!!!!!!!!!!!!!!

7
elek.me 发表于 2010-12-20 14:11:03
怎么不搜索一下呢??  http://www.google.com/#sclient=p ... ;fp=4089c27a6c765b8

第一条是我以前写的一个例子,供参考。
我的博客: http://elek.me/sas
联系我: http://about.me/elek

8
addahello 发表于 2010-12-20 16:30:53
谢谢,您的程序我跑了一下,但是不能得到截图那样的结果,只生成一行观测、4个变量的结果,求改进方法,谢谢谢!! 7# elek.me

9
elek.me 发表于 2010-12-20 17:17:41
呵呵。 可能是网页的数据更新了。  它的数据有些地方是不规则的。
我的博客: http://elek.me/sas
联系我: http://about.me/elek

10
soporaeternus 发表于 2010-12-20 21:42:31
楼上的blog是个好地方啊,多谢分享,以后多来学习!
Let them be hard, but never unjust

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 14:51