楼主: changtuiada
4120 7

[原创博文] 网页源代码中不含要被抓取数据 怎么用sas抓取? [推广有奖]

  • 0关注
  • 0粉丝

小学生

14%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
91 点
帖子
8
精华
0
在线时间
1 小时
注册时间
2011-11-2
最后登录
2011-11-4

楼主
changtuiada 发表于 2011-11-2 22:24:37 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
关于如何用sas从网上抓数据,论坛中有很多帖子,感谢各位前辈的分享,从中学到很多。

帖子中提到的方法的思路都是利用filename url语句把要抓取数据的网页的所有的源代码都抓下来放到sas数据集中,在通过data步将要的数据提取出来。

如果我们要的数据在网页的源代码里面有,那就很好办,就比如这个例子中:http://saslist.com/elek/2010/09/15/%E9%80%9A%E8%BF%87-sas-%E8%AF%BB%E5%8F%96%E7%BD%91%E9%A1%B5%E5%86%85%E5%AE%B9/
我们要的数据都在网页的源代码中,只要把含有数据的源代码搞下来放入sas数据集就能通过处理数据得到想要的结果。

但是现在很多网站提供的数据在源代码中都没有,特别是金融类的数据,比如新浪财经上的数据,
http://vip.stock.finance.sina.com.cn/moneyflow/
这些数据都是通过脚本语言动态产生的,在源代码中没有。


请问如果想抓这种数据sas有没有什么方法呢?

谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:抓取数据 源代码 filename Finance saslist 源代码 网页 如何 网上

沙发
changtuiada 发表于 2011-11-3 10:18:15
求指导!

藤椅
Eehanz 发表于 2011-11-3 11:02:55
求指导??

板凳
邢不行 在职认证  发表于 2011-11-3 14:41:16
求指导...
不管去哪里 只要在路上

报纸
kuhasu 发表于 2011-11-3 15:05:43
你说的是动态网页和静态网页的区别问题。
你直接抓源码的不行。要分析网页代码才行。
这个就是国内网站的问题。国外网站,一般都基于xml设计。国内就比较乱。

地板
changtuiada 发表于 2011-11-4 08:45:16
kuhasu 发表于 2011-11-3 15:05
你说的是动态网页和静态网页的区别问题。
你直接抓源码的不行。要分析网页代码才行。
这个就是国内网站的 ...
谢谢指教!
继续学习!

7
jason_huo 发表于 2012-4-17 15:33:49
kuhasu 发表于 2011-11-3 15:05
你说的是动态网页和静态网页的区别问题。
你直接抓源码的不行。要分析网页代码才行。
这个就是国内网站的 ...
同问!!!!!有没有些具体的例子?谢谢!!

8
gxylg122 企业认证  发表于 2015-5-14 15:35:10
遇到了同样的问题,请问楼主找没找到方法呀

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-20 01:43