楼主: wellsuer
1193 3

filename 抓取网页数据,数据不全 [推广有奖]

  • 0关注
  • 1粉丝

硕士生

5%

还不是VIP/贵宾

-

威望
0
论坛币
6002 个
通用积分
93.5762
学术水平
1 点
热心指数
6 点
信用等级
1 点
经验
3000 点
帖子
83
精华
0
在线时间
146 小时
注册时间
2011-3-15
最后登录
2023-12-1

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
filename url url  ""
recfm=v lrecl=6000  ;

data test;
  infile url  length=len;
  length content $6000.;
  input content $varying6000. len ;
run;

用上面方法抓取网页数据,只有7条记录,不报错。

NOTE: 从 INFILE URL 中读取了 7 条记录。
      最小记录长度是 0。
      最大记录长度是 63。
什么原因啊?我抓取的网页有几千条记录的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:filename 抓取网页数据 name file ENA 数据 网页

沙发
zhicunyuan 发表于 2013-4-17 22:56:00 |只看作者 |坛友微信交流群
路过看看

使用道具

藤椅
luijb 在职认证  发表于 2013-5-22 07:11:47 |只看作者 |坛友微信交流群
最近我也在研究这个问题,感觉用sas做难度相当大,只能期待sas的后续版本能更新功能。
西格玛临床统计服务工作室http://www.sigma-stat.com/,luijb@163.com

使用道具

data test;
  infile url  length=len;
  input content $varying5000. len;
run;
我是这样写的,抓取到了很多记录,但是中文字符是乱码,我还没找到解决办法,一会儿查查

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 16:45