楼主: gaotao0727
1412 7

[问答] 网络爬虫报错,求助各位高手 [推广有奖]

  • 1关注
  • 10粉丝

副教授

79%

还不是VIP/贵宾

-

威望
0
论坛币
540 个
通用积分
11.2790
学术水平
18 点
热心指数
18 点
信用等级
12 点
经验
27715 点
帖子
873
精华
0
在线时间
855 小时
注册时间
2011-8-8
最后登录
2023-3-1

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
你知道这个帖子吗?“从拉勾网爬的招聘数据 解析中国数据挖掘人才能挣多少钱”
我在学习这个帖子里面的源代码时运行报错,详细如下:
  1.     i =0
  2.     type='true'
  3.     url='http://www.lagou.com/jobs/positionAjax.json?px=default&first='+type+'&kd='+keywordindex+'&pn='+str(i+1)
  4.     with request.urlopen(url) as f:
  5.         data=f.read()
  6.         urlcount=int(json.loads(str(data,encoding='utf-8',errors='ignore'))["content"]["totalPageCount"])
  7.         print('本次搜索页面共计%d'%urlcount)
复制代码
报错截图:
QQ图片20151108153314.png
顺便再请教两个问题:
程序中的str(i+1)用什么特别的作用吗?str(data,encoding='utf-8',errors='ignore')这的str函数允许有后面两个参数吗?我这运行也报错啊,说最多一个参数。
先谢谢各位高手啦,俺是小白!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:网络爬虫 position Default Content Request 网络

衣带渐宽终不悔,为伊消得人憔悴~~
沙发
tomatojack 发表于 2015-11-13 11:53:02 |只看作者 |坛友微信交流群
str(i)是把数字型转换成字符型啊,str应该是只有一个参数的,unicode才有你说的三个参数吧

使用道具

藤椅
tomatojack 发表于 2015-11-13 11:55:40 |只看作者 |坛友微信交流群
另外,那个错误应该是说你的 request.urlopen(url)这个函数返回值没有办法缺省的退出方法,你可以不用这个with,然后用close或类似方法结束这个request的

使用道具

板凳
gaotao0727 发表于 2015-11-16 09:42:56 |只看作者 |坛友微信交流群
tomatojack 发表于 2015-11-13 11:53
str(i)是把数字型转换成字符型啊,str应该是只有一个参数的,unicode才有你说的三个参数吧
应该是版本问题,python3.4没问题好像,2.7就不行

使用道具

报纸
gaotao0727 发表于 2015-11-16 09:43:56 |只看作者 |坛友微信交流群
tomatojack 发表于 2015-11-13 11:55
另外,那个错误应该是说你的 request.urlopen(url)这个函数返回值没有办法缺省的退出方法,你可以不用这个w ...
是的,我不用with...as这种结构了,就咩有问题了,谢谢

使用道具

地板
gaotao0727 发表于 2015-11-16 09:48:34 |只看作者 |坛友微信交流群
tomatojack 发表于 2015-11-13 11:55
另外,那个错误应该是说你的 request.urlopen(url)这个函数返回值没有办法缺省的退出方法,你可以不用这个w ...
再请教一下问题哈
就是网络爬虫的url如何确定啊,我在网上实际搜索的地址与例子代码中的url不一样,不知道例子中的url是如何分析出来的,对搜索结果还可以循环分析每一页,先谢谢你啦~~~

使用道具

7
tomatojack 发表于 2015-11-16 13:28:09 |只看作者 |坛友微信交流群
gaotao0727 发表于 2015-11-16 09:48
再请教一下问题哈
就是网络爬虫的url如何确定啊,我在网上实际搜索的地址与例子代码中的url不一样,不知 ...
具体这个例子我并不了解,可能需要看网页源代码,然后用一些工具提取出来才行

使用道具

8
gaotao0727 发表于 2015-11-16 13:29:08 |只看作者 |坛友微信交流群
tomatojack 发表于 2015-11-16 13:28
具体这个例子我并不了解,可能需要看网页源代码,然后用一些工具提取出来才行
好像是,需要研究一下~~非常感谢哦~

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 09:31