楼主: 万人往LVR
773 0

[问答] 一个爬虫编码问题 [推广有奖]

  • 1关注
  • 13粉丝

副教授

82%

还不是VIP/贵宾

-

威望
0
论坛币
5127 个
通用积分
816.1888
学术水平
70 点
热心指数
112 点
信用等级
40 点
经验
9088 点
帖子
625
精华
0
在线时间
1182 小时
注册时间
2013-7-18
最后登录
2023-12-6

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
网页为搜房网一个网址,http://newhouse.sh.fang.com/house/s/b1pd-b91/在解码时候出现问题:

貌似是一开始是gb2312,后来出现了utf-8。也可能是别的我不知道的原因。
代码如下
  1. import urllib2

  2. url = 'http://newhouse.sh.fang.com/house/s/b1pd-b91/'
  3. content = urllib2.urlopen(url).read().decode('gb2312')
复制代码

然后就出错了。
请问如何解码?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Content urllib decode import House content import 搜房网 我不知道 如何

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 05:29