貌似是一开始是gb2312,后来出现了utf-8。也可能是别的我不知道的原因。
代码如下
- import urllib2
- url = 'http://newhouse.sh.fang.com/house/s/b1pd-b91/'
- content = urllib2.urlopen(url).read().decode('gb2312')
然后就出错了。
请问如何解码?
|
楼主: 万人往LVR
|
1008
0
[问答] 一个爬虫编码问题 |
|
已卖:2份资源 副教授 82%
-
|
| ||
|
|
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


