貌似是一开始是gb2312,后来出现了utf-8。也可能是别的我不知道的原因。
代码如下
- import urllib2
- url = 'http://newhouse.sh.fang.com/house/s/b1pd-b91/'
- content = urllib2.urlopen(url).read().decode('gb2312')
然后就出错了。
请问如何解码?
楼主: 万人往LVR
|
773
0
[问答] 一个爬虫编码问题 |
副教授 82%
-
|
| ||
京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明 免责及隐私声明