楼主: LJLOOO
1352 0

[数据挖掘理论与案例] python新人数据爬虫求教大佬! [推广有奖]

  • 0关注
  • 0粉丝

已卖:2份资源

大专生

6%

还不是VIP/贵宾

-

威望
0
论坛币
1011 个
通用积分
0.9000
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
423 点
帖子
5
精华
0
在线时间
72 小时
注册时间
2018-5-8
最后登录
2023-6-26

楼主
LJLOOO 发表于 2018-8-7 15:02:41 |AI写论文
10论坛币
刚开始学python3.6,在spyder写了一段码想爬一下手机报价,但是最终结果出不来,不知道问题出在哪里了,求救论坛里的各位大佬,帮忙看看问题在哪。谢谢大家了!
import urllib.request
import re
stock_codeurl="http://product.it168.com/list_0302.html"
def urltolist(url):                                                               
    allCodeList=[]                                                               
html=urllib.request.urlopen(url).read()                                       
    html=html.decode('utf_8')                                                        
    s=r'<li><a target="_blank" href="http://product.it168.com/detail/.*.html">'  
    pat=re.compile(s)                                                              
    code=pat.findall(html)                                                                                                         
    allCodeList.append(code)                                             
    return allCodeList
if __name__ == '__main__':
    allCodeList=urltolist(stock_codeurl)
    print(allCodeList[:10])
运行到这一段输出的就不对,并没有输出10个号码,所以怀疑是前面的decode有问题还是其他的

for code in allCodeList:
    url='http://product.it168.com/detail/+'+code[0]+'.html'
    urllib.request.urlretrieve(url,'D:\\smartphone_price\\'+code[0]+'.csv')

关键词:最终结果 看问题 手机报

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-27 00:53