如题,求一个例子,本人小白,不要太复杂,怕看不懂
我看到有一本叫 python网络数据采集 的书,无奈书上的代码都是2.X的,不兼容3.X,我自己也试图写了一些,写不下去了。求大神帮助。
比如,下面代码的那个网页,我想把那个”分红配股“的表格数据下载到CSV。
写了一点
import csv
from urllib.request import urlopen
from bs4 import BeautifulSoup
#比如下面这个网址
html = urlopen("http://quotes.money.163.com/f10/fhpg_600048.html#01d05")
bsObj = BeautifulSoup(html, "html.parser")
#要的数据都在下面这个标签页里
rows = bsObj.findAll("tr", {"class":{"","dbrow"}})
粗粗理解标签<tr>是不是就是换行呢。。。然后里面还有个子标签<td><th>用来区分每个字符串。
我看到书上有下面这段写csv的,但是我不会改成3.x的,求大神帮助一下。
csvFile = open("test.csv", 'wt', newline='', encoding='utf-8')
writer = csv.writer(csvFile)
try:
for row in rows:
csvRow = []
for cell in row.findAll(['td', 'th']):
csvRow.append(cell.get_text())
writer.writerow(csvRow)
finally:
csvFile.close()


雷达卡




京公网安备 11010802022788号







