看到版内有发去新浪财经爬取数据的帖子,让我想起之前写爬虫爬各大网站的历史,中间也是经过了各种波折,其实有的结构和数据不需要再去新浪财经爬取了,有的平台就可以提供,最有名的就是tushare和通联了,但是我今天推荐一个最近出来的数据平台,baostock:http://www.baostock.com 首先需要安装baostock库: pip install baostock
比如,要获取一只股票,600000的季报中有关盈利信息的数据
import baostock as bsimport pandas as pd# 登陆系统lg = bs.login(user_id="anonymous", password="123456")# 显示登陆返回信息print('login respond error_code:'+lg.error_code)print('login respond error_msg:'+lg.error_msg)# 查询季频估值指标盈利能力profit_list = []rs_profit = bs.query_profit_data(code="sh.600000", year=2017, quarter=2)while (rs_profit.error_code == '0') & rs_profit.next(): profit_list.append(rs_profit.get_row_data())result_profit = pd.DataFrame(profit_list, columns=rs_profit.fields)# 打印输出print(result_profit)# 结果集输出到csv文件result_profit.to_csv("D:\\profit_data.csv", encoding="gbk", index=False)# 登出系统bs.logout()
就可以获取600000,2017年第二季度的利润表的相关数据了。如roeAvg,npMargin,netProfit,epsTTM等。


雷达卡





京公网安备 11010802022788号







