楼主: sigmund
4706 6

[问答] 求助pandas网页数据抓取 [推广有奖]

  • 0关注
  • 2粉丝

已卖:706份资源

教授

37%

还不是VIP/贵宾

-

威望
0
论坛币
241 个
通用积分
324.2047
学术水平
19 点
热心指数
17 点
信用等级
14 点
经验
10467 点
帖子
1379
精华
0
在线时间
1107 小时
注册时间
2005-3-12
最后登录
2025-9-13

楼主
sigmund 在职认证  发表于 2015-2-27 06:58:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如何用pandas抓取网页 http://zh.wikipedia.org/wiki/%E7%9C%81%E4%BC%9A
上的中国各省会经济(2010年)这张表


下面的命令为什只能抓取前面的表,而没有中国各省会经济(2010)这张表。
  1. url = "http://zh.wikipedia.org/wiki/%E7%9C%81%E4%BC%9A"
  2. dfs = pd.read_html(url, attrs={'class': 'wikitable'})
复制代码

谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:pandas panda 数据抓取 Das Wikipedia 中国 网页 如何

沙发
harpbreeze 发表于 2015-2-27 17:19:13
因为这张表的class值是“wikitable sortable"。

藤椅
sigmund 在职认证  发表于 2015-2-28 07:39:59
harpbreeze 发表于 2015-2-27 17:19
因为这张表的class值是“wikitable sortable"。
非常感谢!

板凳
vermouth86 发表于 2015-2-28 12:18:47
学习学习。。。。

报纸
twins913 发表于 2015-3-24 17:21:46
解析网页用BeautifulSoup比较好。

地板
邢不行 在职认证  发表于 2015-4-13 22:16:57
python抓网页请用BeautifulSoup

7
xupengswordsman 发表于 2015-4-20 11:15:19
谢谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-27 04:13