楼主: 万人往LVR
1572 3

[问答] 求一个粗略的爬虫程序,思路也行 [推广有奖]

  • 1关注
  • 13粉丝

副教授

82%

还不是VIP/贵宾

-

威望
0
论坛币
5127 个
通用积分
816.1888
学术水平
70 点
热心指数
112 点
信用等级
40 点
经验
9088 点
帖子
625
精华
0
在线时间
1182 小时
注册时间
2013-7-18
最后登录
2023-12-6

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在淘宝或者天猫任意一件商品页面,例如http://detail.tmall.com/item.htm?id=43502289962
直接爬取的话很简单。
我现在要做的是爬取交易记录。捕捉到交易记录的url为
http://ext-mdskip.taobao.com/extension/dealRecords.htm?_ksTS=1436953640869_2388&callback=jsonp2389&bid_page=1&page_size=15&is_start=false&item_type=b&ends=1437017185000&starts=1436412385000&item_id=3991162984
但事实上这是一个一次性的链接,只要用一次就失效了。

请诸位大神给出一个爬这个数据的程序,多谢!

思路现在有两个,但是都不会具体操作
1.伪装浏览器,获取上面的url
2.api接口
如果大神们有思路,希望讲的详细一点。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Extension RECORDS Record Taobao detail 爬虫 python scrapy urllib ghost

沙发
python爱好者 发表于 2015-7-16 17:24:21 |只看作者 |坛友微信交流群
请看
https://bbs.pinggu.org/thread-3718062-1-1.html

使用道具

藤椅
万人往LVR 在职认证  发表于 2015-7-16 22:49:44 |只看作者 |坛友微信交流群
python爱好者 发表于 2015-7-16 17:24
请看
https://bbs.pinggu.org/thread-3718062-1-1.html
你好,这个视频没有解决我的问题

之前能查到的方法都是有url的

但我的问题是,抓包获得的url失效了,因为这个url是一次性的,浏览器用url了以后python不能再使用了。

所以真正的问题就是:通过一个天猫商品url,点击交易记录后,(不通过浏览器)如何获得交易记录的url

使用道具

板凳
1971525010 发表于 2015-7-17 20:21:24 |只看作者 |坛友微信交流群
关于问题“1.伪装浏览器,获取上面的url”,推荐利用python selenium,这个是可以模拟浏览器进行网页测试的,很实用也很方便,它可以模拟鼠标点击按钮,按照各种形式定位html控件。
关于问题“2.api接口”如果确实需要用selenium可以回复我。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 18:31