楼主: yaojunyu
5117 15

[有偿编程] 用R采集两个不同网页的数据,整合成dataframe [推广有奖]

11
yaojunyu 发表于 2015-1-10 16:16:50
您抓的数据是对的.实时数据会变的,开赛后会定下来.

12
daishen 发表于 2015-1-10 21:48:27
经楼主提示,前面程序在排序时犯了一个错误,排序是针对所有数据类型才有效,数据类型不能混淆,现在改正过来。
u = 'http://cp.win007.com/handle/handicap.aspx?issuenum=2015004&typeid=1&companyid=3&1420858993000'
asia = u %>% html() %>% html_nodes("i") %>% html_text() %>% str_split(",") %>% do.call(rbind,.) %>% .[,c(2,4,5,6)] %>% as.data.frame
asia = sapply(asia, function(x) as.numeric(as.character(x))) %>% as.data.frame
皇冠亚赔 = asia[order(asia[,1]),][-1]

v = 'http://cp.win007.com/handle/1x2.aspx?issuenum=2015004&typeid=1&companyid=9&1420894723000'
uro = v %>% html() %>% html_nodes("i") %>% html_text() %>% str_split(",") %>% do.call(rbind,.) %>% .[,c(2,7,8,9)] %>% as.data.frame
uro = sapply(uro, function(x) as.numeric(as.character(x))) %>% as.data.frame
威廉欧赔 = uro[order(uro[,1]),][-1]

13
yaojunyu 发表于 2015-1-10 23:24:40
这回对了,谢谢我正在改澳彩的。u = 'http://cp.win007.com/handle/handicap.aspx?issuenum=2015004&typeid=1&companyid=1&1420858993000'这应该是澳彩的表单地址

14
wuchm 发表于 2015-1-11 12:25:54
帮我看看这个帖子  https://bbs.pinggu.org/thread-3450379-1-1.html

能不能写个程序?

15
daishen 发表于 2015-1-11 13:24:58
wuchm 发表于 2015-1-11 12:25
帮我看看这个帖子  https://bbs.pinggu.org/thread-3450379-1-1.html

能不能写个程序?
看了京东的网址,可惜编码是GBK的,解析下来都是乱码,太费时间了,帮不了你。

16
wuchm 发表于 2015-1-11 21:04:24
一般网站的编码是什么呢?
能否详细解释下?
假如抓取美团网深圳电影票房情况,怎么做呢?主要分几步写代码。
我是新手刚入门,非常感谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-27 06:28