楼主: wqf_cufe
12133 41

[有偿编程] 求助用R进行融资融券数据的网页抓取 [推广有奖]

21
daishen 发表于 2015-1-8 16:50:17
dat$日期= sapply(1:nrow(dat),function(i)str_extract(dat[i,1],"\\d{4}-\\d{2}-\\d{2}"))


22
daishen 发表于 2015-1-8 16:51:49
dat$成交量 = sapply(1:nrow(dat),function(i) str_extract(dat[i,6],"\\d+"))

23
daishen 发表于 2015-1-8 16:52:57

dat$成交额 = sapply(1:nrow(dat),function(i) str_extract(dat[i,7],"\\d+"))
只能这样才显示正常
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
wqf_cufe + 5 + 5 + 5 + 5 精彩帖子

总评分: 论坛币 + 5  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

24
wqf_cufe 发表于 2015-1-8 23:21:29
dataorz 发表于 2015-1-8 10:55
网页 2
u = "http://app.finance.ifeng.com/hq/stock_daily.php?code=sh600030"
url = htmlParse(u, enco ...
我想多截取一些网页3里面的数据,但是这个是在网页里面进行查询的,能否给个代码?谢谢

25
wqf_cufe 发表于 2015-1-9 11:45:12
daishen 发表于 2015-1-8 16:52
dat$成交额 = sapply(1:nrow(dat),function(i) str_extract(dat,"\\d+"))
只能这样才显示正常
请问你这里有没有其它的办法去掉这些数值后面的乱码呢?因为我想放到shiny里面,但是shiny不支持多字节字符,谢谢!!!

26
daishen 发表于 2015-1-9 12:06:38
用这个更简洁:

dat$日期 = str_extract(dat[,1],"\\d{4}-\\d{2}-\\d{2}")


27
daishen 发表于 2015-1-9 12:07:36
dat$成交量 = str_extract(dat[,6],"\\d+")

28
daishen 发表于 2015-1-9 12:08:14
dat$成交额 = str_extract(dat[,7],"\\d+")

29
daishen 发表于 2015-1-9 12:08:49
dat$涨跌幅 = str_replace(dat[,9],"%","")

30
wqf_cufe 发表于 2015-1-9 12:12:23
daishen 发表于 2015-1-9 12:08
dat$涨跌幅 = str_replace(dat[,9],"%","")
我只需要成交额这个数据,但是不能含有“//”,您看看有什么其它的办法?谢谢!!!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 10:31