请选择 进入手机版 | 继续访问电脑版
楼主: 17854113224
1057 4

[学习分享] 初学R语言,爬取网页数据运行library时,未得到预期结果,如下,期望得到大家的提点 [推广有奖]

  • 0关注
  • 0粉丝

小学生

28%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
46 点
帖子
3
精华
0
在线时间
8 小时
注册时间
2020-6-29
最后登录
2021-7-9

17854113224 发表于 2020-6-29 14:23:32 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
library(rvest)
> library
function (package, help, pos = 2, lib.loc = NULL, character.only = FALSE,
    logical.return = FALSE, warn.conflicts, quietly = FALSE,
    verbose = getOption("verbose"), mask.ok, exclude, include.only,
    attach.required = missing(include.only))
{
    conf.ctrl <- getOption("conflicts.policy")
    if (is.character(conf.ctrl))
        conf.ctrl <- switch(conf.ctrl, strict = list(error = TRUE,
            warn = FALSE), depends.ok = list(error = TRUE, generics.ok = TRUE,
            can.mask = c("base", "methods", "utils",
                "grDevices", "graphics", "stats"),
            depends.ok = TRUE), warning(gettextf("unknown conflict policy: %s",
            sQuote(conf.ctrl)), call. = FALSE, domain = NA))
    if (!is.list(conf.ctrl))
        conf.ctrl <- NULL
    stopOnConflict <- isTRUE(conf.ctrl$error)
    if (missing(warn.conflicts))
        warn.conflicts <- if (isFALSE(conf.ctrl$warn))
            FALSE
        else TRUE

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Library BRARY R语言 rar bra

llb_321 在职认证  发表于 2020-6-29 19:45:53 |显示全部楼层 |坛友微信交流群
您这是base包中library函数的源码。与爬取网页没有关系。

使用道具

17854113224 发表于 2020-6-29 22:22:06 |显示全部楼层 |坛友微信交流群
llb_321 发表于 2020-6-29 19:45
您这是base包中library函数的源码。与爬取网页没有关系。
您好,谢谢您的回答。我之前爬取网页数据的时候运行title时没有结果只有源码,今天运行library和url都出现的是源码,感觉不正常啊,我不要源码,怎么可以让它不出来这个源码呢?

使用道具

llb_321 在职认证  发表于 2020-6-30 06:39:17 |显示全部楼层 |坛友微信交流群
17854113224 发表于 2020-6-29 22:22
您好,谢谢您的回答。我之前爬取网页数据的时候运行title时没有结果只有源码,今天运行library和url都出现 ...
不了解您的知识背景,不过R并不难,就多花点时间吧。
比如说,您要了解网页爬虫方面的东西,其实需要有一些积累的:
1、别急,先熟悉一下R语言环境和基础语法方面的资料,R、RStudio什么的。
2、理一下爬虫相关的技术资料,HTML、XML、AJAX,以及相关的xpath、java、json。不同类型的网页,爬虫机理是不一样的。
3、正则表达式,要花点时间。没这个功底,很多东西做不了。
4、熟悉一下,相关的包,比如rvest、xml2、Rselenium,rjson之类的。
5、有了上面这些技术性准备,就可以找一些案例代码,过一遍,看看别人是怎么做的。
6、最后再做自己的爬虫。
了解一下就好了,不用花太多精力在爬虫上。
已有 1 人评分论坛币 收起 理由
cheetahfly + 20 精彩帖子

总评分: 论坛币 + 20   查看全部评分

使用道具

17854113224 发表于 2020-6-30 09:47:32 |显示全部楼层 |坛友微信交流群
llb_321 发表于 2020-6-30 06:39
不了解您的知识背景,不过R并不难,就多花点时间吧。
比如说,您要了解网页爬虫方面的东西,其实需要有一 ...
嗯嗯,谢谢您

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 20:16