楼主: torrentpien
4707 6

[问答] 有人用R爬过慧科新闻资料库吗? [推广有奖]

  • 0关注
  • 3粉丝

已卖:411份资源

硕士生

70%

还不是VIP/贵宾

-

威望
0
论坛币
44793 个
通用积分
83.5763
学术水平
3 点
热心指数
4 点
信用等级
3 点
经验
838 点
帖子
51
精华
0
在线时间
274 小时
注册时间
2009-11-28
最后登录
2025-9-5

楼主
torrentpien 学生认证  发表于 2015-9-28 00:24:52 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
慧科(http://wisenews.wisers.net/)收集两岸三地的新闻好像蛮完整的,有没有人用R爬过?例如关键字搜寻事件后抓下来整理?

还是有别的更适合R的新闻资料库?我是想抓取2008至2013年各新闻媒体有报出来的各地环境污染事件。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:资料库 wiser enews WISE HTTP 资料库

沙发
xuruilong100 发表于 2015-9-28 09:14:13
这个论坛的人水平都很low的,你的工作太高端了,没有人会做的

藤椅
ryoeng 在职认证  发表于 2015-9-28 11:23:26
提示: 作者被禁止或删除 内容自动屏蔽
签名被屏蔽

板凳
a524631266 在职认证  发表于 2015-10-3 12:04:00 来自手机
根据我的想法以及切身实践,抓取指定主题的新闻,相当于统计学机器学习中的文本主题挖掘,分类数据,首先训练好自己的部分符合主题的训练数据,然后根据这个训练过的数据库,去抓取符合规则的文章,当然,你既然是爬数据,那么,如果会用。nutch那是相当不错的,即使不会,你也可以搭建python的相关框架

报纸
静息张力656 发表于 2018-12-12 11:06:05
你好,问题解决了吗?可以加个好友交流一下吗?

地板
老徐的董秋迪 发表于 2018-12-14 08:26:14
楼主可以看看这篇文献,今年心理学大会有人提出过

7
kaoya008 发表于 2021-10-19 23:10:07 来自手机
有人有账号吗

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-9 08:58