楼主: torrentpien
4173 6

[问答] 有人用R爬过慧科新闻资料库吗? [推广有奖]

  • 0关注
  • 3粉丝

硕士生

65%

还不是VIP/贵宾

-

威望
0
论坛币
51012 个
通用积分
84.1763
学术水平
3 点
热心指数
4 点
信用等级
3 点
经验
838 点
帖子
51
精华
0
在线时间
265 小时
注册时间
2009-11-28
最后登录
2024-3-7

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
慧科(http://wisenews.wisers.net/)收集两岸三地的新闻好像蛮完整的,有没有人用R爬过?例如关键字搜寻事件后抓下来整理?

还是有别的更适合R的新闻资料库?我是想抓取2008至2013年各新闻媒体有报出来的各地环境污染事件。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:资料库 wiser enews WISE HTTP 资料库

沙发
xuruilong100 发表于 2015-9-28 09:14:13 |只看作者 |坛友微信交流群
这个论坛的人水平都很low的,你的工作太高端了,没有人会做的

使用道具

藤椅
ryoeng 在职认证  发表于 2015-9-28 11:23:26 |只看作者 |坛友微信交流群
提示: 作者被禁止或删除 内容自动屏蔽
签名被屏蔽

使用道具

板凳
a524631266 在职认证  发表于 2015-10-3 12:04:00 来自手机 |只看作者 |坛友微信交流群
根据我的想法以及切身实践,抓取指定主题的新闻,相当于统计学机器学习中的文本主题挖掘,分类数据,首先训练好自己的部分符合主题的训练数据,然后根据这个训练过的数据库,去抓取符合规则的文章,当然,你既然是爬数据,那么,如果会用。nutch那是相当不错的,即使不会,你也可以搭建python的相关框架

使用道具

报纸
静息张力656 发表于 2018-12-12 11:06:05 |只看作者 |坛友微信交流群
你好,问题解决了吗?可以加个好友交流一下吗?

使用道具

楼主可以看看这篇文献,今年心理学大会有人提出过

数据挖掘.pdf

110.32 KB

使用道具

7
kaoya008 发表于 2021-10-19 23:10:07 来自手机 |只看作者 |坛友微信交流群
有人有账号吗

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 00:30