楼主: farshot
4684 9

[问答] 【求助】如何使用R,抓取网站文字(微博,人人等)内容? - 该网站需要输入帐号密 [推广有奖]

  • 0关注
  • 0粉丝

高中生

90%

还不是VIP/贵宾

-

威望
0
论坛币
1 个
通用积分
0
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
985 点
帖子
45
精华
0
在线时间
24 小时
注册时间
2007-10-8
最后登录
2024-5-2

楼主
farshot 发表于 2014-6-12 09:57:28 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我想使用R语言,抓取 “人人网” 或 “微博” 等网站上的文字内容,进行Text Mining,
但这些网站都需要输入账号和密码。并且想实现实时收集和分析的话不知道该使用什么函数。
请求各位大师们的帮助。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:如何使用 网站文字 Text Mining ning Text 网站文字 人人 密码 如何 微博

沙发
pplain 发表于 2014-6-12 10:02:46
自己编程或利用第三方工具 更详细的等楼下

藤椅
complicated 在职认证  发表于 2014-6-12 18:54:02
之前李舰大神写过一个rweibo包,不知道现在还能用不了~

板凳
马甲1号 发表于 2014-6-12 21:03:48
complicated 发表于 2014-6-12 18:54
之前李舰大神写过一个rweibo包,不知道现在还能用不了~
今年4月份又升了次级, 没用过...之前是每搜40次会被sina封一次ip...

报纸
我是一只小雪糕 发表于 2014-6-13 15:11:45
马甲1号 发表于 2014-6-12 21:03
今年4月份又升了次级, 没用过...之前是每搜40次会被sina封一次ip...
ip被封,多久后解封?
我今天跑了18pages的微博数据,然后被封,几个小时了,一直用不了。

地板
741panjiali 发表于 2014-6-17 17:18:16
用vpn啊

7
pohys 在职认证  发表于 2014-12-31 23:46:59
换IP去模拟登录就能抓取到。。

8
gssdzc 在职认证  发表于 2015-1-2 11:18:17
thanks a lot

9
wflin 发表于 2015-1-5 20:06:41
R功能太强了

10
xinguanxk 发表于 2015-1-18 12:37:44
而且现在的话微博都需要验证

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-19 13:58