楼主: farshot
4140 9

[问答] 【求助】如何使用R,抓取网站文字(微博,人人等)内容? - 该网站需要输入帐号密 [推广有奖]

  • 0关注
  • 0粉丝

高中生

87%

还不是VIP/贵宾

-

威望
0
论坛币
1 个
通用积分
0
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
988 点
帖子
46
精华
0
在线时间
23 小时
注册时间
2007-10-8
最后登录
2022-6-6

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我想使用R语言,抓取 “人人网” 或 “微博” 等网站上的文字内容,进行Text Mining,
但这些网站都需要输入账号和密码。并且想实现实时收集和分析的话不知道该使用什么函数。
请求各位大师们的帮助。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:如何使用 网站文字 Text Mining ning Text 网站文字 人人 密码 如何 微博

沙发
pplain 发表于 2014-6-12 10:02:46 |只看作者 |坛友微信交流群
自己编程或利用第三方工具 更详细的等楼下

使用道具

藤椅
complicated 在职认证  发表于 2014-6-12 18:54:02 |只看作者 |坛友微信交流群
之前李舰大神写过一个rweibo包,不知道现在还能用不了~

使用道具

板凳
马甲1号 发表于 2014-6-12 21:03:48 |只看作者 |坛友微信交流群
complicated 发表于 2014-6-12 18:54
之前李舰大神写过一个rweibo包,不知道现在还能用不了~
今年4月份又升了次级, 没用过...之前是每搜40次会被sina封一次ip...

使用道具

马甲1号 发表于 2014-6-12 21:03
今年4月份又升了次级, 没用过...之前是每搜40次会被sina封一次ip...
ip被封,多久后解封?
我今天跑了18pages的微博数据,然后被封,几个小时了,一直用不了。

使用道具

地板
741panjiali 发表于 2014-6-17 17:18:16 |只看作者 |坛友微信交流群
用vpn啊

使用道具

7
pohys 在职认证  发表于 2014-12-31 23:46:59 |只看作者 |坛友微信交流群
换IP去模拟登录就能抓取到。。

使用道具

8
gssdzc 在职认证  发表于 2015-1-2 11:18:17 |只看作者 |坛友微信交流群
thanks a lot

使用道具

9
wflin 发表于 2015-1-5 20:06:41 |只看作者 |坛友微信交流群
R功能太强了

使用道具

10
xinguanxk 发表于 2015-1-18 12:37:44 |只看作者 |坛友微信交流群
而且现在的话微博都需要验证

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 04:39