楼主: 我就是只猫
3808 5

[问答] R语言聚类后想把cutree变成向量导入别的数据及用向量算余弦相似性等,目标是新闻预测 [推广有奖]

  • 0关注
  • 1粉丝

大专生

43%

还不是VIP/贵宾

-

威望
0
论坛币
110 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
326 点
帖子
57
精华
0
在线时间
39 小时
注册时间
2014-7-16
最后登录
2015-5-23

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有一份新闻内容的文本数据需要先做聚类, body1.txt (4.14 MB) 聚类后用cutree查看分类情况,想把得出的新闻的类别加入到另一份用户浏览过新闻的数据中, data.txt (11.99 MB) 但是用户的新闻数据有重复项,该如何导入是用户新闻数据中能多一列显示新闻的类别?然后还要变成向量,每个用户间做余弦乘积,算余弦相似性,这又怎么写啊?还要选出与每个用户最相似的5个,提取出这五个人中共同看过且原用户没看过的最新的新闻。R新手,完全没思路啊...... 希望各位大神能写的具体些,给个大方向还是不太懂啊,时间紧任务重,望各路神仙都帮帮忙啦~~~~  小女子先在此谢过!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Tree 相似性 cut R语言 文本数据 如何 用户

沙发
我就是只猫 发表于 2015-5-11 11:47:42 |只看作者 |坛友微信交流群
能有R语句表达思路就好,不一定要运行出结果来,大家多帮忙啊

使用道具

藤椅
我就是只猫 发表于 2015-5-12 09:53:13 |只看作者 |坛友微信交流群
自己顶一下,求助啊

使用道具

板凳
我就是只猫 发表于 2015-5-13 10:39:00 |只看作者 |坛友微信交流群
不太会用这个论坛,如果有人能写出来可以申请奖励,我可以给大家论坛币

使用道具

报纸
文森66 发表于 2015-5-13 21:59:20 |只看作者 |坛友微信交流群
先做词频统计吧,然后按距离聚类,最后.......

使用道具

地板
我就是只猫 发表于 2015-5-14 20:24:27 |只看作者 |坛友微信交流群
文森66 发表于 2015-5-13 21:59
先做词频统计吧,然后按距离聚类,最后.......
你说的这两步我都做过了,怎么还不说完啊

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-8 11:07