楼主: 我就是只猫
4137 5

[问答] R语言聚类后想把cutree变成向量导入别的数据及用向量算余弦相似性等,目标是新闻预测 [推广有奖]

  • 0关注
  • 1粉丝

已卖:3份资源

大专生

43%

还不是VIP/贵宾

-

威望
0
论坛币
110 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
326 点
帖子
57
精华
0
在线时间
39 小时
注册时间
2014-7-16
最后登录
2015-5-23

楼主
我就是只猫 发表于 2015-5-11 11:43:57 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有一份新闻内容的文本数据需要先做聚类, body1.txt (4.14 MB) 聚类后用cutree查看分类情况,想把得出的新闻的类别加入到另一份用户浏览过新闻的数据中, data.txt (11.99 MB) 但是用户的新闻数据有重复项,该如何导入是用户新闻数据中能多一列显示新闻的类别?然后还要变成向量,每个用户间做余弦乘积,算余弦相似性,这又怎么写啊?还要选出与每个用户最相似的5个,提取出这五个人中共同看过且原用户没看过的最新的新闻。R新手,完全没思路啊...... 希望各位大神能写的具体些,给个大方向还是不太懂啊,时间紧任务重,望各路神仙都帮帮忙啦~~~~  小女子先在此谢过!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Tree 相似性 cut R语言 文本数据 如何 用户

沙发
我就是只猫 发表于 2015-5-11 11:47:42
能有R语句表达思路就好,不一定要运行出结果来,大家多帮忙啊

藤椅
我就是只猫 发表于 2015-5-12 09:53:13
自己顶一下,求助啊

板凳
我就是只猫 发表于 2015-5-13 10:39:00
不太会用这个论坛,如果有人能写出来可以申请奖励,我可以给大家论坛币

报纸
文森66 发表于 2015-5-13 21:59:20
先做词频统计吧,然后按距离聚类,最后.......

地板
我就是只猫 发表于 2015-5-14 20:24:27
文森66 发表于 2015-5-13 21:59
先做词频统计吧,然后按距离聚类,最后.......
你说的这两步我都做过了,怎么还不说完啊

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 13:03