| 所在主题: | |
| 文件名: data.txt | |
| 资料下载链接地址: https://bbs.pinggu.org/a-1789864.html | |
| 附件大小: | |
|
有一份新闻内容的文本数据需要先做聚类,聚类后用cutree查看分类情况,想把得出的新闻的类别加入到另一份用户浏览过新闻的数据中,但是用户的新闻数据有重复项,该如何导入是用户新闻数据中能多一列显示新闻的类别?然后还要变成向量,每个用户间做余弦乘积,算余弦相似性,这又怎么写啊?还要选出与每个用户最相似的5个,提取出这五个人中共同看过且原用户没看过的最新的新闻。R新手,完全没思路啊...... 希望各位大神能写的具体些,给个大方向还是不太懂啊,时间紧任务重,望各路神仙都帮帮忙啦~~~~小女子先在此谢过!
|
|
熟悉论坛请点击新手指南
|
|
| 下载说明 | |
|
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。 2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。 3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。 (如有侵权,欢迎举报) |
|
京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明