有约2万个关键词,及其两两共现次数和ochiia系数(可以理解为共现强度),数据形式是四列约25万行(没有共现的就没有这一行),第一列是关键词A,第二列是关键词B,第三列是共现次数,第四列是共现强度。数据来源是4万篇论文,同一篇论文的关键词视为“共现”。现在希望将这2万个关键词分为十类左右,简单的认为一类关键词代表了一类主题的论文。使用ucinet绘图不能看到全部2万个点(关键词),并且具体哪个点属于哪一类还需要人工标注,工作量太大。希望得到的结果是两列,第一列关键词,第二列所属类别。不知道如何实现,还望各位前辈不吝赐教。