请教一下这么个项目:
假如要为1亿个用户,根据其日常行为特征进行分类,可以描述其日常行为特征的变量有若干:变量A、变量B、变量C、。。。
具体的思路该是什么?
我现在自己的想法是:
从所有用户中随机抽取比如5万个用户,对这5万个用户,按照上述变量进行聚类分析(k-means或系统聚类),然后针对SPSS给出的聚类结果,根据实际研究背景,确定分类结果。
然后该如何对剩下的那(1亿-5万)个用户进行归类操作呢? 是不是根据那5万个分好类的用户,分别确定每一类的阀值,然后将剩下的用户按照这些确定好的阀值归到相应的类别就行了? 那这个阀值该如何确定?


雷达卡



京公网安备 11010802022788号







