楼主: bojanliu
9872 11

[学习资料] SPSS 聚类分析 用户分类的思路 [推广有奖]

  • 0关注
  • 0粉丝

大专生

40%

还不是VIP/贵宾

-

威望
0
论坛币
862 个
通用积分
0
学术水平
0 点
热心指数
1 点
信用等级
1 点
经验
417 点
帖子
37
精华
0
在线时间
48 小时
注册时间
2011-9-13
最后登录
2014-3-27

楼主
bojanliu 发表于 2012-9-3 11:28:08 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教一下这么个项目:
假如要为1亿个用户,根据其日常行为特征进行分类,可以描述其日常行为特征的变量有若干:变量A、变量B、变量C、。。。

具体的思路该是什么?

我现在自己的想法是:
从所有用户中随机抽取比如5万个用户,对这5万个用户,按照上述变量进行聚类分析(k-means或系统聚类),然后针对SPSS给出的聚类结果,根据实际研究背景,确定分类结果。

然后该如何对剩下的那(1亿-5万)个用户进行归类操作呢? 是不是根据那5万个分好类的用户,分别确定每一类的阀值,然后将剩下的用户按照这些确定好的阀值归到相应的类别就行了? 那这个阀值该如何确定?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:聚类分析 SPSS PSS k-means means 用户 如何 项目

沙发
sunkist123 发表于 2012-9-3 14:03:09
然后该如何对剩下的那(1亿-5万)个用户进行归类操作呢? 是不是根据那5万个分好类的用户,分别确定每一类的阀值,然后将剩下的用户按照这些确定好的阀值归到相应的类别就行了? 那这个阀值该如何确定?

做一个判别分析就可以了.方法有判别分析,决策树,LOGIST回归等

藤椅
bojanliu 发表于 2012-9-3 14:40:10
sunkist123 发表于 2012-9-3 14:03
然后该如何对剩下的那(1亿-5万)个用户进行归类操作呢? 是不是根据那5万个分好类的用户,分别确定每一类的 ...
恩 那整个的思路就是:先选取一部分样本做聚类分析,然后再做判别分析?


板凳
sam800423 发表于 2012-9-4 10:26:15
不知道做聚类分析的变量是否很多,相关性是否很高,如果变量多相关性高,是否应该先做个因子分析划分出因子在做聚类呢

报纸
bojanliu 发表于 2012-9-4 11:58:54
sam800423 发表于 2012-9-4 10:26
不知道做聚类分析的变量是否很多,相关性是否很高,如果变量多相关性高,是否应该先做个因子分析划分出因子 ...
恩,变量大概有十一二个,有些相关性还是蛮高的,可以考虑先做因子分析。但针对剩下的那些大量数据,该怎样处理呢?  判别分析的前提是要先有明确的类别存在,但现在是这些客户可以分为几类是探索性的。

先做聚类分析得到可以分几类,再做判别分析,得到判别公式,然后将剩下的客户根据公式算出类别,这样的思路可行吗?

有没有达人可以告知一下?

地板
bojanliu 发表于 2012-9-4 13:49:03
dddd

7
阿速度都 发表于 2012-9-4 16:14:13
1亿个用户?{:3_41:}

8
bojanliu 发表于 2012-9-4 17:08:02
阿速度都 发表于 2012-9-4 16:14
1亿个用户?
是的。而且还会源源不断有新样本产生。

9
阿速度都 发表于 2012-9-4 17:46:23
bojanliu 发表于 2012-9-4 17:08
是的。而且还会源源不断有新样本产生。
我对统计几乎毫无概念,虽然学了一点点。
我做过最多的一个实验是27组数据的正交实验,

1亿个——想都不敢想{:3_44:}

10
sunkist123 发表于 2012-9-5 10:14:15
恩,变量大概有十一二个,有些相关性还是蛮高的,可以考虑先做因子分析。但针对剩下的那些大量数据,该怎样处理呢?  判别分析的前提是要先有明确的类别存在,但现在是这些客户可以分为几类是探索性的。

先做聚类分析得到可以分几类,再做判别分析,得到判别公式,然后将剩下的客户根据公式算出类别,这样的思路可行吗?

有没有达人可以告知一下?


可行,难点是抽样做聚类这个过程一定要做好.
比如随机性,样本足够大等

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 04:56