现在有客户的基本属性数据(性别、年龄、职业、职位、城市等)和交易数据(交易类型、交易金额),并且这些客户都是买了车的,有相关的车辆品牌、车型、车辆价格等信息。
现在希望用现有的数据给其他没有买车的客户都打上标签,预测他们会买什么车(品牌和车型)。
我是这样考虑的:
1、由于汽车的品牌和车型比较多,而且是分类变量,无法直接预测,所以我用汽车网站的数据,将所有的车型拆分成以下几个指标:价格、舒适性、性价比、空间、动力等,大概7-8个维度,每个车型在不同的维度上都有评分,评分在3-5分之间。
2、建立每个客户对每个评分指标的模型
3、各个指标的预测综合起来可以对应出一款车型。
不知道这样考虑对不对。而且有一个问题,每个维度上的评分都是3-5分之间,保留2位小数。这样的数据能用来做因变量吗?是否需要怎么处理一下呢?
另外,自变量应该如何处理呢?
问题有点复杂,求各位大神帮忙。


雷达卡


京公网安备 11010802022788号







