请选择 进入手机版 | 继续访问电脑版
1513 4

[问题] 关于数据标准化 [推广有奖]

  • 6关注
  • 1粉丝

博士生

24%

还不是VIP/贵宾

-

TA的文库  其他...

人大统计2014

威望
0
论坛币
8223 个
通用积分
9.0234
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
1776 点
帖子
72
精华
0
在线时间
402 小时
注册时间
2012-5-31
最后登录
2024-3-28

5论坛币
     手头的资料大多都是分类定性变量,那么该不该做数据标准化呢?以前学习的方法大都是针对定量数据的,而且本人分析的目的主要是预测,并不想直接用离差标准化法,即减去最小值再除以离差的做法处理,请问还有什么好的方法对定性数据做标准化吗?谢谢!

关键词:数据标准化 数据标准 标准化 学习的方法 定性数据 而且 资料
木有人看到这个帖子。嗨。

使用道具

YasselBing 学生认证  发表于 2015-5-6 09:17:04 |显示全部楼层 |坛友微信交流群
你说的只有定性数据是指的特征值都是定性的吗?
比如电影类别有(武打、言情),然后根据(主演的主要作品类别、剧中是否有武器)这样的特征去分类预测?

这样用KNN聚类就可以呀,计算当前特征与类别特征的距离,取前K个最短距离中最多的那个类标号就可以了。
已有 1 人评分论坛币 收起 理由
admin_kefu + 20 热心帮助其他会员

总评分: 论坛币 + 20   查看全部评分

使用道具

YasselBing 发表于 2015-5-6 09:17
你说的只有定性数据是指的特征值都是定性的吗?
比如电影类别有(武打、言情),然后根据(主演的主要作品 ...
当前特征与类别特征的距离?怎么算?

使用道具

hzcmaster 发表于 2015-5-20 13:44:44 |显示全部楼层 |坛友微信交流群
数据标准化的目的是为了在同一个标准下进行比较,打个比方说,中国人均收入3000元每月,美国人均收入800刀每月,你说谁的生活更幸福点?不好说,不是一个标准没法衡量。更直观的例子如,预测GDP都按亿元为单位,残差平方和一般是几点几,你要按元来算,残差平方和得上十位数,同一种预测方法,不同的残差平方和,你说怎么比。所以你要是为了跟别人比较预测方法的好坏,你就得标准化,你要只是为了得到某种结论,比如分类、聚类等等,那就无所谓标准化,给某个属性赋值就ok了,比如武打按1~9设置武打程度等等。
已有 1 人评分论坛币 收起 理由
admin_kefu + 20 热心帮助其他会员

总评分: 论坛币 + 20   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 16:41