楼主: 壶中乾坤
1324 3

[统计软件] KNN 算法数据归一化问题 [推广有奖]

  • 0关注
  • 0粉丝

初中生

33%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
45706 点
帖子
4
精华
0
在线时间
24 小时
注册时间
2017-1-8
最后登录
2020-2-10

楼主
壶中乾坤 发表于 2019-4-11 11:09:31 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
KNN算法数据归一化方式只由训练集数据决定呀?我们归一化的目的不是只是为了防止量纲导致距离有某些变量决定嘛,那现在我假设有训练集和测试集,先取出一条测试集与训练集混合一起归一化,这样的做法有什么潜在的问题呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据归一化 训练集 归一化 测试集 潜在的

沙发
foozhencheng 学生认证  发表于 2019-4-11 11:20:22 来自手机
壶中乾坤 发表于 2019-4-11 11:09
KNN算法数据归一化方式只由训练集数据决定呀?我们归一化的目的不是只是为了防止量纲导致距离有某些变量决定 ...
归一化的参数也是模型的一部分,用了测试集的数据相当于已经用了未来数据了。
已有 1 人评分论坛币 收起 理由
iRolly + 5 热心帮助其他会员

总评分: 论坛币 + 5   查看全部评分

藤椅
壶中乾坤 发表于 2019-4-11 11:24:25 来自手机
foozhencheng 发表于 2019-4-11 11:20
归一化的参数也是模型的一部分,用了测试集的数据相当于已经用了未来数据了。
如果测试集中的数据按照训练集数据归一化方式处理并没有将取值scale到0-1之间,那么这样的数据还需要做预测吗?我听我们老师上课的意思是默认训练集和测试集来自同一个分布,对于特殊值就不预测了

板凳
foozhencheng 学生认证  发表于 2019-5-10 11:02:09
壶中乾坤 发表于 2019-4-11 11:24
如果测试集中的数据按照训练集数据归一化方式处理并没有将取值scale到0-1之间,那么这样的数据还需要做预 ...
没有取值到0~1之间也要按照训练集的归一化方式处理,这也是用极值归一化的一个问题,一般来说可以采用标准化的方式,即减去平均值再除以标准差,有些时序数据还会去掉关联,可以参考白噪声化。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-3 14:49