楼主: xf503
629 3

[统计软件] 特征工程时,取值只有两种数值的列需要onet-hot编码吗 [推广有奖]

  • 0关注
  • 0粉丝

大专生

96%

还不是VIP/贵宾

-

威望
0
论坛币
118 个
通用积分
0.1692
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
926 点
帖子
34
精华
0
在线时间
13 小时
注册时间
2023-6-14
最后登录
2023-11-6

楼主
xf503 学生认证  发表于 2023-7-24 16:49:29 |只看作者 |坛友微信交流群|倒序 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
特征工程时,取值只有两种数值的列,如某列取值只能是36或者64,该列需要onet-hot编码吗?还是不用处理?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:HOT NET 数据分析 特征工程 onet-hot编码

沙发
att006 发表于 2023-7-24 17:47:56 |只看作者 |坛友微信交流群
只有两种数值的列,如某列取值只能是36或者64,不需要进行 One-Hot 编码。 One-Hot 编码主要用于将具有多个离散取值的列转换为二进制形式,以便机器学习模型能够更好地理解和处理这些离散特征。
当某个列只有两个取值时,例如36或者64,可以将其视为一个二元变量(binary variable)。你可以将其中一个值(例如36)表示为0,另一个值(例如64)表示为1,这样就可以直接在模型中使用这个二元特征。使用 One-Hot 编码在这种情况下不是必要的,因为 One-Hot 编码会引入额外的冗余特征,而且对于只有两个取值的情况,已经能够很好地表达这个特征。将其表示为0和1已经足够传递其信息。
如果有更多的取值,例如三个或更多,才需要考虑使用 One-Hot 编码。而对于二元特征,直接将其用0和1表示就足够了。

使用道具

藤椅
xf503 学生认证  发表于 2023-7-25 16:14:08 |只看作者 |坛友微信交流群
att006 发表于 2023-7-24 17:47
只有两种数值的列,如某列取值只能是36或者64,不需要进行 One-Hot 编码。 One-Hot 编码主要用于将具有多个 ...
感谢兄弟评论,不过感觉一股chartgpt的味道,哈哈哈

使用道具

板凳
att006 发表于 2023-7-25 19:22:23 |只看作者 |坛友微信交流群
xf503 发表于 2023-7-25 16:14
感谢兄弟评论,不过感觉一股chartgpt的味道,哈哈哈
用chartgpt是另一种幸福。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-12-25 02:31