楼主: 我是小趴菜
586 1

[数据挖掘新闻] 数据预处理的首要步骤 [推广有奖]

  • 0关注
  • 4粉丝

教授

35%

还不是VIP/贵宾

-

威望
0
论坛币
29650 个
通用积分
380.5350
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
7150 点
帖子
670
精华
0
在线时间
37 小时
注册时间
2022-8-30
最后登录
2023-4-4

楼主
我是小趴菜 发表于 2022-10-27 11:28:28 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据预处理的首要步骤是要对数据进行字段选择(Attribute Selection),字段选择包括数据整合(Data Integration)和数据过滤两个方面(Data Filtering)。数据整合是将不同来源的数据整合在一个数据库中的过程。因为数据的来源不同,数据可能会出现不一致的情况,包括数据结构不一致、属性名不一致和属性值不一致。例如:不同来源的收入表,可能以人民币做单位,也可能以美元做单位,因此在数据整合的过程中要将两种单位统一,从而消除数据不一致。数据在整合的过程中,也会出现重复的情况,比如A数据表和B数据表都有某会员的信息,而且信息相同,这时信息重复,我们要对其中一个信息进行消除;如果A数据表和B数据表都有某会员的信息,但是信息不同,这时两个表里的本应该向同的信息不能匹配,说明是错误信息,需要删除。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据预处理 预处理 Integration attribute Selection

沙发
三江鸿 发表于 2022-10-27 12:07:43 来自手机
点个赞加点人气
感谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-22 10:08