楼主: 时光永痕
637 0

[数据挖掘新闻] ETL 与 ELT:数据集成对决 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)八级

10%

威望
0
论坛币
26 个
通用积分
57.2238
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34180 点
帖子
2732
精华
0
在线时间
321 小时
注册时间
2020-7-21
最后登录
2024-8-1

楼主
时光永痕 学生认证  发表于 2022-8-24 17:29:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
提取-转换-加载与提取-加载-转换

它们都是用于将数据从一个源传输到数据仓库的数据集成方法。尽管他们的方法的目的是相似的,但它们是不同的。



什么是 ETL?


ETL 是将来自多个来源的数据移动到一个集中的单一数据库的过程。原始数据从源中提取,在单独的处理服务器上转换并加载到目标数据库中。

之所以Transform发生在Load之前,是因为提取出来的数据需要符合目标数据库的数据规则。例如,有些数据仓库只能接受基于 SQL 的数据结构。

ETL 方法在某种意义上确保了合规性,即提取的数据以正确的数据形式转换到目标数据库。如果提取的数据没有正确转换,将无法成功移动和加载到数据仓库中。

什么是 ELT?

ELT 不需要为了加载原始数据而进行转换。原始数据被加载到数据仓库中,并在数据仓库中进行转换、数据清洗等目的。

由于数据以原始格式保留在数据仓库中,因此可以进行不同类型的转换和分析。

ELT 对于科技行业来说是相当新的事物,其发展得益于可扩展的基于云的数据仓库。因此,随着时间的推移和越来越多的公司采用云基础设施,您可以看到 ELT 流程也变得越来越流行。

ETL与ELT流程比较
ETLELT
发现已存在 20 多年数据集成方法相当新
提炼使用 API 连接器提取原始数据。使用 API 连接器提取原始数据。
转换原始数据在辅助处理服务器上进行转换。原始数据在目标数据库内部进行转换。
加载原始数据在加载到目标数据库之前必须进行转换。原始数据直接加载到目标数据库中。
时间数据转换导致ETL过程花费大量时间数据转换是并行完成的 - 使其时间有效
隐私在加载数据之前对其进行预转换可以消除个人身份信息 (PII)这需要更多的隐私标准
费用使用二级处理服务器会增加成本由于简化的数据堆栈,成本更低
数据结构结构化的可以是结构化的、半结构化的和非结构化的
数据大小通常用于较小的数据集通常用于较大的数据集
数据集需求复杂的转型速度和效率
重新查询 因为数据在进入目标数据库之前已经转换过了,所以不能重新查询。是的,因为它还没有被改造
数据湖兼容性是的


      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:ELT ETL 数据集

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-3 05:43