ETL面试题
1.什么是逻辑数据映射?它对
ETL项目组的作用是什么?
答:逻辑数据映射(
Logical Data Map
)用来描述源系统的数据定义、目标数据仓库的模型以及将源系统的数据转换到数据仓库中需要做操作和处理方式的说明文档,一般以表格或
Excel
的格式保存如下的信息:
目标表名:
目标列名:
目标表类型:注明是事实表、维度表或支架维度表。
SCD类型:对于维度表而言。
源数据库名:源数据库的实例名,或者连接字符串。
源表名:
源列名:
转换方法:需要对
源数据做的操作,如
Sum(amount)
等。逻辑数据映射应该贯穿数据迁移项目的始终,在其中说明了数据迁移中的
ETL策略。在进行物理数据映射前进行逻辑数据映射对
ETL项目组是重要的,它起着元数据的作用。项目中最好选择能生成逻辑数据映射的数据迁移工具。
2.在数据仓库项目中,数据探索阶段的主要目的是什么?
答:在逻辑数据映射进行之前,需要首先对所有的源系统进行分析。对源系统的分析一般包括两个阶段,一个是数据探索阶段(
Data Discovery Phase
),另一个是异常数据检测阶段。
数据探索阶段包括以下内容 ...


雷达卡


京公网安备 11010802022788号







