SAS Data Integration Studio的目的是将不同数据源进行协调,统一数据,SAS提供的以下数据整合途径。
1. SAS Data Integration Studio的连接性和元数据功能。通过不同数据源,共享的元数据环境提供了一致的数据定义,SAS软件容许我们进行数据连接、获取,并且可以以多种方式存储数据,在不同环境或应用平台上应用数据流、程序等。例如,我们可以在企业资源计划(Enterprise Resource Planning)系统、关系数据库管理系统(RDBMS)、平面文件、传统系统、信息列、可扩展标示语言(Extensive Makeup Language)中进行信息管理。
2. SAS Data Integration Studio的数据清理和浓缩功能。SAS Data Integration Studio软件可以为我们配置文件、清理、增强,监测数据来创建一致、可靠的数据信息,并提供数据转换和改善数据的一系列的功能。
3. SAS Data Integration Studio的提取、转换和加载功能。SAS Data Integration Studio可以为我们执行跨企业间的数据提取、转换和加载,创建一致、有效的信息。他提供了点击界面,使设计者可以很方便的建立数据流、迅速识别输入和输出系统、在元数据里建立商业规则,这些都将有利于快速生成数据库、数据流、数据集。
4. SAS Data Integration Studio的迁移和同步功能。SAS Data Integration Studio执行的迁移和同步功能,可以在不同的数据源和系统里进行。数据转换可供更改、重新格式化与合并信息。当数据被复制、移动、或同步操作时,实时数据质量集成允许净化数据,并且我们能很容易的建立符合商业规则的、可重复使用的应用库。
5. SAS Data Integration Studio的数据联合功能。SAS Data Integration Studio可以使我们无需移动实际数据的情况下,进行多系统的数据查询、使用功能。他提供了一个虚拟环境用于访问数据结构、企业资源计划(Enterprise Resource Planning)系统、关系数据库管理系统(RDBMS)、平面文件、传统系统、信息列、可扩展标示语言(Extensive Makeup Language)等,另外SAS Data Integration Studio可以在虚拟环境和实事访问间实现数据连接,分析。在语义商业元数据层隐藏着这来自上一级的员工信息的复杂数据。
6. SAS Data Integration Studio的主数据功能。SAS Data Integration Studio可以从多个数据源里创建统一的数据视图。输入和输出数据源的语义数据描述可以单独识别每个实例的业务元素(如客户、产品、账户等),规范的主数据模型提供事实的单一通道,以确保数据在转换和嵌入时的正确性。
SAS Data Integration Studio的优点
SAS Data Integration Studio在项目分析上有很多优势,大量的自定义代码和多功能间的完善空间很大。
1. 如果希望快速生产大型的数据仓库、数据集和数据流,SAS Data Integration Studio可以大大的降低项目开发时间。
2. SAS Data Integration Studio可以通过提供不同组织间的协作、代码的可重复利用和通用元数据库等技术,来控制成本。
3. 通过多平台的可伸缩性和互操作性,增加现有IT投资回报率
4. SAS Data Integration Studio软件可用于创建可重复使用,易于修改,便于储存数据的过程流,该过程流可以实现文档自动化和数据的沿袭分析(data lineage analysis)等功能。
SAS Data Integration Studio环境
管理员组使用SAS Management Console连接SAS Metadata Server。当通过网络进入元数据的服务器、数据库或其他数据源时,就可以存储这些元数据。SAS Data Integration Studio连接相同元数据库和不同的库或表后,开始创建过程流来读取数据源表和目标表,并创建物理存储。
注:部分翻译官方,翻译的不好请见谅!