<P>格式:PDF</P>
<P>资料简介:</P>
<P>摘 要: 为了满足分布式应用系统中的数据质量要求,需要设计数据清洗方法与构件的共享环境。提出了数<BR>据清洗方法与构件的综合模型,阐述方法模型、过程模型和构件模型,以满足使用构件时的检索和选用要求。通过<BR>一种网络映射图方法,描述过程模型与方法模型的组合特征,并给出了数据清洗方法实例。在数据清洗构件的描述<BR>方面, 给出了基于形式语言的构件描述, 采用XML Schema 设计了Header、Deployment 、Form、Function 和<BR>Implementation 共5 种刻面及其它们的子刻面。以数据删除任务为例,详细阐述了数据删除与恢复方法的设计过程<BR>和算法描述,给出了相应构件的XML 模式表示与实现的操作界面。提出的方法与构件综合技术已在实际科研项目<BR>中发挥重要作用。<BR> 关键词: 数据清洗; 方法; 构件; 模型; 可扩展标记语言<BR> 中图分类号: TP311 ; TP182 文献标识码: A<BR> 在分布式应用系统中,为了保证数据质量,必须<BR> 采用ETL ( Ext raction , Transformation and Loading)<BR> 技术,包括数据抽取、数据清洗、数据转换和数据........... </P>