ETL数据仓库技术概念与工具
目录 简介 ETL与ELT 工具 参见 ETL架构级别概述 数据的抽取(Extract) 数据的清洗转换(Cleaning、Transform) ETL日志、警告发送 ETL特点 案例参考 ETL ,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。 ETL 一词较常用在 数据仓库 ,但其对象并不限于 数据仓库 。 数据仓库是数据库的更高层次的应用,数据仓库的数据是历史的不可更改的,只有在全局逐步演进的数据才允许更新,与数据挖掘有关,主要是为大数据分析和领导决策使用。 数据仓库架构图 简介 ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI( 商业智能 )项目重要的一个环节。 ETL与ELT ETL 所描述的过程,一般常见的作法包含 ETL 或是 ELT (Extract-Load-Transform),并且混合使用。通常愈大量的数据、复杂的转换逻辑、目的端为较强运算能力的 数据库 ,愈偏向使用 ELT ,以便运用目的端 数据库 的平行处理能力。 工具 ETL (or ELT )的流程可以用任何的编程语言去开发完成,由于ETL是极为复杂的过程