CloverETL

数据仓库技术概述(一看就是架构师写的,对我极其有用)

霸气de小男生 提交于 2019-12-04 17:37:35
ETL ,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端的过程。 ETL 一词较常用在 数据仓库 ,但其对象并不限于数据仓库。 ETL是构建数据仓库的重要一环,用户从 数据源 抽取出所需的数据,经过 数据清洗 ,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。 信息是现代企业的重要资源,是企业运用科学管理、决策分析的基础。目前,大多数企业花费大量的资金和时间来构建 联机事务处理 OLTP的业务系统和 办公自动化系统 ,用来记录事务处理的各种相关数据。据统计,数据量每2~3年时间就会成倍增长,这些数据蕴含着巨大的商业价值,而企业所关注的通常只占在总数据量的2%~4%左右。因此,企业仍然没有最大化地利用已存在的数据资源,以至于浪费了更多的时间和资金,也失去制定关键商业决策的最佳契机。于是,企业如何通过各种技术手段,并把数据转换为信息、知识,已经成了提高其核心竞争力的主要瓶颈。而ETL则是主要的一个技术手段。 软件名称 Extract-Transform-Load 过 程 数据抽取 、清洗、转换、装载 应 用 Informatica、OWB、DataStage 数据集成 快速实现ETL 工具应用 ETL工具的典型代表有:Informatica