数据管理,数据治理,数据中心,数据中台,数据湖这下就分清楚了!
随着信息技术的不断涌现和普及,业务发展加快了数据膨胀的速度,行业内衍生了较多的新名词,如数据治理、数据管理、数据资源管理、数据资产管理等名词的定义很多,概念容易混淆,本文对这些名词术语及内涵进行系统的解析,便于读者对数据相关的概念有全面的认识。 >>>> 数据治理和数据管理 简单来说治理就是管理的管理。 管理你得遵循一定得标准规范体系,一定得流程,一定得组织角色分工,而这些内容就必须先通过数据治理定义清楚。管理只是根据数据治理规范体系去执行管理和监督的职责。管理执行的依据是治理规范体系。 如下图: 数据中台和数据湖 这个要解释清楚不太容易,因此我尽量做简化。 数据湖一般是公有云服务商提出的一个概念,即企业的结构化,非结构化数据都可以全部采集和存储到我这里来。数据湖就是一个大的存储站,这个存储是分布式可无限扩展的,存储过来的数据也不会去清洗和加工,尽量保持原样。 在存过来后,数据湖再提供一些标准的开放接口给你使用数据,这些接口包括了查询SQL类接口,计算引擎接口,流处理接口等。提供接口的目的也很简单,就是能够方便得使用你存储过来的数据。 数据湖的存储一般是分布式对象存储或分布式文件存储,即使你是结构化数据库采集过来的数据,仍然会转成统一的存储方法,方便扩展。 数据中台简单来说就是企业共享数据能力下沉并对外开放。 数据中台包括了底层数据技术平台(可以是我们熟悉的大数据平台能力)