Druid实时大数据笔记02 -架构

人盡茶涼 提交于 2019-12-24 17:59:42

一,Druid架构预览

 1)实时节点 (realtime node): 实时摄入实时数据,以及生成Segment数据文件。

 2) 历史节点(Historical node): 加载已生成好的数据文件,以供数据查询。

 3) 查询节点 (broker node) : 对外提供数据查询服务,并同时从实时节点与历史节点查询数据,合并后返回给调用方。

 4)协调节点(Coordinator node): 负责历史节点的数据负载均衡,以及通过规则管理数据的生命周期。

同时集群需要以下三类的依赖:

元数据库:存储Druid集群的原数据信息,以及Segment的相关信息 一般用mysql 或 PostgreSQL

 备注,知识点:

1) 二叉查找树 

2)二叉平衡树

 

3) B+树 

B+树也是有缺点的:

最后出现了LSM-tree,Hbase就是使用的LMS-tree:

Druid的架构特点:

所以Druid的架构特点带来的显著优势:

Segment 是数据的实际屋里存储,是按时间范围去存储的,所以查询按时间查询是非常快的。

Druid的扩展:

 

 

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!