Storm基本原理概念及基本使用
Storm基本原理概念及基本使用 https://www.cnblogs.com/swordfall/p/8821453.html 1. 背景介绍 1.1 离线计算是什么 离线计算:批量获取数据、批量传输数据、周期性批量计算数据、数据展示; 代表技术:Sqoop批量导入数据、HDFS批量存储数据、MapReduce批量计算数据、Hive批量计算数据 1.2 流式计算是什么 流式计算:数据实时产生、数据实时传输、数据实时计算、实时展示 代表技术:Flume实时获取数据、Kafka/metaq实时数据存储、Storm/JStorm实时数据计算、Redis实时结果缓存、持久化存储(mysql) 一句话总结:将源源不断产生的数据实时收集并实时计算,尽可能快的得到计算结果 1.3 Storm是什么 Storm用来实时处理数据,特点:低延迟、高可用、分布式、可扩展、数据不丢失。提供简单容易理解的接口,便于开发。 1.4 Storm与Hadoop的区别 1. Storm用于实时计算,Hadoop用于离线计算; 2. Storm处理的数据保存在内存中,源源不断;Hadoop处理的数据保存在文件系统中,一批一批; 3. Storm的数据通过网络传输进来;Hadoop的数据保存在磁盘中; 4. Storm与Hadoop的编程模型相似; 2. Storm核心组件 组件说明补充: Nimbus