NiFi vs StreamSets(SDC)
NiFi vs StreamSets(SDC) Posted on 2019-01-07 | Symbols count in article: 2.3k | Reading time ≈ 0:02 前面几篇文章分别介绍了 NiFi 和 StreamSets Data Collector (以下简称 SDC) 在一些场景下的使用配置,本文从几个维度简单对比这两个开源的DFM (Data Flow Management) 产品 数据流的定义 作为一款数据流处理平台,灵活的定义和管理数据流是最基本的能力 NiFi 的核心是对 Flowfile 生命周期的管理,核心组件 Processor、Flowfile Repo、FlowContent Repo、Data provenance 都是为其提供服务 在 NiFi 中,Processor 会对 Flowfile 进行 route、copy、modify、terminate 等操作,来完成对流式数据的管理,对不同状态的 Flowfile 都可以分出不同的数据流去处理 转存失败 重新上传 取消 转存失败 重新上传 取消 转存失败 重新上传 取消 而 SDC 没有 NiFi 那么灵活,首先 SDC 中限定了 Processor 的类型 SDC 中只有以下几种类型的 Processor Origin:数据源,用来生产数据 Processor