【译】How To Size Your Apache Flink® Cluster: A Back-of-the-Envelope Calculation
来自Flink Forward Berlin 2017的最受欢迎的会议是Robert Metzger的“坚持下去:如何可靠,高效地操作Apache Flink”。 Robert所涉及的主题之一是如何粗略地确定Apache Flink集群的大小。 Flink Forward的与会者提到他的群集大小调整指南对他们有帮助,因此我们将他的谈话部分转换为博客文章。 请享用! Flink社区中最常见的问题之一是如何在从开发阶段转向生产阶段时确定群集的大小。 对这个问题的明确答案当然是“它取决于”,但这不是一个有用的答案。 这篇文章概述了一系列问题,要求您提供一些可用作指导的数字。 做计算并建立基线 第一步是仔细考虑应用程序的运营指标,以获得所需资源的基线。 要考虑的关键指标是: 每秒记录数和每条记录的大小 您拥有的不同key的数量以及每个key的状态大小 状态更新的数量和状态后端的访问模式 最后,更实际的问题是您的服务水平协议(SLA)与客户的停机时间,延迟和最大吞吐量有关,因为这些直接影响您的容量规划。 接下来,根据您的预算查看您可用的资源。例如: 网络容量,考虑到也使用网络的任何外部服务,如Kafka,HDFS等。 您的磁盘带宽,如果您依赖于基于磁盘的状态后端(如RocksDB)(并考虑其他磁盘使用,如Kafka或HDFS) 机器的数量以及它们可用的CPU和内存 基于所有这些因素