spark-submit部署应用的相关参数详解
a.[--master]:表示要连接的集群管理器 spark://host:port:连接到指定端口的Spark独立集群上。默认情况下Spark 独立主节点使用7077端口 mesos://host:port:连接到指定端口的Mesos 集群上。默认情况下Mesos 主节点监听5050端口 yarn :连接到一个YARN 集群。当在YARN上运行时,需要设置环境变量HADOOP_CONF_DIR指向Hadoop 配置目录,以获取集群信息 local:运行本地模式,使用单核 local[N]:运行本地模式,使用N个核心 local[*]:运行本地模式,使用尽可能多的核心 b.[--deploy-mode]:选择driver驱动管理器在“client”和“cluster”运行; 在集群管理器上,如果是“client”提交,那么驱动管理器在client运行; 如果是“cluster”提交,那么驱动管理器在集群上运行; 如:在spark on yarn模式下: 在slave1节点上执行:{spark-submit --master yarn --deploy-mode client},那么spark-submit守护进程在slave1上 在slave1节点上执行:{spark-submit --master yarn --deploy