Spark的Yarn模式
Spark基础理论: https://blog.csdn.net/weixin_45102492/article/details/104318250 Spark安装及Local模式: https://blog.csdn.net/weixin_45102492/article/details/104318738 Spark的Standalone模式: https://blog.csdn.net/weixin_45102492/article/details/104319485 Yarn模式 Spark客户端直接连接Yarn,不需要额外构建Spark集群。有yarn-client和yarn-cluster(集群模式,工作中常用)两种模式,主要区别在于:Driver程序的运行节点。 yarn-client :Driver程序运行在客户端,适应于交互、调试,希望立即看到app的输出 yarn-cluster :Driver程序运行在由RM(ResourceManager)启动的AP(APPMaster)适用于生产环境。 修改yarn-site.xml文件 添加以下内容 < ! -- 是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认是 true -- > < property > < name > yarn . nodemanager . pmem -