Spark交互式工具spark-shell
REPL Read-Eval-Print-Loop,即交互式shell,以交互式方式来编程 Spark REPL $SPARK_HOME/bin/spark-shell(scala) $SPARK_HOME/bin/pyspark(python) 其他 Spark shell Spark的scala REPL,支持使用scala语言来进行Spark的交互式编程 支持Spark的local,standalone,yarn client模式 启动./bin/spark-shell 内置实例化一个SparkContex对象,可以通过sc来调用 内置实例化一个SQLContext对象,可以使用sqlContext来调用查看帮助sc.\t spark-shell运行在YARN上 登陆安装Spark那台机器 .bin/spark-shell --master yarn (注意,这样也是yarn client模式) spark-shell运行在YARN上(这是Spark on YARN模式) (包含YARN client和YARN cluster)(作为补充) 登陆安装Spark那台机器 bin/spark-shell --master yarn-client 或者 bin/spark-shell --master yarn-cluster 包括可以加上其他的,比如控制内存啊等。这很简单