spark搭建

≡放荡痞女 提交于 2019-12-21 02:56:51

标题

记录基于python搭建spark的过程 ,python过程省去。
需要安装java , java安装教程

spark下载地址 http://spark.apache.org/downloads.html
选择 Spark版本 、hadoop兼容版本
在这里插入图片描述

安装

tar -zxvf  spark-2.4.4-bin-hadoop2.6.tgz
mv spark-2.4.4-bin-hadoop2.6 /usr/local/spark

vim /etc/profile
# spark path
export SPARK_HOME=/usr/local/spark
export PATH=$PATH:$SPARK_HOME/bin

source /etc/profile

启动shell

python-shell: pyspark
scala-shell :  spark-shell

验证

pyspark
al lines = sc.textFile("<file_path>")
lines.count()
lines.first()

配置文件

cd conf
cp log4j.properties.template log4j.properties

vim  log4j.properties
log4j.rootCategory=INFO, console => log4j.rootCategory=WARN, console
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!