分布式系统基础架构——Hadoop
1.Hadoop a.概念:Hadoop是一个由Apache基金会所开发的分布式系统基础架构 b.组成:Hadoop = HDFS (文件系统) + Mapreduce (数据处理) 2.安装 a.配置Java运行环境 b.从官网下载 Hadoop 并解压,地址:http://hadoop.apache.org/releases.html c.下载 winutils 对 windows 进行支持,地址:https://github.com/steveloughran/winutils(支持老版本) https://github.com/zyj108/apache-hadoop-3.1.0-winutils(支持Hadoop3.1.2) d.解压 winutils 覆盖到 Hadoop 根目录(主要是覆盖bin目录) e.在 Hadoop 的 etc\hadoop 下,修改如下配置文件 ①修改core-site.xml,配置默认hdfs的访问端口 <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9527</value> </property> </configuration> ②修改hdfs