大数据之Hadoop
经过前期的软件和应用程序的安装,我学习了一下Linux的基本命令,然后开始安装 hadoop,我看的是尚硅谷的大数据视频,我有源码,软件的压缩包,笔记等等很多 的资料,也是在B站群正常购买的,有想要的,请私聊我呀!! 然后就是开始真正的大数据学习,学习大数据,最显要了解Hadoop以及Hadoop的 生态圈,当然这里的东西特别多,没有经年累月的学习是学习不完的,经过和队友的 商议,和tzp学长的建议,他告诉我先学习一下Hadoop的hdfs,分布式文件管理系 统, 和mapredece,计算框架就算是大数据入门了,所以我看了网上一些配置的教程 感觉 这个配置超级麻烦,所以,我还是照着视频讲解的一步一步的配置吧,这里要为 尚硅谷 的那个2018讲大数据的老师点赞,我也建议大家看尚硅谷大数据2018年的课程 2019最 新版的我也看了,我认为里面的视频讲解的不太细致,因为那个老师直接拿已经 安装好 的伪分布式的hdfs开始讲,初学者一定会很蒙,所以建议大家去b站上搜索2018 的。按 照上面的视频一步一步的操作,再加上我自己手里的文档,几乎可以做到0失误。 下面我要说一下我对HDFS分布式文件系统的理解。 分布式文件管理系统会提供多个用户的服务器,而且一般是有备份和容错功能的,它是由 java语言实现的分布式,课横向扩展的文件系统。Namenode是中心服务器,它一般管理