09-大数据入门一

时光毁灭记忆、已成空白 提交于 2019-12-05 14:27:38

Hadoop [翻译大象]

广义: 以apache hadoop软件为主的生态圈(hive sqoop spark flink....)
狭义: apache hadoop软件

 

以后这些网站经常用到
hadoop.apache.org
hive.apache.org
spark.apache.org

 

hadoop软件:
1.x 企业不用
2.x 主流
3.x 很少敢用 坑 只能自己踩[应为hadoop需要和别的生态圈结合,他们可能是不同的公司开发]

但是CDH(www.cloudera.com) ,CDH它能解决的问题: 1. 版本兼容 2.统一的部署管理 很受企业欢迎[应为它可以通过web页面进行点下一步就部署了],和CDH相同的另一个是华为的HDP

 

上面的CDH或者HDP是拿apache的hadoop源代码 ,封装成自己的hadoop版本 ,且自己打补丁

 

CDH有收费版和免费版本,收费的它提供一些技术支持,和一些统计功能, 不过免费的在企业可以用,联通或者移动也在用免费版本.

http://archive.cloudera.com/cdh5/cdh/5/   这个CDH封装的一些组件地址

 

hadoop-2.6.0-cdh5.7.0.tar.gz 280M
hadoop-2.6.0-cdh5.16.2.tar.gz 400M
hive-1.1.0-cdh5.16.2.tar.gz

 

以前在企业中使用过这四个版本 CDH5.4.8 5.8.6 5.12.0 5.16.1
慎用CDH5.11.0 这个版本有bug

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!