【大数据面试常问问题】----Hadoop缓存机制

吃可爱长大的小学妹 提交于 2020-01-11 10:35:37

分布式缓存

面试可说:

分布式缓存最重要的一个应用就是join操作,比如说一个表很大,另一个表很小。我们就可以对小表就行广播处理,
即每个节点都存放一个小表,然后进行Map端的连接。经过试验,Map端的join效率远远高于Reduce端的join,广
博处理就运用到了分布式缓存的技术。

每篇一言: 但问耕耘,莫问收获

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!