HDFS 归档存储编程指南
【推荐阅读】微服务还能火多久?>>> 阿里云智能数据库事业部 OLAP 平台团队现向 2021 届海内外院校应届毕业生(毕业时间在2020年11月-2021年10月之间)招聘大数据系统工程师,有机会转正,有意请加 iteblog 微信内推。 文章目录 1 介绍 2 存储类型和存储策略 2.1 存储类型 2.2 存储策略 2.3 存储策略解析 2.4 配置 3 存储策略命令 3.1 展示存储策略 3.2 设置存储策略 3.3 删除存储策略 3.4 获取存储策略 3.5 应用存储策略 介绍 HDFS 归档存储(Archival Storage)是从 Hadoop 2.6.0 开始引入的(参见 HDFS-6584 )。归档存储是一种将增长的存储容量与计算容量解耦的解决方案。我们可以在集群中部署一些具有更高密度、更便宜的存储且提供更低计算能力的节点,并且可以用作集群中的冷数据存储器。根据我们的设置,可以将热数据移到冷存储介质中。通过添加更多的冷存储节点,可以为集群增加存储能力。 异构存储(Heterogeneous Storage)和归档存储(Archival Storage)提供的框架使得 HDFS 体系结构变得更加通用,使得 Hadoop 集群支持包括 SSD 和内存等存储介质。为了获得更好的性能,用户可以选择将数据存储在 SSD 或内存中。 如果想及时了解Spark、 Hadoop