新增的io.serializer包

hadoop 023.0与hadoop 1.0 io.serializable分析

喜你入骨 提交于 2019-12-06 00:29:49
hadoop升级到0.23.0和1.0版本后,其IO底层除了自己实现的Writable序列化后,还增加了一个io.serializer包,该包提供了一 种可插拔的持久化框架 (Pluggable Serialization Framework) 。之所以说是可插拔的,是因为可以把现存的持久化方式嵌入到 hadoop 的程序中。这个包中有以下的一些类: 接口类: Serializer:定义了序列化的接口 Serialization:定义了序列化的机制(作为序列化接口 Serializer和反序列化接口 Deserializer的上层抽象,提供了一个抽象的序列化和反序列化实例的返回 ) Deserializer :定义了反序列化的接口 Serializer 接口(具体的序列化类实现接口) Serializer 接口位于 hadoop.io. Serializer 包下面,为 hadoop 的序列化提供了一种机制。( This package provides a mechanism for using different serialization frameworks in Hadoop ) 该接口包含了三个方法: void open(OutputStream out) -- 打开一个输出流为序列化做准备。 void serialize(T t) -- 对一个对象序列化 void