对于二进制的序列化,hadoop的封装类型为
BytesWritable,
BytesWritable
是对二进制数据数组的封装,它的序列化格式为
1
个用于指定后面数据字节数的整数域(
4
字节),后跟字节本身,例如长度为
2
的字节数组
l 数组包含了数值3和5,序列化形式为1个4字节的整数(00000002)和该数组中的两个字节(03)和(05)
BytesWritable的实现依赖于其抽象了的BinaryComparable,而并不是直接的去实现序列化接口WritableComparable这个接口,而是由抽象类BinaryComparable(实现了Comparable接口)的抽象类的子类实来实现,即在中间抽离出一个抽象类,由抽象类的子类去实现hadoop二进制的序列化。
BinaryComparable抽象类重载了两个compareTo方法,并且借助WritableComparator的静态方法实现比较,该抽象类用于二进制数据的比较,默认重载了两个compareTo方法,其类图关系为:

值得注意的是getBytes()方法返回的字节数组长度可能无法体现BytesWritable所存储的容量,因为可以通过setCapacity()设置容量大小,所以可以通过getLength()方法来确定BytesWritable的大小。
来源:oschina
链接:https://my.oschina.net/u/216196/blog/40231