hadoop之BinaryComparable与BytesWritable

扶醉桌前 提交于 2020-03-01 03:15:04
  对于二进制的序列化,hadoop的封装类型为 BytesWritable, BytesWritable 是对二进制数据数组的封装,它的序列化格式为 1 个用于指定后面数据字节数的整数域( 4 字节),后跟字节本身,例如长度为 2 的字节数组

l      数组包含了数值35,序列化形式为14字节的整数(00000002)和该数组中的两个字节(03)和(05

BytesWritable的实现依赖于其抽象了的BinaryComparable,而并不是直接的去实现序列化接口WritableComparable这个接口,而是由抽象类BinaryComparable(实现了Comparable口)的抽象类的子类实来实现,即在中间抽离出一个抽象类,由抽象类的子类去实现hadoop二进制的序列化。

BinaryComparable抽象类重载了两个compareTo方法,并且借助WritableComparator的静态方法实现比较,该抽象类用于二进制数据的比较,默认重载了两个compareTo方法,其类图关系为:




值得注意的是getBytes()方法返回的字节数组长度可能无法体现BytesWritable所存储的容量,因为可以通过setCapacity()设置容量大小,所以可以通过getLength()方法来确定BytesWritable的大小。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!