Hadoop序列化机制及实例
序列化 1、什么是序列化? 将结构化对象转换成字节流以便于进行网络传输或写入持久存储的过程。 2、什么是反序列化? 将字节流转换为一系列结构化对象的过程。 序列化 用途 : 1、作为一种 持久化格式 。 2、作为一种 通信的数据格式 。 3、作为一种数据拷贝、克隆机制。 Java序列化和反序列化 1、创建一个对象实现了 Serializable 2、序列化 : ObjectOutputStream.writeObject(序列化对象) 反序列化: ObjectInputStream .readObject()返回序列化对象 具体实现,可参考如下文章: http://blog.csdn.net/scgaliguodong123_/article/details/45938555 为什么Hadoop不直接使用java序列化? Hadoop 的序列化机制与 Java 的序列化机制不同,它将对象序列化到流中, 值得一提的是java的序列化机制是不断的创建对象, 但在 hadoop 的序列化机制中,用户可以复用对象,这样就减少了java对象的分配和回收,提高了应用效率。 Hadoop序列化 Hadoop的序列化不采用java的序列化,而是实现了自己的序列化机制。 Hadoop通过 Writable 接口实现的序列化机制,不过没有提供比较功能,所以和java中的 Comparable 接口合并