web开发中的JAVA字符转码
二、基本概念 2.1 JAVA中字符的表达 JAVA中有char、byte、String这几个概念。 char 指的是一个UNICODE字符,为16位的整数。 java抓取网页保存的乱码问题解决 byte 是字节,字符串在网络传输或存储前需要转换为byte数组。在从网络接收或从存储设备读取后需要将byte数组转换成String。 String是字符串,可以看成是由char组成的数组。 String 和 char 为内存形式,byte是网络传输或存储的序列化形式。 举例: 英 String ying = “英”; char ying = ying.charAt(0); //返回第0位的字符 String yingHex = Integer.toHexString(ying); //字符和整数同是16位 82 F1 byte yingGBBytes = ying.getBytes(“GBK”); //转换成字节 GB编码的字节数值 D3 A2 2.2 编码方式的简介 String序列化成byte数组或反序列化时需要选择正确的编码方式。如果编码方式不正确,就会得到一些0x3F的值。常用的字符编码方式有ISO8859_1、GB2312、GBK、UTF-8/UTF-16/UTF-32。 ISO8859_1用来编码拉丁文,它由单字节(0-255)组成。 GB2312、GBK用来编码简体中文