gb2312

Ubuntu 解决TXT文本乱码问题

*爱你&永不变心* 提交于 2019-12-02 00:02:59
只要依次在终端输入这两行指令即可: gsettings set org.gnome.gedit.preferences.encodings auto-detected "['GB18030', 'GB2312', 'GBK', 'UTF-8', 'BIG5', 'CURRENT', 'UTF-16']" gsettings set org.gnome.gedit.preferences.encodings shown-in-menu "['GB18030', 'GB2312', 'GBK', 'UTF-8', 'BIG5', 'CURRENT', 'UTF-16']" 来源: https://www.cnblogs.com/zsbzsb/p/11722266.html

Eclipse工程 ubuntu 乱码

梦想的初衷 提交于 2019-12-01 21:14:19
Reason: (Windows下的Eclipse默认会去读取系统的编码,所以Widnwos下的Eclipse的编码为GBK),而Ubuntu默认是不支持GBK编码的。 Solution: 1.让Ubuntu支持GBK 修改/var/lib/locales/supported.d/local文件,在文件中添加 zh_CN.GBK GBK zh_CN.GB2312 GB2312 sudo dpkg-reconfigure --force locales 在输出的结果中会出现 zh_CN.GB2312 done zh_CN.GBK done 这样, Ubuntu就支持GBK编码了, 2.设置eclipse Menu-> Windows->Preferences->General->Workspace. Text file encoding->Other 选择GBK , (没有GBK的选项的直接输入GBK三个字符), Apply, GBK编码的中文, Done! 来源: oschina 链接: https://my.oschina.net/u/815378/blog/109164

Ubuntu Eclipse 解决中文乱码

纵然是瞬间 提交于 2019-12-01 21:14:06
今天,把windows下的工程导入到了Linux下eclipse中,由于以前的工程代码,都是GBK编码的(Windows下的Eclipse默认会 去读取系统的编码,所以Widnwos下的Eclipse的编码为GBK),而Ubuntu默认是不支持GBK编码的。所以,首先我们要先让Ubuntu 支持GBK,方法如下: 修改/var/lib/locales/supported.d/local文件,在文件中添加 zh_CN.GBK GBK zh_CN.GB2312 GB2312 sudo dpkg-reconfigure --force locales 然后在输出的结果中会出现 zh_CN.GB2312 done zh_CN.GBK done 这样, Ubuntu就支持GBK编码了, 下面设置eclipse。 首先Windows->Preferences, 然后选择General下面的Workspace. Text file encoding选择Other GBK, 如果没有GBK的选项, 没关系, 直接输入GBK三个字母, Apply, GBK编码的中文, 已经不是乱码了。 来源: oschina 链接: https://my.oschina.net/u/593529/blog/196112

new String(str.getBytes("iso8859-1"), "UTF-8");

梦想的初衷 提交于 2019-12-01 21:04:17
1.编码基础知识 最早的编码是iso8859-1,和ascii编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编码,重要的有如下几个。 1.1. iso8859-1 通常叫做Latin-1 属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。比如,字母a的编码为0x61=97。 很明显,iso8859-1编码表示的字符范围很窄,无法表示中文字符。但是,由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候,仍旧使用iso8859-1编码来表示。而且在很多协议上,默认使用该编码。比如,虽然"中文"两个字不存在iso8859-1编码,以gb2312编码为例,应该是"d6d0 cec4"两个字符(java字符占2个字节),使用iso8859-1编码的时候则将它拆开为4个字节来表示:"d6 d0 ce c4"(事实上,在进行存储的时候,也是以字节为单位处理的)。而如果是UTF编码,则是6个字节"e4 b8 ad e6 96 87"。很明显,这种表示方法还需要以另一种编码为基础。 2.2. GB2312/GBK 这就是汉字的国标码,专门用来表示汉字,是双字节编码,而英文字母和iso8859-1一致(兼容iso8859-1编码)。其中gbk编码能够用来同时表示繁体字和简体字,而gb2312只能表示简体字,gbk是兼容gb2312编码的。 1.3 unicode

C语言基础之中文编码格式GB2312(4)

不想你离开。 提交于 2019-12-01 20:26:42
GB2312历史回顾 GB2312编码范围:A1A1-FEFE,其中汉字编码范围:B0A1-F7FE。 GB2312编码是第一个汉字编码国家标准,由中国国家标准总局1980年发布,1981年5月1日开始使用。GB2312编码共收录汉字6763个,其中一级汉字3755个,二级汉字3008个。同时,GB2312编码收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。 分区表示 GB2312编码对所收录字符进行了“分区”处理,共94个区,每区含有94个位,共8836个码位。这种表示方式也称为区位码。 01-09区收录除汉字外的682个字符。 10-15区为空白区,没有使用。 16-55区收录3755个一级汉字,按拼音排序。 56-87区收录3008个二级汉字,按部首/笔画排序。 88-94区为空白区,没有使用。 举例来说,“啊”字是GB2312编码中的第一个汉字,它位于16区的01位,所以它的区位码就是1601。 双字节编码 GB2312规定对收录的每个字符采用两个字节表示,第一个字节为“高字节”,对应94个区;第二个字节为“低字节”,对应94个位。所以它的区位码范围是:0101-9494。区号和位号分别加上0xA0就是GB2312编码。例如最后一个码位是9494,区号和位号分别转换成十六进制是5E5E,0x5E+0xA0=0xFE

iconv实现编码转换与中文点阵字库HZK16

懵懂的女人 提交于 2019-12-01 18:58:11
嵌入式开发中中文的识别、显示一直是一个比较让人头疼的问题,这是由于嵌入式系统的精简要求所导致的。我在前一个项目中用Qt做终端的显示界面时,就被中文字符的显示搞得焦头烂额,最后还是在网上下了一个文泉驿的中文字体库才解决问题,不过并不令人满意,主要是字体库太大了,影响了性能。今天在项目中又遇到了中文字符的编码转换和显示问题,趁机学习总结一下。 中文编码与点阵字库 国际标准有UTF-8、UTF-16等,国家标准有GB2312、GB18030、GBK等,至于这些标准的编码实现就不在这里介绍了。编码标准实现中文字符在计算机内部的机器表示,但是怎么将这些内部表示在显示设备上显示出来,则不是编码标准的范畴了,这就需要中文字库的作用。中文字库包含已经做好的显示“模板”(字模),通过中文的编码值来映射汉字在字库中的字模索引,从而使用字模来实现中文显示。 但是大部分的中文字库都是映射国家标准的,如GB2312的HZK16点阵字库。不知道文泉驿字体库是否是直接映射UTF-8,还是也是GB2312。因此,当在程序中涉及两种不同的中文编码方式时,就需要进行编码方式的转换,今天我遇到的就是要实现中文字符UTF-8到GB2312的编码转换。 HZK16是符合GB2312标准16*16的点阵宋体字库,支持的汉字有6763个,符号682个。其中一级汉字有 3755个,按声序排列,二级汉字有3008个,按偏旁部首排列

字符编码简介

依然范特西╮ 提交于 2019-12-01 18:22:28
ASCII( American Standard Code for Information Interchange ,美国信息互换标准代码) 它使用 0-127 之间 的数字来表示数字、字母、符号 等可见字符和一些控制字符,这个字符集的编码就确定了 ASCII 字符集。而这个字符集要想要在计算机的二进制方式下使用就必须用计算机能够理解的方式来处理, ASCII 使用了一个计算机字节来表示这种编码方式 。 GBK GBK,大家都知道 ,汉字内码扩展规范 。 GBK 是怎么来的呢? GBK 由 GB2312 扩展来的, GB2312 是最早的中文编码方式。 GB2312 又是怎么来的呢? 计算机发展到 80 年代在中国开始慢慢的兴起。为了能够让中国人能够更好的使用计算机 , 自然要引入中文编码到计算机中。但是引入中文编码遇到了一个问题,就是 ASCII 使用一个字节 来编码字符,但是中国的汉字是肯定不能够在一个字节中表示完全,怎么办?聪明的中国人发现一个字节 可表示的最大区间是 0-255 ,而 ASCII 只使用了 0-127,128-255 并没有使用,那么我们就可以用多个 字节 来表示中文编码 , 比如:一个字节( char )的值是在 0-127 之间,我们就还是用这个字节来表示 ASCII 里面的字符,也就是说兼容 ASCII 。 一个字节( char )的值是在 128

编码格式简介(ANSI、GBK、GB2312、UTF-8、UTF-16、GB18030和 UNICODE)

我只是一个虾纸丫 提交于 2019-12-01 11:33:10
很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物,他们把这称为”字节”。再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状态,状态开始变来变去,他们就把这机器称为”计算机”。 开始计算机只在美国用。八位的字节一共可以组合出256(2的8次方)种不同的状态。他们把其中的编号从0开始的32种状态分别规定了特殊的用途,一但终端、打印机遇上约定好的这些字节被传过来时,就要做一些约定的动作。遇上 00×10, 终端就换行,遇上0×07, 终端就向人们嘟嘟叫,例好遇上0x1b, 打印机就打印反白的字,或者终端就用彩色显示字母。他们看到这样很好,于是就把这些0×20以下的字节状态称为”控制码”。 他们又把所有的空格、标点符号、数字、大小写字母分别用连续的字节状态表示,一直编到了第127号,这样计算机就可以用不同字节来存储英语的文字 了。大家看到这样,都感觉很好,于是大家都把这个方案叫做 ANSI 的”Ascii”编码(American Standard Code for Information Interchange,美国信息互换标准代码)。当时世界上所有的计算机都用同样的ASCII方案来保存英文文字。 后来计算机发展越来越广泛,世界各国为了可以在计算机保存他们的文字,他们决定采用127号之后的空位来表示这些新的字母

putty使用教程

核能气质少年 提交于 2019-12-01 09:49:01
最近开始使用putty,在网络上看到一份很不错的教程,共享一下:putty使用方法,中文教程序言 大致内容罗列如下: 最简单的使用,登录 SSH 主机 中文乱码的处理 PuTTY 常用配置的说明 复制、粘贴 保存会话 注销 自动登录用户名 自动设置环境变量 设置代理服务器 自动执行命令 备份、删除 PuTTY 的设置 PuTTY 的 X11 转发 如何用 PuTTY 建立 SSH 隧道 如何用 PuTTY 建立反向的 SSH 隧道,像个特洛伊木马一样突破防火墙 把 PuTTY 作为一个安全的代理服务器 安全的上网不被嗅探 避免 MSN 等聊天工具被监听 怎样用 PSCP、PSFTP 安全的传输文件 功能强大的 SFTP 客户端 WinSCP 用 PuTTYgen 生成密钥,登录 SSH 主机不再需要口令 Pagent 代理密钥,每次开机只需要输入一次密钥口令 Plink 简单而又迅速的执行 SSH 主机上的程序 常见问题 除了上面的这些,还夹杂了一些 PuTTY 使用上的技巧、服务器配置的一些安全建议。说起来这是一些有关 PuTTY 的使用教程,其实也就是 SSH 的参考教程,绝大多数的内容在其他系统或软件上也都是一样的。不同的是参数、配置、命令行之类的,只要会了一个,其他也就触类旁通了。 一些基本知识 如果你已经知道 SSH、Telnet、Rlogin 这是什么,就跳过这一部分

How to change GB-2312 encoding to UTF-8

感情迁移 提交于 2019-12-01 01:11:55
I use nsurlsession and received nsdata with GB-2312 encoding. How can I change the encoding from GB-2312 to UTF-8. I tried this code let enc = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000) var result = NSString(data: data, encoding:enc)! but it has an error Use of unresolved identifier 'kCFStringEncodingGB_18030_2000' Lilo Lu I solved this issue with using the concrete value of gb312 constant instead of the apple defined constant let enc = CFStringConvertEncodingToNSStringEncoding(0x0632); let dogString:String = NSString(data: data, encoding: enc)! println(dogString