gbk编码

1M大概多少个字

你说的曾经没有我的故事 提交于 2019-12-02 15:33:44
<?php echo strlen("你"); 保存文件为gbk 输出2 保存文件为utf-8 输出3 说明不同编码占用字节不同 1M=1024kB 1KB = 1024B 所以utf-8下字数为 1024*1024/3 = 349525.33个 gbk下字数为 524,288个 来源: https://www.cnblogs.com/php-linux/p/11751840.html

字符集与校对集

半世苍凉 提交于 2019-12-02 11:33:56
字符集 show character set可查看可用 字符集(将一系列字符的编码规则组合起来就形成字符集) 显示了字符集名称,描述信息,默认校对集(default collation)和单字符的最大长度(maxLen) 下表展示了可用字符集的部分。 常用字符集有latinl,gbk,utf8 字符集 单字符最大长度 支持的语言 Latinl 1字节 西欧字符,希腊字符等 Gbk 2字节 简体和繁体中文,日文,韩文 Utf8 3字节 世界上大部分国家的文字 单字符占用的存储空间越多,所支持的语言越多 标准的UTF-8(RFC 3629)规定一个字符最多使用4个字节 Mysql从5.5.3版本开始新增了utf8mb4,将一个字符扩展到4个字节。 考虑RFC 3629规范,应使用utf8mb4 校对集 SHOW COLLATION Mysql中提供了很多校对集,用于为 不同字符集指定比较和排序规则。 latinl 字符集默认校对集为latinnl_swedish_ci 校对集用 _ 分隔3部分。第一个部分是对应的字符集,第二部分是国家名,结尾是ci,cs,或bin。其中ci表示不区分大小写,cs表示区分大小写,bin表示二进制方式比较 通过SHOW COLLATION 可以查看mysql可用的校对集。 下图显示了一部分的展示结果。 显示了校对名称(collation) 对应字符集

IDEA启动tomcat控制台中文乱码

江枫思渺然 提交于 2019-12-02 05:35:49
乱码情况:IDEA默认展示的三个log信息,全部乱码。 开始以为是IDEA本身或项目setting的编码格式错误导致,后来发现并不是,而是tomcat自身的日志输出问题。 解决方案: 修改Tomcat安装目录下的conf文件中的logging.properties文件中的内容: 把需要修改的乱码log信息,对应的位置进行修改,我的是需要把UTF-8修改为GBK。     找到如下几行:     1catalina.org.apache.juli.AsyncFileHandler.prefix = catalina.     1catalina.org.apache.juli.AsyncFileHandler.encoding = UTF-8  修改为  1catalina.org.apache.juli.AsyncFileHandler.encoding = GBK     2localhost.org.apache.juli.AsyncFileHandler.prefix = localhost.     2localhost.org.apache.juli.AsyncFileHandler.encoding = UTF-8  修改为  2localhost.org.apache.juli.AsyncFileHandler.encoding = GBK     java.util

Eclipse工程 ubuntu 乱码

梦想的初衷 提交于 2019-12-01 21:14:19
Reason: (Windows下的Eclipse默认会去读取系统的编码,所以Widnwos下的Eclipse的编码为GBK),而Ubuntu默认是不支持GBK编码的。 Solution: 1.让Ubuntu支持GBK 修改/var/lib/locales/supported.d/local文件,在文件中添加 zh_CN.GBK GBK zh_CN.GB2312 GB2312 sudo dpkg-reconfigure --force locales 在输出的结果中会出现 zh_CN.GB2312 done zh_CN.GBK done 这样, Ubuntu就支持GBK编码了, 2.设置eclipse Menu-> Windows->Preferences->General->Workspace. Text file encoding->Other 选择GBK , (没有GBK的选项的直接输入GBK三个字符), Apply, GBK编码的中文, Done! 来源: oschina 链接: https://my.oschina.net/u/815378/blog/109164

Ubuntu Eclipse 解决中文乱码

纵然是瞬间 提交于 2019-12-01 21:14:06
今天,把windows下的工程导入到了Linux下eclipse中,由于以前的工程代码,都是GBK编码的(Windows下的Eclipse默认会 去读取系统的编码,所以Widnwos下的Eclipse的编码为GBK),而Ubuntu默认是不支持GBK编码的。所以,首先我们要先让Ubuntu 支持GBK,方法如下: 修改/var/lib/locales/supported.d/local文件,在文件中添加 zh_CN.GBK GBK zh_CN.GB2312 GB2312 sudo dpkg-reconfigure --force locales 然后在输出的结果中会出现 zh_CN.GB2312 done zh_CN.GBK done 这样, Ubuntu就支持GBK编码了, 下面设置eclipse。 首先Windows->Preferences, 然后选择General下面的Workspace. Text file encoding选择Other GBK, 如果没有GBK的选项, 没关系, 直接输入GBK三个字母, Apply, GBK编码的中文, 已经不是乱码了。 来源: oschina 链接: https://my.oschina.net/u/593529/blog/196112

【编码】UnicodeEncodeError: 'gbk' codec can't encode character '\\xa0' in position XXX

独自空忆成欢 提交于 2019-12-01 13:31:07
  有时候在win中运行代码会遇到题目中的报错问题:   "UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position XXX",让人摸不着头脑的是程序开头的编码设置# coding:utf-8 和数据流IO操作时的编码转化都已经在程序中加入加入了。gbk哪里来的呢?其实就是win中新文件的默认编码是gbk。   当我们遇到编码问题的时候,有三个地方需要注意的: 文件的编码,IDE的编码,还有数据流IO操作过程中的编码。   后面两种很多网络上的分享帖都有说,而第一种往往就比较少。恰恰标题中的这个问题就是因为文件的编码是gbk所导致的。   解决的方法很简单,以python的pycharm为例只要在设置中确保项目编码和默认编码统一为UTF-8.保存后,将报错的代码复制到新建的文件中运行即可。    来源: https://www.cnblogs.com/eddilelau/p/11688516.html

putty使用教程

核能气质少年 提交于 2019-12-01 09:49:01
最近开始使用putty,在网络上看到一份很不错的教程,共享一下:putty使用方法,中文教程序言 大致内容罗列如下: 最简单的使用,登录 SSH 主机 中文乱码的处理 PuTTY 常用配置的说明 复制、粘贴 保存会话 注销 自动登录用户名 自动设置环境变量 设置代理服务器 自动执行命令 备份、删除 PuTTY 的设置 PuTTY 的 X11 转发 如何用 PuTTY 建立 SSH 隧道 如何用 PuTTY 建立反向的 SSH 隧道,像个特洛伊木马一样突破防火墙 把 PuTTY 作为一个安全的代理服务器 安全的上网不被嗅探 避免 MSN 等聊天工具被监听 怎样用 PSCP、PSFTP 安全的传输文件 功能强大的 SFTP 客户端 WinSCP 用 PuTTYgen 生成密钥,登录 SSH 主机不再需要口令 Pagent 代理密钥,每次开机只需要输入一次密钥口令 Plink 简单而又迅速的执行 SSH 主机上的程序 常见问题 除了上面的这些,还夹杂了一些 PuTTY 使用上的技巧、服务器配置的一些安全建议。说起来这是一些有关 PuTTY 的使用教程,其实也就是 SSH 的参考教程,绝大多数的内容在其他系统或软件上也都是一样的。不同的是参数、配置、命令行之类的,只要会了一个,其他也就触类旁通了。 一些基本知识 如果你已经知道 SSH、Telnet、Rlogin 这是什么,就跳过这一部分

3、常见错误

跟風遠走 提交于 2019-12-01 06:17:18
1、乱码:set names gbk; sql存储数据是utf-8的形式,但是控制台服务器使用的是GBK字符集,两者不一致 我们要告诉服务器,客户端使用的是GBK编码 拓展: 在.php中是utf-8编码的 .php中连接mysql怎么做? set names utf8 2、打错了怎么办? 使用"\c"调出执行,再重新打 3、mysql是以“;”为结束符 show databases ; 相当于: show databases; 来源: https://www.cnblogs.com/Stephanie-boke/p/11664472.html

编码

时光毁灭记忆、已成空白 提交于 2019-12-01 01:58:54
ascii A 00000010 8位 一个字节 uncode A 000000000 00000001 00000010 00000100 32位 中000000000 00000001 00000010 00000110 32位 utf-8 A 0010 0000 8位 一个字节 中 000000000 00000010 00000110 24位 三个字节 gbk A 00000110 8 位 一个字节 中 00000010 00000110 16位 两个字节 1.各个编码之间的二进制, 是不能相互认识的,会产生乱码 2.文件的储存,传输,不能是uncode,只能是(ascii gbk gb2312 utf- 8 utf-16) python3 的str编码就是uncode      bytes类型使用gbk和utf-8等 对于英文      str表现形式       str="feaf"      编码方式        uncode 01010101     bytes 表现形式       bytes=b"fafe"     编码方式 00101010 utf-8 gbk 对于中文     str表现形式       str="中文"      编码方式        uncode 01010101     bytes 表现形式       bytes=b"/fef"

VC2010下Qt5的中文乱码问题

半城伤御伤魂 提交于 2019-12-01 01:38:30
要搞清楚这个问题,先要弄明白编码。但是编码问题实在太复杂,这里肯定讲不开。 我先找一个例子,比如:"中文" 的 Unicode 码点/UTF8编码/GBK 分别是多少。 先去这个网站,输入 "中文" 查询对应的 Unicode 码点/UTF8编码: http://www.mytju.com/classcode/tools/encode_utf8.asp Unicode的码点分别是(十进制):中(20013),文(25991)。 对应的UTF8编码分别(16进制): 中(E4B8AD),文(E69687)。 然后再去下面这个网站,输入 "中文" 查询对应的 GBK 编码: http://www.mytju.com/classcode/tools/encode_gb2312.asp GBK编码16进制(GBK内码)分别是:中(D6D0),文(CEC4)。 现在已经知道了"中文"的UTF8和GBK编码的具体值。 我们再看看VC2010是怎么处理的。 1. 先看 无 BOM 的 UTF8 编码的代码 (utf8_no_bom.cpp) // utf8 no bom // 文件中包含不能在当前代码页(936)中表示的字符 #include <stdio.h> int main() { const char* str = "中文"; for(int i = 0; i < sizeof(str)