gb2312

UNICODE,GBK,UTF-8区别

流过昼夜 提交于 2019-12-29 13:53:48
UNICODE,GBK,UTF-8区别 简单来说,unicode,gbk和大五码就是编码的值,而utf-8,uft-16之类就是这个值的表现形式.而前面那三种编码是一兼容的,同一个汉字,那三个码值是完全不一样的.如"汉"的uncode值与gbk就是不一样的,假设uncode为a040,gbk为b030,而uft-8码,就是把那个值表现的形式.utf-8码完全只针对uncode来组织的,如果GBK要转UTF-8必须先转uncode码,再转utf-8就OK了. 详细的就见下面转的这篇文章. 谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词 这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题: 问题一: 使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件,Windows是怎样识别编码方式的呢? 我很早前就发现Unicode、Unicode big endian和UTF-8编码的txt文件的开头会多出几个字节,分别是FF、FE(Unicode),FE、FF(Unicode big endian),EF、BB、BF(UTF-8)。但这些标记是基于什么标准呢? 问题二

HTML5 UTF-8 中文乱码

≡放荡痞女 提交于 2019-12-28 00:44:23
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>HTML5的标题</title> </head> <body> <p>HTML5的内容!Hello</p> </body> </html> 我是用记事本写的,保存后在网页上运行竟然出现了乱码。换成GB2312能正确显示中文。 <!DOCTYPE html> <html> <head> <meta charset="GB2312"> <title>HTML5的标题</title> </head> <body> <p>HTML5的内容!Hello</p> </body> </html> 但是毕竟标准不一样。还是要用Utf-8。最后发现代码没有一点问题, 问题就出记事本身上 。 <meta charste="utf-8"> 只是告诉浏览器要用utf-8来解释,而文档的编码,是在你保存时的选择决定的。如果保存ANSI 然后用utf-8解释,肯定是乱码。 记事本的话,默认保存的文件格式是ANSI。所以在保存的时候要修改为uif-8。记事本编写的同鞋一定要注意了。 搞定~ 科普: UTF-8 GBK UTF8 GB2312 之间的区别和关系 UTF-8 GBK UTF8 GB2312 之间的区别 UTF-8:Unicode TransformationFormat-8bit

PHP乱码问题,UTF-8(乱码)

牧云@^-^@ 提交于 2019-12-28 00:43:32
一.HTML页面转UTF-8编码问题 1.在head后,title前加入一行: < meta http-equiv='Content-Type' content='text/html; charset=utf-8' / > 顺序不能错,一定要在 显示的标题有可能是乱码! 2.html文件编码问题: 点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8, 如果是ANSI,需要将编码改成:UTF-8。 3.HTML文件头BOM问题: 将文件从其他的编码转换成UTF-8编码时,有时候会在文件的最开始加上一个BOM标签, 在个BOM标签可能会导致浏览器在显示中文的时候出现乱码。 删除这个BOM标签的方法: 1.可以用Dreamweaver打开文件,并重新保存,即可以去除BOM标签! 2.可以用EditPlus打开文件,并在菜单“首选项”->“文件”->"UTF-8标识",设置为:“总是删除签名”, 然后保存文件,即可以去除BOM标签! 4.WEB服务器UTF-8编码问题: 如果你按以上所列的步骤做了,还是有中文乱码问题, 请检查你的所使用的WEB服务器的编码问题 如果你使用的是Apache,请将配置文件里的:charset 设成:utf-8(这里仅列出方法,具体格式请参考apache的配置文件) 如果你使用的是Nginx,请将nginx.conf里的

CuteEditor 编辑器添加中文字体

萝らか妹 提交于 2019-12-27 17:09:48
可以修改文件CuteSoft_Client\CuteEditor\Configuration\Shared\Common.config来添加字体。 主要注意的地方是该文件是用XML编码 <item text="FangSong_GB2312" html="<font size=3 face='FangSong_GB2312'>仿宋</font>">FangSong_GB2312</item> <item text="KaiTi_GB2312" html="<font size=3 face='KaiTi_GB2312'>楷体_GB2312</font>">KaiTi_GB2312</item> 要在 CuteEditor 中显示中文字体,需要将中文字体名称进行“国际化”,即将汉字字体名称改为英文名称, 如将“宋体”改为“Simsun",“黑体”改为"Simhei"等,下面是部分字体对照列表: English Name Localized Name SimSun 宋体 SimHei 黑体 FangSong_GB2312 仿宋_GB2312 KaiTi_GB2312 楷体_GB2312 YouYuan 幼圆 STSong 华文宋体 STZhongsong 华文中宋 STKaiti 华文楷体 STFangsong 华文仿宋 STXihei 华文细黑 STLiti 华文隶书

font-style字体设置

瘦欲@ 提交于 2019-12-26 04:31:31
用到一些字体找起来很麻烦,扒了一些 未测试 HTML,CSS,font-family:中文字体的英文名称 宋体 SimSun 黑体 SimHei 微软雅黑 Microsoft YaHei 微软正黑体 Microsoft JhengHei 新宋体 NSimSun 新细明体 PMingLiU 细明体 MingLiU 标楷体 DFKai-SB 仿宋 FangSong 楷体 KaiTi 仿宋_GB2312 FangSong_GB2312 楷体_GB2312 KaiTi_GB2312 宋体:SimSuncss中中文字体(font-family)的英文名称 Mac OS的一些: 华文细黑:STHeiti Light [STXihei] 华文黑体:STHeiti 华文楷体:STKaiti 华文宋体:STSong 华文仿宋:STFangsong 儷黑 Pro:LiHei Pro Medium 儷宋 Pro:LiSong Pro Light 標楷體:BiauKai 蘋果儷中黑:Apple LiGothic Medium 蘋果儷細宋:Apple LiSung Light Windows的一些: 新細明體:PMingLiU 細明體:MingLiU 標楷體:DFKai-SB 黑体:SimHei 新宋体:NSimSun 仿宋:FangSong 楷体:KaiTi 仿宋_GB2312:FangSong

How to read GB2312 encoded text files using Swift 3.0

十年热恋 提交于 2019-12-25 07:47:39
问题 My app needs to read text files encoded in GB2312. Here is the current code. SGFString = try String(contentsOf:path) It throws an exception. couldn’t be opened because the text encoding of its contents can’t be determined. While looking into the String.Encoding values, there is no GB2312. What would be the best way to read the GB2312 text files? Thanks Ray 回答1: Thanks for OOPer's help. I copied some of the code from the links, now it works. Here is the code: extension String.Encoding { static

字符集

放肆的年华 提交于 2019-12-23 13:00:25
字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。中文文字数目大,而且还分为简体中文和繁体中文两种不同书写规则的文字,而计算机最初是按英语单字节字符设计的,因此,对中文字符进行编码,是中文信息交流的技术基础。 ASCII 字符集 1.名称的由来   ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)是基于罗马字母表的一套电脑编码系统。 2.特点   它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO 646。 3.包含内容   控制字符:回车键、退格、换行键等。   可显示字符:英文大小写字符、阿拉伯数字和西文符号 4.技术特征   7位(bits)表示一个字符,共128字符 5.ASCII扩展字符集   7位编码的字符集只能支持128个字符,为了表示更多的欧洲常用字符对ASCII进行了扩展

iOS: What's the best way to detect a file's encoding

纵饮孤独 提交于 2019-12-22 13:50:06
问题 In some cases, I really need to know a file's encoding while reading the file. Sometimes we can do as Apple's String Programming Guide suggest : Reading data with an unknown encoding If you find yourself with text of unknown encoding, it is best to make sure that there is a mechanism for correcting the inevitable errors. For example, Apple's Mail and Safari applications have encoding menus, and TextEdit allows the user to reopen the file with an explicitly specified encoding. If you are

swift removingPercentEncoding not work with a gb2312 string

岁酱吖の 提交于 2019-12-22 01:08:02
问题 The server returns a gb2312 string that has been processed by the urlencode function: %D7%CF%BD%FB%B3%C7%C4%A7%D6%E4_%CE%DE%CF%DE%D0%A1%CB%B5%CD%F8_www.55x.cn.rar How to decode it back to gb2312 string: 紫禁城魔咒_无限小说网_www.55x.cn.rar 回答1: Percent encoding on other encodings than UTF-8 is not considered to be a recommended way in recent www world, so you may need to implement such conversion by yourself. It may be something like this: extension String.Encoding { static let gb_18030_2000 = String

ASP.NET---最简单的导出Excel

谁说我不能喝 提交于 2019-12-19 12:43:25
#region 最简单的导出Excel publicvoid CreateExcel(DataTable _table, string FileName) { //FileName = Server.UrlEncode(FileName); HttpResponse response = Page.Response; response.Clear(); response.Buffer =true; response.Charset ="GB2312"; response.HeaderEncoding = System.Text.Encoding.GetEncoding("GB2312"); response.ContentEncoding = System.Text.Encoding.GetEncoding("GB2312"); response.AddHeader("Content-Disposition", "attachment;filename="+ FileName); response.AddHeader("Content-Type", "application/octet-stream;charset=GB2312"); response.ContentType ="application/ms-excel"; string ls_item =""; ls_item