gbk编码

Rhythmbox中文乱码解决办法

孤人 提交于 2019-11-28 10:58:46
Rhythmbox中文乱码解决办法 分类: Linux 2012-08-10 15:25 1368人阅读 评论 (0) 收藏 举报 转自: http://hi.baidu.com/morgensonne/item/3470aef58747abde6325d2d9 今天在网络上找到了一个比较好的解决Rhythmbox中文乱码的问题的方法 进入你的音乐文件夹执行如下代码: mid3iconv -e GBK *.mp3 如果没有提示多试几次, 有可能系统会提示: python-mutagen没有安装。 sudo apt-get install python-mutagen 安装。 输入如上的命令,回车。等安装好程序之后,再回到你的音乐文件夹, 输入命令: mid3iconv -e GBK *.mp3 回车。 然后重新打开rhythmbox,OK! 所有mp3都能正常显示了。 mid3iconv 命令主要是将原来mp3音乐文件的ID3信息转换成了Unicode并用ID3v2的格式存回文件中。 ---------------------------------------------------------------------------------------------- 另外一个是用 Python 写的 “Mutagen”,目前最新版本 1.11,Ubuntu 7.04 源里也带有

在python3 encode和decode 的使用

最后都变了- 提交于 2019-11-28 05:50:23
说这个问题之前必须的介绍关于编码的在我们这的发展: 首先电脑能识别的最初的语言是二进制 ---010101这种 然后在是我们知道的ASSIC码 再过了就是 gb2312----------->gbk1.0--------->最后是gbk18030 最后国际上为了统一编制了 Unicode 但是Unicode有三个版本Unicode‘UTF——32’, 每个字符都是4个字节,一个字节8bety,但美国人民有点不愿意,随后 改编成了Unicode‘UTF——16’每个字符都是两个字节,最后改编成现在的Unicode“UTF-8”在这里面,英文用的ASSIC码一个字节(美国人民应该很高兴),然后欧洲的一些语言字符是两个字节,一个中文就是三个字节 介绍完历史,接下来就讲讲为么子要encode 和decode:最根本的原因还是各个编码只能上级包容下级,下级想读取上级就会出现乱码(简单的说就是Unicode能识别gbk,而gbk想直接Unicode就会乱码,Unicode是向下包容的) 在Python2里面(估计现在不怎么用的吧): 默认识别是ASCLL码,所以不能识别中文。而现在国内的windows默认支持识别应该是gbk 在python2中的中文想要Windows识别就得通过 声明“#!_*_ coding :UTF-8 _*_ ” 源码格式为UTF-8,这样就可以识别输入的中文

采集页面编码GBK处理注意的问题

半世苍凉 提交于 2019-11-28 00:10:24
现在项目基本都是UTF-8编码的,但是有个别网站还是GBK编码的,比如搜狗。采集到的GBK编码的页面处理会导致解析不了html内容。 处理方法 转换页面内容为UTF-8 替换页面的头部GBK为UTF-8 这一点很重要 /** * 内容处理 * 把GBK转码为utf-8 * 头部标识编码 gbk替换成utf-8(采集的时候页面转换成了utf-8编码,header头也一定记得替换成utf-8编码,否则编码就会有问题) */ $content = iconv('GBK', "UTF-8//ignore", $content); $content = preg_replace("/gb(k|2312)/i", "utf-8", $content); 之前处理字符串编码问题的方法 function doEncoding($str){ $encode = strtoupper(mb_detect_encoding($str, ["ASCII",'UTF-8',"GB2312","GBK",'BIG5'])); if($encode!='UTF-8'){ $str = mb_convert_encoding($str, 'UTF-8', $encode); } return $str; } curl 检测响应Content-Type编码是GBK的 /** * 转换gbk编码为utf8 *

运行bokeh服务器出现gbk codec can't decode byte 0xb0 in position 342: illegal multibyte sequence

浪子不回头ぞ 提交于 2019-11-27 08:47:18
解决成功 只需要把代码文件 基本本打开后另存为编码处改成ANSI,读取文件的地方不需要写编码格式,写了也会错误,只需要改编码为ANSI就可以了 运行bokeh服务器把文件房子cmd文件下面就可以了,之后输入bokeh serve --show (这个地方就是文件名)bokeh serve --show insurance_graph1.py 例如 bokeh serve --show bokeh serve --show insurance_graph1.py 来源: https://www.cnblogs.com/jianchiai/p/11355559.html

编码初始 (编码集)密码本

这一生的挚爱 提交于 2019-11-27 08:42:56
今 0101 天 0110 晚 0010 上 0001 去 1001 便 1000 利 0100 店 1111 ASCII (美)不支持中文, 用于pyhton2版本 gbk (国标) 英文用8位 中文16位 unicode (万国码) 英文16位 中文32位 utf-8 (可变长编码)英文8位 欧洲文16位 亚洲24位 linux -- utf-8 mac-- utf-8 windows--gbk 来源: https://www.cnblogs.com/shengjunqiye/p/11355370.html

mysql 编码测试

梦想的初衷 提交于 2019-11-27 01:08:32
insert into t1(v1) values('cn中国'); select * from t1; 1、输入gbk,交互latin1,数据库latin1 insert,客户端把gbk的输入当成latin1来解释,传给服务,服务不需要转码,把gbk当成latin1存入数据库,显示乱码。 select,服务不转码,返回给客户端,客户端latin1当成gbk解释,显示正确。 2、输入gbk,交互latin1,数据库gbk insert 报错:ERROR 1366 (HY000): Incorrect string value: '\xD6\xD0\xB9\xFA' for column 'v1' at row 1 原因是:客户端把gbk的输入当成latin1来解释,传给服务,服务转码,把latin1转化为gbk,出错。 3、输入gbk,交互latin1,数据库utf8 和1一样,这是因为utf8英文字符一个字节,多字节字符三个字节。 4、输入gbk,交互gbk,数据库latin1 insert 报错:ERROR 1366 (HY000): Incorrect string value: '\xD6\xD0\xB9\xFA' for column 'v1' at row 1 原因是:客户端把gbk的输入当成gbk来解释,传给服务,服务把gbk转化为latin1,转化失败。 5

day10

让人想犯罪 __ 提交于 2019-11-26 12:56:33
计算机基础 cpu: 控制程序的运行(从内存中取出文本编辑器的数据读入内存) 内存: 运行程序(经cpu操作后,内存中含有文本编辑器的数据) 硬盘: 存储数据(文本编辑器) 文本编辑器 计算机只认识 0和1 文本编辑器的作用: 读写数据,保存数据 python解释器 具有文本编辑器的功能 010101011001010 --> a = 1 # 5个很普通的字符 ,python解释器没有运行的时候提供的 # 字符编码 定义变量就要开辟内存空间存放变量,内存只认识 0和1 也就是说, a=1 --> 01010110101 需要一定的0和1表示他为字符串,python解释器运行的时候提供的 # python2和3字符编码的区别 字符编码 字符编码: 二进制 和 你所能认识的字符 之间的相互转换的一个过程 早期的ascii码 0 1 a b 2^1 00 01 10 11 a b c d 2^2 2^3 8位 2^8=256 0000 0000 0000 0001 0100 0001 A 0100 0001 A 英文 0000 0001 0000 0000 A 中文 1111 1111 1111 A 日文 中国人也要电脑,中国人就自己造一个,gbk,4个字节 0000 0000 0000 2^12 # 4096 0000 0000 0000 0000 2^16 小日本也需要电脑

在Vim中查看文件编码和文件编码转换

非 Y 不嫁゛ 提交于 2019-11-26 12:45:34
在Vim中查看文件编码和文件编码转换 风亡小窝 关注 0.2 2016.09.26 22:43* 字数 244 阅读 5663 评论 0 喜欢 2 在Vim中查看文件编码 :set fileencoding 即可显示文件编码格式。 如果你只是想查看其它编码格式的文件或者想解决 用Vim查看文件乱码的问题,那么在 ~/.vimrc 文件中添加以下内容: set encoding=utf-8 fileencodings=utf-8 这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或 者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适 的编码,就用latin-1(ASCII)编码打开。 以指定的编码打开某文件 如打开windows中以ANSI保存的文件 vim file.txt -c "e ++enc=GB18030" 文件编码转换 在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 :set fileencoding=utf-8 查看文件格式 :set fileformat? 设置文件格式为 unix :set fileformat=unix ###################### 在Vim中查看文件编码和文件编码转换 风亡小窝 关注 0.2 2016.09.26 22:43* 字数 244 阅读 5663