gbk

运行bokeh服务器出现gbk codec can't decode byte 0xb0 in position 342: illegal multibyte sequence

浪子不回头ぞ 提交于 2019-11-27 08:47:18
解决成功 只需要把代码文件 基本本打开后另存为编码处改成ANSI,读取文件的地方不需要写编码格式,写了也会错误,只需要改编码为ANSI就可以了 运行bokeh服务器把文件房子cmd文件下面就可以了,之后输入bokeh serve --show (这个地方就是文件名)bokeh serve --show insurance_graph1.py 例如 bokeh serve --show bokeh serve --show insurance_graph1.py 来源: https://www.cnblogs.com/jianchiai/p/11355559.html

编码初始 (编码集)密码本

这一生的挚爱 提交于 2019-11-27 08:42:56
今 0101 天 0110 晚 0010 上 0001 去 1001 便 1000 利 0100 店 1111 ASCII (美)不支持中文, 用于pyhton2版本 gbk (国标) 英文用8位 中文16位 unicode (万国码) 英文16位 中文32位 utf-8 (可变长编码)英文8位 欧洲文16位 亚洲24位 linux -- utf-8 mac-- utf-8 windows--gbk 来源: https://www.cnblogs.com/shengjunqiye/p/11355370.html

python3 之 字符串编码小结(Unicode、utf-8、gbk、gb2312等)

心已入冬 提交于 2019-11-27 05:04:25
python3 解释器默认编码为Unicode,由str类型进行表示。二进制数据使用byte类型表示。 字符串通过编 码转换成字节串,字 节码通过解码成为字符串。 encode:str-->bytes decode:bytes --> str 下面给出一个实例: 1 mystr = '人生苦短,我学Python' 2 print('原始字符串mystr:',mystr) #原始字符串mystr: 人生苦短,我学Python 3 4 5 #将字符串进行编码 6 mystr_to_utf8 = mystr.encode('utf-8')#默认就是Unicode,不用再decode 7 mystr_to_gbk = mystr.encode('gbk') 8 9 10 #打印编码后的字节串(字面值) 11 print('utf-8编码后的字节串:',mystr_to_utf8) 12 #utf-8编码后的字节串: b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe5\xad\xa6Python' 13 14 print('gbk编码后的字节串:',mystr_to_gbk) 15 #gbk编码后的字节串: b'\xc8\xcb\xc9\xfa\xbf\xe0\xb6\xcc\xa3

转换流

自古美人都是妖i 提交于 2019-11-27 01:33:46
转换流 我们要读取的文件aa.txt采用的是GBK的编码方式。 ​ FileReader这个流是采用Idea默认的编码方式进行读取(UTF-8)。 ​ 两种编码不一致,那么就引发了乱码问题。 ​ 如果想要读取GBK编码的文件,我们可以指定一个编码方式去读取。 ​ 使用转换流,可以指定编码进行读取。 public class Demo01FileReader { public static void main ( String [ ] args ) throws IOException { //创建FileReader对象 Reader r = new FileReader ( "d:\\aa.txt" ) ; //开始读取,一次读取一个字符 int i ; while ( ( i = r . read ( ) ) != - 1 ) { //输出 System . out . print ( ( char ) i ) ; } //关流 r . close ( ) ; } } InputStreamReader InputStreamReader是转换流, 可以指定编码读取数据, 可以将文件中的数据读取到Java程序中。 InputStreamReader的构造方法: InputStreamReader(InputStream in):参数要传递字节输入流。

mysql 编码测试

梦想的初衷 提交于 2019-11-27 01:08:32
insert into t1(v1) values('cn中国'); select * from t1; 1、输入gbk,交互latin1,数据库latin1 insert,客户端把gbk的输入当成latin1来解释,传给服务,服务不需要转码,把gbk当成latin1存入数据库,显示乱码。 select,服务不转码,返回给客户端,客户端latin1当成gbk解释,显示正确。 2、输入gbk,交互latin1,数据库gbk insert 报错:ERROR 1366 (HY000): Incorrect string value: '\xD6\xD0\xB9\xFA' for column 'v1' at row 1 原因是:客户端把gbk的输入当成latin1来解释,传给服务,服务转码,把latin1转化为gbk,出错。 3、输入gbk,交互latin1,数据库utf8 和1一样,这是因为utf8英文字符一个字节,多字节字符三个字节。 4、输入gbk,交互gbk,数据库latin1 insert 报错:ERROR 1366 (HY000): Incorrect string value: '\xD6\xD0\xB9\xFA' for column 'v1' at row 1 原因是:客户端把gbk的输入当成gbk来解释,传给服务,服务把gbk转化为latin1,转化失败。 5

6. 小数据池-编码-文件操作

天涯浪子 提交于 2019-11-27 00:29:30
一、小数据池 1. 小数据池定义 小数据池(常量池),一种数据缓存机制,也被称为驻留机制。小数据池只针对: 整数、字符串、布尔值 。其他数据类型不存在驻留机制。 2. 各类型数据池限定 (1) 整型 在python中 -5 ~ 256 之间的整数会被驻留在内存中。每次使用都是同一个对象。 (2) 字符串 将一定规则的字符串缓存。在使用的时候,内存中只会创建一个该数据的对象。保存在小数据池中。当使用的时候直接从小数据池中获取对象的内存应用。而不需要创建一个新的数据,这样会节省更多的内存区域。 优点:能提高一些字符串,整数的处理速度。省略创建对象的过程 缺点:在“池”中创建或插入新的内容会花费更多的时间 a. 如果字符串的长度是0或者1, 都会默认进行缓存 b. 字符串长度大于1, 但是字符串中只包含字母, 数字, 下划线时才会缓存 c. 用乘法得到的字符串. ①. 乘数为1, 仅包含数字, 字母, 下划线时会被缓存. 如果包含其他字符, 而长度<=1 也会被驻存, ②. 乘数大于1 . 仅包含数字, 字母, 下划 线这个时候会被缓存. 但字符串长度不能大于20 d. 指定驻留留. 我们可以通过sys模块中的intern()函数来指定要驻留留的内容. >>> from sys import intern >>> a = intern('alex.sb.com' * 10) >>> b

GBK和UTF-8的区别

人走茶凉 提交于 2019-11-27 00:03:18
我们这里将以最简单最容易理解的方式来描述GBK和UTF8的区别,以及它们分别是什么。 GBK编码:是指中国的中文字符,其它它包含了简体中文与繁体中文字符,另外还有一种字符“gb2312”,这种字符仅能存储简体中文字符。 UTF-8编码:它是一种全国家通过的一种编码,如果你的网站涉及到多个国家的语言,那么建议你选择UTF-8编码。 GBK和UTF8有什么区别? UTF8编码格式很强大,支持所有国家的语言,正是因为它的强大,才会导致它占用的空间大小要比GBK大,对于网站打开速度而言,也是有一定影响的。 GBK编码格式,它的功能少,仅限于中文字符,当然它所占用的空间大小会随着它的功能而减少,打开网页的速度比较快。 原文:https://jingyan.baidu.com/article/7f41ececf3ca46593c095c56.html 来源: https://www.cnblogs.com/churujianghudezai/p/11335978.html

1. 基本数据类型

我的未来我决定 提交于 2019-11-26 19:48:22
一、整型 在python3中只有int,包含了long;而python2中有long类型。python2中是没有布尔类型的,它用0表示False,用1表示True。到python3中,把True和False定义成关键字,但他们值还是1和0。可和数字相加。 1. 案例 (1)将i转换为二进制,统计最小有效位数 i = 128 i.bit_length() 结果:128 - 10000000 -> 8 20 - 10100 -> 5 2. 内置type()函数可以查看数据类型 (1)解包操作 a, b, c, d = 10, 5.5, True, 4+3j >>> <class 'int'> <class 'float'> <class 'bool'> <class 'complex'> 3. isinstance 判断数据类型 a = 111 isinstance(a, True) >>>True 4. isinstance 和 type()区别 (1)type() 不会认为子类是一种父类类型 (2)isinstance() 会认为子类是一种父类类型 5. isinstance类中使用 >>> class A: ... pass ... >>> class B(A): ... pass ... >>> isinstance(A(), A) True >>> type(A()) ==

8.8(文件的高级应用,修改文件的两种方式,函数的定义,定义函数的三种形式,函数的返回值,函数的调用,函数的参数)

泪湿孤枕 提交于 2019-11-26 14:19:37
复习 字符编码: 二进制和字符之间的转换过程 --> 字符编码 ascii,gbk,shit,fuck 每个国家都有自己的编码方式 美国电脑内存中的编码方式为ascii ; 中国电脑内存中的编码方式为gbk , 美国电脑无法识别中国电脑写的程序 , 中国电脑无法识别美国电脑写的程序 现在硬盘中躺着 ascii/gbk/shit/fuck 编码的文件, 他们的编码格式已经无法修改了, 所以内存中出现unicode编码, 内存中的unicode编码方式可以识别 ascii/gbk/shit/fuck 编码的文件 用unicode编码方式运行了 ascii/gbk/shit/fuck 编码的文件, 最后还是要装入硬盘, 装入硬盘早期用unicode存进去,但是 他在识别ascii的时候, 会把8位数字转换成16位数字存入硬盘, 浪费空间, 所以出现了utf8(与unicode对应,并且压缩unicode编码的字符) utf8 能识别其他国家的编码,只识别unicode, utf8目前还不能放在内存,. 但是现在写的代码都是utf8, 历史遗留ascii/gbk/shit/fuck 编码的文件迟早消失/淘汰,要么被转换成utf8格式.所以迟早有一天内存中也是utf8. python2和3字符编码的区别: 打开python解释器 python解释器相当于文本编辑器,读取二进制转化为普通字符

~~网络编程(五):粘包现象~~

纵然是瞬间 提交于 2019-11-26 13:03:54
进击のpython 网络编程——粘包现象 前面我们提到了套接字的使用方法,以及相关bug的排除 还记得我们提到过一个1024吗? 我们现在要针对这个来研究一下一个陷阱 在研究这个陷阱之前我要先教你几条语句 这是windows的命令啊 ipfonfig 查看本地网卡的ip地址 dir 查看某一个文件夹下的子文件名和子文件夹名 tasklist 查看运行的进程 那我这三条命令怎么执行呢??直接敲?? 好像没什么用,所以说我需要打开我的cmd窗口来键入这些命令 而cmd也就是一个能把特殊的字母组合执行出来的一个程序而已 当我在cmd里键入dir的时候得到的就是这些东西 那我想在编译器里搞这个东西呢? 哦!第一反应就是os模块 import os os.system("dir") 就执行起来了吧 那我这算是拿到结果了吗? 我觉得不算,为什么? 咱们想要达到的效果是我在客户端输入一个dir发送给服务端,服务端给我返回这一堆东西才叫拿到结果了是吧 import os res = os.system("dir") print(f"返回的结果是:{res}") 那结果我打印的是什么呢??是0!那为什么是这个呢? 这个0是代表这个命令是不是成功 如果返回的是0,就是成功了,如果是非零,就是失败了! 所以说他返回的是一个是否成功执行语句的状态,而不是执行语句的返回结果 那os模块就被pass掉了