utf8

Python3 文件操作

懵懂的女人 提交于 2020-03-04 22:14:24
一 介绍 计算机系统分为:计算机硬件,操作系统,应用程序三部分。 我们用python或其他语言编写的应用程序若想要把数据永久保存下来,必须要保存于硬盘中,这就涉及到应用程序要操作硬件,众所周知,应用程序是无法直接操作硬件的,这就用到了操作系统。操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用,其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念,用户或应用程序通过操作文件,可以将自己的数据永久保存下来。 有了文件的概念,我们无需再去考虑操作硬盘的细节,只需要关注操作文件的流程: 1、首先找到文件,使用open()函数, a = open("文件路径",“r”) 2、读取文件,使用open()函数的read()方法,data = a.read() 3、关闭文件,使用close()函数,a.close() 实例(Python3.0+): # 1. 打开文件,得到文件句柄并赋值给一个变量 f = open(r'C:\Users\lynn\Desktop\桌面\Python.txt','r',encoding='utf8') # --> 默认打开方式为r # 2. 通过句柄对文件进行操作 print(f.read(3)) # ab床 # 关闭文件 f.close() ''' 过程分析: 1、由应用程序向操作系统发起系统调用open(...) 2、操作系统打开该文件

网络协议设计的思考总结

不问归期 提交于 2020-03-04 10:19:24
字符编码 ascii , Unicode ,UTF-8 ,UTF16,UTF32… 阮一峰的文章 ##编码和网络字节序 最近在做一个项目时,遇到一个问题: 1 应用层的数据组织格式是json,字符集的编码是UTF-8,把数据encode时,是否要将数据转成大端模式(网络字节序)? 1 答案是:UTF-8 编码不需要,但UTF-16,UTF-32 需要 大专栏 网络协议设计的思考总结 /tr> 我一开始觉得对于utf-8 也需要考虑大小端的问题,我的出发点是: utf-8 编码的数据会有非单字节的表示的数据 现在理清楚 首先,应用层数据对于TCP/IP协议栈时透明的(也就是传输层,及以下,把应用层的数据当成字节流而已,不去解析数据) 客户端从服务器获取到数据后,手动去解析,或者用文本查看器查看文本,只要按UTF-8 编码方式去解析(单字节解析),就不存在大小端问题 假如,用UTF-16 或者UTF-32 编码,客服端的处理器架构不一样(大端,小端都有),那么解析编码时(假如用UTF-16 ),两个字节一块提取出来,放到内存里面,矛盾就会出现~ 所以,假如用UTF-16,UTF-32 编码,统一将数据转成大端模式(或小端模式的数据),各自特定平台,就根据自己平台的特点,如果矛盾,进行处理,再解析(不矛盾,就直接解析) 来源: https://www.cnblogs.com

Response响应解决中文乱码问题

霸气de小男生 提交于 2020-03-03 07:13:06
默认情况下造成中文内容乱码的原因: 1、把中文内容存放到缓冲区中使用的是ISO8859编码。 2、ISO8859不支持中文。 解决方法(必须放在设置响应体之前来设置编码格式): 1、设置缓存区编码格式为UTF-8,使用 setCharacterEncoding() 方法。 2、在响应中主动告诉浏览器使用UTF-8编码格式接收数据,使用 setHeader() 方法。 3、使用封装类简写Content-Type,使用 setContentType() 方法则无需使用 setCharacterEncoding() 方法,推荐使用这种方法。 //设置缓存区编码为UTF-8编码格式 response.setCharacterEncoding("UTF-8"); //在响应中主动告诉浏览器使用UTF-8编码格式来接收数据 response.setHeader("Content-Type", "text/html;charset=UTF-8"); //可以使用封装类简写Content-Type,使用该方法则无需使用setCharacterEncoding response.setContentType("text/html;charset=UTF-8"); 来源: CSDN 作者: jiangwenhao_1 链接: https://blog.csdn.net/qq_40332952

众筹项目学习

♀尐吖头ヾ 提交于 2020-03-03 01:46:29
众筹项目学习 一、登录模块 welcome页面,<jsp:forward page="/index"></jsp:forward>去找控制器 < % @ page language = "java" contentType = "text/html; charset=UTF-8" pageEncoding = "UTF-8" % > < ! DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd" > < html > < head > < meta http - equiv = "Content-Type" content = "text/html; charset=UTF-8" > < title > Insert title here < / title > < / head > < body > < jsp : forward page = "/index" > < / jsp : forward > < / body > < / html > 登录controller @RequestMapping ( "dologin" ) @ResponseBody public Map < String , String > doLogin

角色权限分配(没有比这讲的更细的了)

百般思念 提交于 2020-03-02 17:56:31
第一大块 数据库表设计 最基本的实现权限树分配的话是需要三张表就可以了,企业级项目的实现权限树需要设计五张六张的也有,那种逻辑关系也就相当复杂了,可是要实现的话,三张足矣! emp表 tb_dept_power部门权限关联表 tb_power权限表 查询权限的关键sql,表示查询登录的员工在权限表中所对应的权限信息 select id , name , parentid , state , iconcls , url from tb_power where id in ( select powerid from tb_dept_power where deptno = ( select deptno from emp where empno = ? ) ) 首先是 emp 员工表,后台系统是员工进行登录,在登录之后记下员工的部门编号(每个员工),然后根据部门编号在 tb_dept_power 部门权限关联表中查询该部门拥有的权限 powerId ,再根据权限 powerId 在 tb_power 权限表中查询所对应的节点信息。 emp表 CREATE TABLE ` NewTable ` ( ` empid ` int ( 10 ) NOT NULL AUTO_INCREMENT COMMENT '员工序号' , ` empno ` varchar ( 30 ) CHARACTER

工作中使用的utf8与utf8mb4记录

£可爱£侵袭症+ 提交于 2020-03-02 11:13:28
一、起源 我们工作中使用到了 Emoji 表情,发现utf8不能很好支持 二、研究utf8mb4 MySQL在5.5.3之后增加utf8mb4的编码,mb4表示most bytes 4,专门用来兼容四字节的unicode,utf8 编码最大字符长度为 3 字节, 4 字节的字符插入会产生异常,utf8mb4 会需要更大空间,排序规则选择 utf8mb4_general_ci、utf8mb4_unicode_ci,utf8mb4_general_ci对比utf8mb4_unicode_ci速度快,但精准性要低 来源: 51CTO 作者: 素颜猪 链接: https://blog.51cto.com/suyanzhu/2474831

mysql的collation

拥有回忆 提交于 2020-03-02 03:02:28
mysql的collation大致的意思就是字符序。首先字符本来是不分大小的,那么对字符的>, = , < 操作就需要有个字符序的规则。collation做的就是这个事情,你可以对表进行字符序的设置,也可以单独对某个字段进行字符序的设置。一个字符类型,它的字符序有多个,比如: 下面是UTF8对应的字符序。 utf8_general_ci utf8 33 Yes Yes 1 utf8_bin utf8 83 Yes 1 utf8_unicode_ci utf8 192 Yes 8 utf8_icelandic_ci utf8 193 Yes 8 utf8_latvian_ci utf8 194 Yes 8 utf8_romanian_ci utf8 195 Yes 8 utf8_slovenian_ci utf8 196 Yes 8 utf8_polish_ci utf8 197 Yes 8 utf8_estonian_ci utf8 198 Yes 8 utf8_spanish_ci utf8 199 Yes 8 utf8_swedish_ci utf8 200 Yes 8 utf8_turkish_ci utf8 201 Yes 8 utf8_czech_ci utf8 202 Yes 8 utf8_danish_ci utf8 203 Yes 8 utf8_lithuanian

mysql 多语言编码

久未见 提交于 2020-03-02 03:01:15
============================================================== 补充材料一: ============================================================== mysql字符编码是版本4.1引入的,支持多国语言,而且一些特性已经超过了其他的数据库系统。 我们可以在MySQL Command Line Client 下输入如下命令查看mysql的字符集 mysql> SHOW CHARACTER SET; +----------+-----------------------------+---------------------+--------+ | Charset | Description | Default collation | Maxlen | +----------+-----------------------------+---------------------+--------+ | big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 | | dec8 | DEC West European | dec8_swedish_ci | 1 | | cp850 | DOS West European |

mysql字符集编码整理

不想你离开。 提交于 2020-03-02 02:59:42
armscii8 (ARMSCII-8 Armenian) armscii8_bin 亚美尼亚语, 二进制 armscii8_general_ci 亚美尼亚语, 不区分大小写 ascii (US ASCII) ascii_bin 西欧 (多语言), 二进制 ascii_general_ci 西欧 (多语言), 不区分大小写 big5 (Big5 Traditional Chinese) big5_bin 繁体中文, 二进制 big5_chinese_ci 繁体中文, 不区分大小写 binary (Binary pseudo charset) binary 二进制 cp1250 (Windows Central European) cp1250_bin 中欧 (多语言), 二进制 cp1250_croatian_ci 克罗地亚语, 不区分大小写 cp1250_czech_cs 捷克语, 区分大小写 cp1250_general_ci 中欧 (多语言), 不区分大小写 cp1251 (Windows Cyrillic) cp1251_bin 西里尔语 (多语言), 二进制 cp1251_bulgarian_ci 保加利亚语, 不区分大小写 cp1251_general_ci 西里尔语 (多语言), 不区分大小写 cp1251_general_cs 西里尔语 (多语言), 区分大小写

html在游览器端乱码问题

ぐ巨炮叔叔 提交于 2020-03-01 19:02:46
1,先确认html文件本身的编码格式(用记事本打开,可以看到文件本身的编码格式,假如要从gbk改为utf-8,可以另存为新文件时选择编码格式即可) 2,responseHeader中的响应格式 content-type:text/html; charset=UTF-8 3,假如1和2都没有问题,要检查tomcat启动时的参数,file.encoding跟操作系统默认字符集有关,Windows下默认的是GBK,但我们程序一般IO流中字符编码一般都设置的是utf-8,这样会导致中文乱码。   只需要在JVM启动参数上加上 -Dfile.encoding=UTF-8 4,防止访问某一页面时,一直访问的是缓存(状态码304),清空缓存。 下面是在idea中设置tomcat启动时的编码为utf-8      来源: https://www.cnblogs.com/moris5013/p/12391136.html