ascii

关于json.dumps中的ensure_ascii

戏子无情 提交于 2020-03-15 13:16:15
在使用json.dumps时要注意一个问题 import json print json.dumps('中国') # 输出结果:"\u4e2d\u56fd" 输出的会是'中国' 中的ascii 字符码,而不是真正的中文。 这是因为json.dumps 序列化时对中文默认使用的ascii编码.想输出真正的中文需要指定ensure_ascii=False: import json print json.dumps('中国') # 输出结果:"\u4e2d\u56fd" print json.dumps('中国',ensure_ascii=False) # 输出结果:"中国" 转自: http://www.cnblogs.com/biangbiang/archive/2013/02/19/2916780.html 来源: https://www.cnblogs.com/nana-tech/p/5751167.html

参数名ASCII码从小到大排序(生成签名 )

不羁岁月 提交于 2020-03-10 06:09:49
1、 将整个json报文(剔除signature字段)参数按照参数名ASCII码从小到大排序(字典序),使用URL键值对的格式(key1=value1&key2=value2…)拼接成字符串signBlock。 2、 获取工作密钥signKey, 在signBlock最后拼接上signKey得到signBlock&signKey字符串,,得到sign值signature。 /** * 生成加签Block * * @param jsonString 原始报文 * @return 加签BLOCK */ private String generateSignBlockString(String jsonString) { try { if (null != jsonString && 0 != jsonString.trim().length()) { rglog.debug("jsonString=[{}]", jsonString);//原始报文json JSONObject jsonObject = JSONObject.parseObject(jsonString, Feature.OrderedField); Map maps = jsonObject.getInnerMap(); //Map maps = (Map)JSON.parse(jsonString);

NetAnalyzer笔记 之 十一 打造自己的协议分析语言(1)初衷与语法构想

此生再无相见时 提交于 2020-03-08 22:19:48
回头看看NetAnalyzer开发系文档上次一篇竟然是2016年,老脸一红。不过这几年墨云成功过的讨到一个温柔贤淑的老婆,有了一个幸福的家庭,去年9月又有了一个大胖儿子,想想也就释然了^_^ 其实这几年NetAnalyzer的开发一直也没有中断过,上一篇的NetAnalyzer还是3.x系列的版本,现在最新的版本已经是 5.6.0.38 版本了,去年8月份更新的 NetAnalyzer官网地址: http://twzy.sinaapp.com/ 废话不多说了,回到今天的主题--打造自己的协议分析语言。 1. 初衷 《道德经》中有“道生一,一生二,二生三,三生万物”的说法,描述了万物从少到多,从简单到复杂的一个过程。在计算机中我们所面对的各种各样的文件,如:图片,文本,音乐甚至最基本的程序文件其实都是通过二进制数据也就是大量的0或1的方式存储在硬盘或内存中的。但是如何从0和1转换为我们熟知的各种媒体数据呢,这就需要根据0和1不同的排列顺来完成,这就是编码方案,而这种编码方案更通俗的来说就是一种协议,这种协议来约束不同的设备,不同的系统当遇到对应的数据是应该将其解析为什么文件。 当今网络作为与我们生活朝夕相关的事物,给我们带来了便利的生活体验,有些应用甚至可以做到计算机与智能手机之间的无缝切换,这就得益于网络中各个层次的协议完美对接。目前的互联网模型大部分都是基于经典的TCP/IP协议

js常用(JqueryCDN&点击事件追踪)

浪尽此生 提交于 2020-03-08 20:49:31
jQuery 1.6 API 中文版 http://docs.30c.org/jquery16/index.html#p=outerHeight http://code.jquery.com/ jQuery CDN – Latest Stable Versions Powered by MaxCDN jQuery Core Showing the latest stable release in each major branch. See all versions of jQuery Core . jQuery 2.x (IE <9 not supported) jQuery Core 2.1.1 - uncompressed , minified jQuery 1.x jQuery Core 1.11.1 - uncompressed , minified jQuery Migrate jQuery Migrate 1.2.1 - uncompressed , minified jQuery UI Showing the latest stable release for the current and legacy release families. See all versions of jQuery UI . jQuery UI 1.11 jQuery UI 1.11.1

字符画

独自空忆成欢 提交于 2020-03-08 18:53:57
今日依旧无事,不想搞毕设。 无聊的人想法多,今日就想到把一只 Super Mario 在终端中输出。 具体做法十分「老土」,就是玩字符画那一套,但我这次想把这个字符串输出成彩色的。 准备工作 第一步当然是把图片转换为 24 位的位图,即 bmp 格式的图片,使用 Windows 自带的画图工具即可。 Aside 之所以叫 24 位图,是因为在这种格式的图片中,一个像素由三个整数 (R, G, B) 表示,每个整数均为 8 bit 的整型。R 是 Red,G 是 Green,B 是 Blue,光学三原色是也。 这样使用合适的库打开某个图片,访问 image[i][j] 就可以获得一个三元组 (R, G, B) ,后面的事情就是对这些三元组进行操作输出到终端。也就是说,一个彩色图片可以等价于一个三维数组 image[m][n][3] 。 打开图片 from PIL import Image image = Image.open(os.sys.argv[1]) image = image.resize((int(80), int(80)), Image.ANTIALIAS) # 可以通过 resize 调整高度和宽度 获取一个像素点 image.getpixel(i,j) 预处理为可操作的 list 类型 rgb_data = parse_image(image) def parse

json.dumps ensure_ascii 方法

无人久伴 提交于 2020-03-07 12:05:59
在使用json.dumps时要注意一个问题 import json print (json.dumps('中国')) "\u4e2d\u56fd" 输出的会是 '中国' 中的ascii 字符码,而不是真正的中文。 这是因为json.dumps 序列化时对中文默认使用的ascii编码.想输出真正的中文需要指定ensure_ascii=False: import json print (json.dumps('中国')) "\u4e2d\u56fd" print (json.dumps('中国',ensure_ascii=False)) "中国" 同样如果指定为 ensure_ascii=True,他还是会输出 ascii 字符码 print (json.dumps('中国',ensure_ascii=True)) "\u4e2d\u56fd" 来源: https://www.cnblogs.com/shao-shuai/p/10118040.html

ASCII 、UNICODE和UTF-8

安稳与你 提交于 2020-03-06 13:12:52
字符发展 1. 美国 ASCII-(American standard code information interchange) 美国信息互换标准代码 范围:1-127 ; 单字 备注:前部用作控制码,0x20以下的字节状态称为"控制码";后面跟数字,字母大小写至127 2. 美国 ASCII扩展编码 范围:128-255; 单字 备注:很多画表格时需要用下到的横线、竖线、交叉等形状,一直把序号编到了最后一 个状态255 3. 中国GB2312 原由:中国人们得到计算机时,有6000多个常用汉字需要保存呢 规定:一个小于127的字符的意义与原来相同,但两个大于127的字符连在一起时,就表示一个汉字, 前面的一个字节(他称之为高字节)从0xA1用到 0xF7,后面一个字节(低字节)从0xA1到0xFE, 这样我们就可以组合出大约7000多个简体汉字了 范围:0xA1A1~0xF7FE;双字 备注:连在 ASCII 里本来就有的数字、标点、字母都统统重新编了两个字节长的编码, 这就是常说的"全角"字符,而原来在127号以下的那些就叫"半角"字符了 4. 中国GBK 原由:但是中国的汉字太多了,我们很快就就发现有许多人的人名没有办法在这里打出来 规定:于是干脆不再要求低字节一定是127号之后的内码,只要第一个字节是大于127就固定表示这是一个汉字的开始 范围:0xA100

IMDB情感分类学习

我只是一个虾纸丫 提交于 2020-03-03 00:53:04
需要学习链接: 使用pandas做预处理, https://blog.csdn.net/mpk_no1/article/details/71698725 https://www.jianshu.com/p/8d3f929c9444 1.我的想法: 1.首先是要读取数据集,建立字典,将word转为id准备输入; 2.想获取数据文本的长度分布,然后做截断,但不知道怎么写; 但是链接中考虑的更全面 1.去掉非ASCII字符,2.去掉换行符,3.转换为小写。 https://blog.csdn.net/icbm/article/details/79747024 非ASCII字符: [^\x00-\x7f] 比如这样。就是不在ASCII编码中的字符吧。 其中用到了pandas库, 来源: https://www.cnblogs.com/BlueBlueSea/p/12399185.html

mysql 多语言编码

久未见 提交于 2020-03-02 03:01:15
============================================================== 补充材料一: ============================================================== mysql字符编码是版本4.1引入的,支持多国语言,而且一些特性已经超过了其他的数据库系统。 我们可以在MySQL Command Line Client 下输入如下命令查看mysql的字符集 mysql> SHOW CHARACTER SET; +----------+-----------------------------+---------------------+--------+ | Charset | Description | Default collation | Maxlen | +----------+-----------------------------+---------------------+--------+ | big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 | | dec8 | DEC West European | dec8_swedish_ci | 1 | | cp850 | DOS West European |

mysql字符集编码整理

不想你离开。 提交于 2020-03-02 02:59:42
armscii8 (ARMSCII-8 Armenian) armscii8_bin 亚美尼亚语, 二进制 armscii8_general_ci 亚美尼亚语, 不区分大小写 ascii (US ASCII) ascii_bin 西欧 (多语言), 二进制 ascii_general_ci 西欧 (多语言), 不区分大小写 big5 (Big5 Traditional Chinese) big5_bin 繁体中文, 二进制 big5_chinese_ci 繁体中文, 不区分大小写 binary (Binary pseudo charset) binary 二进制 cp1250 (Windows Central European) cp1250_bin 中欧 (多语言), 二进制 cp1250_croatian_ci 克罗地亚语, 不区分大小写 cp1250_czech_cs 捷克语, 区分大小写 cp1250_general_ci 中欧 (多语言), 不区分大小写 cp1251 (Windows Cyrillic) cp1251_bin 西里尔语 (多语言), 二进制 cp1251_bulgarian_ci 保加利亚语, 不区分大小写 cp1251_general_ci 西里尔语 (多语言), 不区分大小写 cp1251_general_cs 西里尔语 (多语言), 区分大小写