编码转换

《编码》读书笔记:从无到有构建计算机系统

人走茶凉 提交于 2020-02-10 07:49:47
1 简单的电报系统: 按键、发声装置,电池和一些导线即可构成: 当电报机的键按下时,发生器的电磁铁将可动棒拖下发出“滴”的声音;当键放开时,棒弹回初始位置,发出“嗒”的声音。快速的“嘀嗒”为点,慢速的则为划。 2 继电器 电磁式继电器一般由铁芯、线圈、衔铁、触点簧片等组成的。只要在线圈两端加上一定的电压,线圈中就会流过一定的电流,从而产生电磁效应,衔铁就会在电磁力吸引的作用下克服返回弹簧的拉力吸向铁芯,从而带动衔铁的动触点与静触点(常开触点)吸合。当线圈断电后,电磁的吸力也随之消失,衔铁就会在弹簧的反作用力返回原来的位置,使动触点与原来的静触点(常闭触点)吸合。这样吸合、释放,从而达到了在电路中的导通、切断的目的。对于继电器的“常开、常闭”触点,可以这样来区分:继电器线圈未通电时处于断开状态的静触点,称为“常开触点”;处于接通状态的静触点称为“常闭触点”。 长距离导线会有很大的电阻,会导致电流越来越小。下图中的继电器系统就是为了增大电流。 上述通信系统中的继电器的简单实现: 3 逻辑代数与电路 逻辑代数是分析和设计逻辑电路的数学基础。逻辑代数是由英国科学家乔治·布尔(George·Boole)创立的,故又称布尔代数。 4 逻辑门 (logic gates) 逻辑门和通常让水和人通过的门十分相似。逻辑门通过阻挡或允许电流通过在逻辑中执行简单的任务。 (1)与门

基础数据类型补充以及编码的进阶

一笑奈何 提交于 2020-02-10 01:57:58
python 基础数据类型补充以及编码的进阶 一. 基础数据类型补充内容 1.1 字符串 字符串咱们之前已经讲了一些非常重要的方法,剩下还有一些方法虽然不是那么重要,但是也算是比较常用,在此给大家在补充一些,需要大家尽量记住。 #captalize :首字母大写        #swapcase :大小写翻转        #title   :每个单词的首字母大写 #center    :内同居中,总长度,空白处填充 #寻找字符串中的元素是否存在       #find     :返回的找到的元素的索引,如果找不到返回-1 #index     :返回的找到的元素的索引,找不到报错。 #captalize,swapcase,title print(name.capitalize()) #首字母大写 print(name.swapcase()) #大小写翻转 msg='taibai say hi' print(msg.title()) #每个单词的首字母大写 # 内同居中,总长度,空白处填充 ret2 = a1.center(20,"*") print(ret2) #寻找字符串中的元素是否存在 # ret6 = a4.find("fjdk",1,6) # print(ret6) # 返回的找到的元素的索引,如果找不到返回-1 # ret61 = a4.index("fjdk",4,6

DialogueGCN论文翻译

半城伤御伤魂 提交于 2020-02-09 20:10:58
对话GCN:对话中情感识别的图卷积神经网络 绪论 会话中的情感识别(ERC)最近受到了研究者的广泛关注,因为它在医疗,教育和人力资源等各个领域都有潜在的广泛应用。 在本文中,我们介绍了对话图卷积网络(DialogueGCN),这是一种基于图神经网络的ERC方法。 我们利用对话者的自我和说话者之间的依存关系来为情感识别建模会话上下文。 通过图网络,DialogueGCN解决了当前基于RNN的方法中存在的上下文传播问题。 我们凭经验表明,这种方法可以缓解此类问题,同时在许多基准情感分类数据集上的表现要优于当前水平。 1 引言 几十年来,情绪识别一直是一个活跃的研究主题(K. D’Mello等,2006; Busso等,2008; Strapparava和Mihalcea,2010)。 然而,最近在社交媒体平台(例如Facebook,Twitter,Youtube和Red dit)上开放式对话数据的激增引起了热烈的关注(Poria等人,2019b; Majumder等人,2019; Huang等人。 (2019年),从研究人员转向对话中的情感识别(ERC)。 不可否认,ERC在情感对话系统(如图1所示)中也很重要,在这种对话中,机器人可以理解用户的情绪并产生连贯和移情反应的情绪。 图1:情感对话的插图,其中情感取决于上下文。 健康助手了解用户的情感状态,以生成情感和移情反应

Eclipse编码格式

烂漫一生 提交于 2020-02-09 18:20:49
来源:http://e-ant.javaeye.com/blog/177579 如果要使插件开发应用能有更好的国际化支持,能够最大程度的支持中文输出,则最好使 Java文件使用UTF-8编码。然而, Eclipse工 作空间(workspace)的缺省字符编码是操作系统缺省的编码,简体中文操作系统 (Windows XP、Windows 2000简体中文)的缺省编码是GB18030,在此工作空间中建立的工程编码是GB18030,工程中建立的java文件也是GB18030。如果要使 新建立工程、java文件直接使UTF-8则需要做以下工作: 1、windows->Preferences...打开"首选项"对话框,左侧导航树,导航到 general->Workspace,右侧Text file encoding,选择Other,改变为UTF-8,以后新建立工程其属性对话框中的Text file encoding即为UTF-8。 2、windows->Preferences...打开"首选项"对话框,左侧导航树,导航到 general->Content Types,右侧Context Types树,点开Text,选择Java Source File,在下面的Default encoding输入框中输入UTF-8,点Update,则设置Java文件编码为UTF-8

Byte[]和BASE64

家住魔仙堡 提交于 2020-02-09 15:29:06
https://www.cnblogs.com/chnking/archive/2007/08/12/852669.html 一、 BASE64 编码 把byte[]中的元素当做无符号八位整数转换成只含有64个基本字符的字符串,这些基本字符是: l 大写的A-Z l 小写的a-z l 数字0-9 l '+' 和 '/' 这64个字符构成BASE64的字符集。‘=’,为填充字符,结尾处可以填充0-2个填充字符 Base64是将原文按照每 3 个字节一组分开,这个 3 字节组中的每一组将被按照位分解成 4 个部分,每个部分 6 个位,在这 4 个部分的每个部分高位加上 2 个 0构成一个新的 4 字节组,新的字节组中,每个字节只有 6 位,能表示64个值。 在原文在转换为BASE64编码时,试是以3个字节为一组转换成4字节一组的BASE64编码。如果原文不是三字节的倍数,可能多出一个字节和两个字节,分别会被转为2字节和3字节的BASE64编码,这时编码系统应该在形成的BASE64编码最后添加上填充符”=”,保证BASE64编码长度是4的倍数。所以在BASE64编码后添加的填充符”=”可能为0-2个。 BASE64编码对照表如下: Value Encoding Value Encoding Value Encoding Value Encoding 0 A 16 Q 32 g 48 w

Python入门(一)

泄露秘密 提交于 2020-02-09 15:16:38
写在开头: A:python的交互式环境 B:使用Notepad++编写python程序,保存为.py文件 1,Python中的数据类型: 整数、浮点数、字符串、布尔值(True、False)、空值(None) None不能理解为0,因为0是有意义的,而None是一个特殊的空值。 此外,Python还提供了列表、字典等多种数据类型,还允许创建自定义数据类型 2,print语句 语句也可以跟上多个字符串,用逗号“,”隔开,就可以连成一串输出: 3,注释 4,变量 在Python程序中,变量是用一个变量名表示,变量名必须是大小写英文、数字和下划线(_)的组合,且不能用数字开头; 在Python中,等号“=”是赋值语句,可以把任意数据类型赋值给变量,同一个变量可以反复赋值,而且可以是不同类型的变量,例如: 这种变量本身类型不固定的语言称之为动态语言,与之对应的是静态语言。静态语言在定义变量时必须指定变量类型,如果赋值的时候类型不匹配,就会报错。例如Java是静态语言,赋值语句如下(// 表示注释): 和静态语言相比,动态语言更灵活,就是这个原因。 最后,理解变量在计算机内存中的表示也非常重要。当我们写: a = 'ABC' 时,Python解释器干了两件事情:1. 在内存中创建了一个 'ABC' 的字符串;2. 在内存中创建了一个名为 a 的变量,并把它指向 'ABC'; 5,定义字符串

js escape,unescape解决中文乱码问题的方法

吃可爱长大的小学妹 提交于 2020-02-09 02:04:24
Js将字符串转换为特定的编码,使其能够被任意的计算机识别和读取 1.escape 方法 对 String 对象编码以便它们能在所有计算机上可读, escape(charString) 必选项 charstring 参数是要编码的任意 String 对象或文字。 说明 :   escape 方法返回一个包含了 charstring 内容的字符串值( Unicode 格式)。所有空格、标点、重音符号以 及 其他非 ASCII字符都用 %xx 编码代替,其中 xx 等于表示该字符的十六进制数。例如,空格返回的是"%20 " 。 字符值大于 255 的以 %uxxxx 格式存储。   注意 :escape 方法不能够用来对统一资源标示码 (URI) 进行编码。对其编码应使用 encodeURI和encodeURIComponent 方法。 2.unescape 方法 解码用 escape 方法进行了编码的 String 对象。 unescape(charstring) 必选项 charstring 参数是要解码的 String 对象。 说明 : unescape 方法返回一个包含 charstring 内容的字符串值。所有以 %xx 十六进制形式编码的字符都用 ASCII 字符集中等价的字符代替。 以 %uxxxx 格式(Unicode 字符)编码的字符用十六进制编码 xxxx 的

Google Protocol Buffers 概述

心已入冬 提交于 2020-02-08 23:18:42
Google Protocol Buffers 概述 个人小站,正在持续整理中,欢迎访问: http://shitouer. cn 小站博文地址: Google Protocol Buffers 概述 推荐阅读顺序,希望给你带来收获~ 《 Google Protocol Buffers 概述 》 《 Google Protocol Buffers 入门 》 《 Protocol Buffers 语法指南 》 《 Google Protocol Buffers 编码(Encoding) 》 1. 概述 Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化,或者说序列化。它很适合做数据存储或 RPC 数据交换格式。可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。目前提供了 C++、Java、Python 三种语言的 API。 本文概述介绍Protocol Buffers,以及开始如何开始Protocol Buffers之旅,本系列主要以Java为主(虽然超想看Python的,无奈学的还不够...)。 以下Protocol Buffers简称PB。 2. Protocol Buffers是什么 Protocol Buffers提供了一种灵活,高效,自动序列化结构数据的机制,可以联想XML,但是比XML更小,更快

python 的字符编码

邮差的信 提交于 2020-02-08 15:52:34
1. unicode 与utf-8 https://www.jianshu.com/p/e1fd1d936278 ASCII 是字符集+编码规则。只对英文字母和常见的符号进行了编号,最多只有256个字符(一个byte) Unicode 是「字符集」, 为世界上的所有字符统一指定了一个2byte 数字 UTF-8 是「编码规则」, 这是一种存储编码实现方式,感觉是为了节省内存空间用的。使用不定长度编码,比如字母用1个byte, 汉字用三个byte. https://www.cnblogs.com/lowmanisbusy/p/9136347.html unicode编码: unicode编码为世界上所有字符都分配了一个唯一编号, 为十六进制, 如中文简体汉字 “渣” 的 Unicode编号就是 6E23, unicode仅仅定义了每个字符的编号,并没有定义如何将这个编号进行存储的方式,所以后来出现了utf-8, gbk等编码格式, 它们都是 unicode 的一种实现方式, 仍然使用了unicode 中的唯一编号, 个人对其的简单理解就是在unicode编码的基础之上又定义了对字符的存储方式. https://www.jianshu.com/p/9920595791b7 在计算机最早期,只有ascii编码,但是ascii编码方式一个字符只占用一个字节,这样就只能表示英文字符了

Tomcat窗口标题,中文乱码解决方法

可紊 提交于 2020-02-08 13:49:42
工作中,或多或少的原因,一台服务器中需要同时运行多个Tomcat服务(针对一台服务器如何同时运行多个Tomcat的配置,这里不做论述,百度很多),为了便于区分各个Tomcat的功能,通常会选择修改tomcat的窗口标题,这时会容易出现中文标题乱码的问题,这里记录一下我的解决方法,一起共勉。 一、问题如图所示,我想改为的标题为: 标题测试Tomcat ,包含中文,会出现中文乱码,英文不会乱码。 二、出现中文乱码的原因是, apache-tomcat-7.0.69\bin\catalina.bat文件的编码与系统的编码不一致造成 的。了解了问题出现的原因,就好对症下药了。 (1)、查看电脑系统的编码 针对Windows平台下,点击 运行--输入cmd ,enter键进入命令窗口, 输入:chcp 可以得到 操作系统的代码页信息 (代码页:字符集编码的别名),可以从控制面板的语言选项中查看代码页对应的详细的字符集信息。如图所示:我系统的活动代码页为:936,它对应的编码格式为GB2312。 部分代码页对应的编码信息: (2)、查看catalina.bat文件的编码方式,使用Notepad++等文本编辑器软件,可以在右下角看到文件的编码方式。 如图所示: (3)、然后将Catalina.bat文件的编码方式改为GB2312,同系统的编码方式一致,就可以解决tomcat中文标题乱码问题。