gbk

python if elif else 区别

匿名 (未验证) 提交于 2019-12-02 22:51:30
if data_ori == '医疗' : # 医疗 df = pd.read_excel(path_apply + 'apply/YS_ZY_HZSQ_样例.xls', encoding='gbk', error_bad_lines=False) df=df[['HZMD']] df=df[~df['HZMD'].isnull()]else: # 中国日报 df = pd.read_csv(path_apply + 'apply/原始文本.txt', header=None, encoding='gbk')return df if data_ori == '医疗' : # 医疗 df = pd.read_excel(path_apply + 'apply/YS_ZY_HZSQ_样例.xls', encoding='gbk', error_bad_lines=False) df=df[['HZMD']] df=df[~df['HZMD'].isnull()]elif: # 中国日报 df = pd.read_csv(path_apply + 'apply/原始文本.txt', header=None, encoding='gbk') return dfif 和 elif 的区别 来源:博客园 作者: 交流_QQ_2240410488 链接:https://www.cnblogs

python 2.x编解码

匿名 (未验证) 提交于 2019-12-02 22:11:45
#- - coding:utf-8 - - import sys print(sys.getdefaultencoding()) s = u"你好" #u代表unicode print(s) #s_to_unicode = s.decode("utf-8") #print(s_to_unicode) s_to_gbk = s.encode("gbk") print(s_to_gbk) #print("你好") gbk_to_utf8 = s_to_gbk.decode("gbk").encode("utf8") print(gbk_to_utf8)

公司Python大佬总结给新人的编码原理,看完彻底明白Python编码原理

匿名 (未验证) 提交于 2019-12-02 22:11:45
关于编码的历史演变,utf-8是如何一步步发展来的,windows为啥依旧保持gbk的编码。。。 等等这些问题,网上一搜一大堆,大部分都是转发、分享后的雷同内容,依旧解决不了我内心的疑惑。。。 编码是个蛋疼的事情,倘若不弄清楚, 怎么在中国混? 经过自己查阅多方文档、多次深入实验,我树立了对编码的基本世界观。 基础内容请自行谷歌..废话不多说,直接上干货!! 下面用几个简单的代码段, 一步步讲解编码中“编”和“解”的问题!!(linux中运行) “ 代码 一 ”: 1 import sys, locale 2 3 s = "小甲" 4 print(s) 5 print(type(s)) 6 print(sys.getdefaultencoding()) 7 print(locale.getdefaultlocale()) 8 9 with open("utf1","w",encoding = "utf-8") as f: 10 f.write(s) 11 with open("gbk1","w",encoding = "gbk") as f: 12 f.write(s) 13 with open("jis1","w",encoding = "shift-jis") as f: 14 f.write(s) 代码很简单,学过Python的人应该都能看懂是啥意思~~ 我们看一下运行结果:

读文件异常:java.nio.charset.MalformedInputException

匿名 (未验证) 提交于 2019-12-02 21:53:52
public static void main(String[] args) throws IOException { String content = Files.readAllLines(Paths.get("C:/Users/DELL/Desktop/1.txt")).stream() .collect(Collectors.joining("\n")); System.out.println(content); } 读取文件内容,但是在执行‘Files.readAllLines(path);’时,出现异常:java.nio.charset.MalformedInputException: Input length = 1。 查看源码发现: public static BufferedReader newBufferedReader(Path path) throws IOException { return newBufferedReader(path, StandardCharsets.UTF_8); } 而我要读的文件呢,是GBK! 也就是说,只要用GBK格式来读就可以了。修改如下: public static void main(String[] args) throws IOException { String content = Files

树莓派4B的入门操作

元气小坏坏 提交于 2019-12-02 16:43:13
一、树莓派系统烧录 ① 、准备一个8G以上的micro SD卡和读卡器,推荐使用class4以上的卡 ② 、登录 https://www.raspberrypi.org/downloads/ 获取系统安装。 ③ 、将下载下来的zip压缩包进行解压 ④ 、在Windows上使用etcher软件烧录,下载网站 https://www.balena.io/etcher 。 ⑤ 、将TF卡插入到读卡器里面,插到电脑USB上,打开etcher进行烧录,如果失败,可以对TF卡进行格式化,在进行烧录。 二、无屏幕有线远程连接 ① 、在TF烧写的系统的boot目录下,新建一个ssh文件。 ② 、用网线将树莓派和电脑连接起来,打开电源,启动树莓派。 ③ 、笔记本连接上无线网络,在电脑上右键wifi图标打开网络和共享中心>更改适配器设置,共享无线网络,如下图所示。 ④ 、打开电脑cmd,输入ipconfig查看以太网配置器的IP。 ⑤ 、输入arp -a查看树莓派IP地址,如下图所示。 ⑥ 、打开安装好putty软件,界面如下,输入树莓派IP地址,点击确认。 ⑦ 、进入以下界面,输入用户:pi,密码:raspberry,证明成功连接上树莓派 三、无屏幕无线远程连接 ① 、在TF烧写的系统的boot目录下,新建一个ssh文件和一个wpa_supplicant.conf文件,wpa_supplicant

第八章 网络编程

巧了我就是萌 提交于 2019-12-02 15:42:46
网络编程 1.网络基础 用途:未来的web框架的学习 未来的工作场景做铺垫 两个运行中的程序如何传递信息? 通过文件 两台机器上的两个运行中的程序如何通信? 通过网络 网络应用开发架构 C/S client 客户端 server 服务端 例如:迅雷 qq 浏览器 飞秋 输入法 百度云 pycharm git VNC 红蜘蛛 各种游戏 B/S browser 浏览器 server 服务端 例如:淘宝 邮箱 各种游戏 百度 博客园 知乎 豆瓣 抽屉 统一程序的入口 B/S和C/S架构的关系:B/S是特殊的C/S架构 3.网卡:是一个实际存在计算机中的硬件 4.mac地址:每块网卡上都有一个全球独一无二的mac地址 5.交换机:链接多台机器并帮助通讯的物理设备,只认识mac地址。 6.协议:两台物理设备之间对于要发送的内容,长度,顺序的一些约定 7.ip地址: ipv4协议 4位的点分十进制,32位2进制表示 0.0.0.0 - 255.255.255.255 ipv6协议 6位的冒分十六进制 128位2进制表示 0:0:0:0:0:0-FFFF:FFFF:FFFF:FFFF:FFFF:FFFF 8.公网ip:能被所有人访问到ip地址 9.内网ip:这些区间的ip地址公网不会使用,避免了公网ip和内网ip的重叠 192.168.0.0 - 192.168.255.255 172.16.0

1M大概多少个字

你说的曾经没有我的故事 提交于 2019-12-02 15:33:44
<?php echo strlen("你"); 保存文件为gbk 输出2 保存文件为utf-8 输出3 说明不同编码占用字节不同 1M=1024kB 1KB = 1024B 所以utf-8下字数为 1024*1024/3 = 349525.33个 gbk下字数为 524,288个 来源: https://www.cnblogs.com/php-linux/p/11751840.html

Java自学-I/O 中文问题

痴心易碎 提交于 2019-12-02 15:03:27
Java中的编码中文问题 步骤 1 : 编码概念 计算机存放数据只能存放数字,所有的字符都会被转换为不同的数字。 就像一个棋盘一样,不同的字,处于不同的位置,而不同的位置,有不同的数字编号。 有的棋盘很小,只能放数字和英文 有的大一点,还能放中文 有的“足够”大,能够放下世界人民所使用的所有文字和符号 如图所示,英文字符 A 能够放在所有的棋盘里,而且位置都差不多 中文字符, 中文字符 中 能够放在后两种棋盘里,并且位置不一样,而且在小的那个棋盘里,就放不下中文 步骤 2 : 常见编码 工作后经常接触的编码方式有如下几种: ISO-8859-1 ASCII 数字和西欧字母 GBK GB2312 BIG5 中文 UNICODE (统一码,万国码) 其中 ISO-8859-1 包含 ASCII GB2312 是简体中文,BIG5是繁体中文,GBK同时包含简体和繁体以及日文。 UNICODE 包括了所有的文字,无论中文,英文,藏文,法文,世界所有的文字都包含其中 步骤 3 : UNICODE和UTF 根据前面的学习,我们了解到不同的编码方式对应不同的 棋盘 ,而UNICODE因为要存放所有的数据,那么它的棋盘是最大的。 不仅如此,棋盘里每个数字都是很长的(4个字节),因为不仅要表示字母,还要表示汉字等。 如果完全按照UNICODE的方式来存储数据,就会有很大的浪费。 比如在ISO