python字符串

Python编码decode和encode

匿名 (未验证) 提交于 2019-12-02 22:54:36
Python编码decode和encode 常见编码介绍: GB2312编码:适用于汉字处理、汉字通信等系统之间的信息交换; GBK编码:是汉字编码标准之一,是在 GB2312-80 标准基础上的内码扩展规范,使用了双字节编码 ASCII编码:是对英语字符和二进制之间的关系做的统一规定。主要是老美用. *****日本、韩国其他国家也有自己的编码规则,如果多语言混用就出现乱码,所以unicode产生 Unicode编码:这是一种世界上所有字符的编码。当然了它没有规定的存储方式。 UTF-8编码:是 Unicode Transformation Format - 8 bit 的缩写, UTF-8 是 Unicode 的一种实现方式。它是可变长的编码方式,可以使用 1~4 个字节表示一个字符,可根据不同的符号而变化字节长度。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间,UTF-8的一个好处在于,原有的ASCII的编码可以在UTF-8下继续工作。 编码转换 字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码 ,如str1.decode(

python 关于 ValueError: dictionary update sequence element #0 has length 1; 2 is required的原因和解决办法

匿名 (未验证) 提交于 2019-12-02 22:54:36
相信大家接触python字典后,会遇到这样的报错,其实我们都知道无非就是字符串和字典之间的转换,笔者刚开始的时候也遇到这个问题了,天真的以为字典和字符串之间的转换用str()和dict()转换,不罗索,直接上图! 但是笔者爬取数据的时候,因为self.read_188bet_cookie()方法返回给我一个字符串,但是requests里的cookies=(必须是一个字典),所以笔者就天真的用dict()方法把字符串转换为字典,理论上是没有问题的,但是现实可不是这样的,拍黑板了!!!字符串转字典要用eval(),这个方法很多书上都没有介绍,有关eval()的用法,传送门 eval的用法 问题解决,希望对大家有帮助,谢谢大家 文章来源: python 关于 ValueError: dictionary update sequence element #0 has length 1; 2 is required的原因和解决办法

Python 笔试 ―― 效率与优雅

匿名 (未验证) 提交于 2019-12-02 22:51:30
字符串拼接: 加号拼接字符串将造成对象的创建和垃圾的回收; 使用字符串的 join 方法对尤其是循环中的字符串进行拼接(先将不断出现的字符串 append 到 一个 list 中,再进行 join); >> '' . join ( 'hello' ). join ( 'world' ) 'whelloohellorhellolhellod' # 会对 'hello' 迭代遍历 >> '' . join ([ 'hello' , 'world' ]) 'helloworld' 文章来源: Python 笔试 ―― 效率与优雅

Python字符串分割方法总结

匿名 (未验证) 提交于 2019-12-02 22:51:30
Python中字符串分割的常用方法是直接调用字符串的 str.split 方法,但是其只能指定一种分隔符,如果想指定多个分隔符拆分字符串需要用到 re.split 方法(正则表达式的split方法)。 str.split 字符串的split方法函数原型如下,其中sep为指定的分隔符,maxsplit为最大分割次数: 1 str.split(sep= None, maxsplit= -1) 默认情况下,不指定分隔符时则以空白字符(空格,回车,制表符等)作为分隔符拆分字符串: 1 2 3 4 >>> s = 'A B\tC\nD' >>> s.split() [ 'A', 'B', 'C', 'D'] >>> 在结果列表中,不会包含空字符串: 1 2 3 4 >>> s = ' A B\tC\nD\n\n' >>> s.split() [ 'A', 'B', 'C', 'D'] >>> 指定分隔符: 1 2 3 4 5 6 7 >>> s = 'www.google.com' >>> s.split( '.') [ 'www', 'google', 'com'] >>> s = 'AA||BB||CC||DD' >>> s.split( '||') [ 'AA', 'BB', 'CC', 'DD'] >>> 指定最大分割次数: 1 2 3 4 5 6 7 >>> s = 'www

Python 字符串转JSON; 先装字典在转JSON; json.dumps(d)

匿名 (未验证) 提交于 2019-12-02 22:51:30
#-*- coding:UTF-8 -*- import os; import json class MysqlUtil(): def __init__(self): pass if __name__ == '__main__': document = open("C:/Users/ald/Desktop/log/access_api/access_api.log", "r"); document_w = open("C:/Users/ald/Desktop/log/access_api/access_api.json", "w"); doc_list = document.readlines() for line in doc_list: line_arr=line.split('"') #print line_arr if(len(line_arr)<=3): continue ip_arr=line_arr[0].split(' ') if(len(ip_arr)==0): continue ip_str=ip_arr[0] url_arr=line_arr[1].split(' ') if(len(url_arr)<=2): continue url_type=url_arr[0] url_str=url_arr[1] time_arr=line_arr[2].split(

Python学习笔记―基本数据类型

匿名 (未验证) 提交于 2019-12-02 22:51:30
基础数据类型: 六个标准的数据类型:   Number(数字)   String(字符串)   List(列表)   Tuple(元祖)   Sets(集合)   Dictionary(字典) ―――――――― 不可变数据(四个) :Number(数字)、String(字符串)、Tuple(元祖)、Sets(集合) 可变数据(两个) :List(列表)、Dictionary(字典) 一:Number(数字) 四则运算:      在有浮点型的计算中,Python会把整型转换为浮点型 二:String(字符串)   Python中的字符串用单引号(')或双引号(")括起来,同时使用反斜杠(\)转义特殊字符。   记住字符串的常用功能: 1 >>>s="abcdef ghg k" 2 ------------------------------------------ 3 >>>print(s.title()) #将字符串转换成标题 4 Abcdef Ghg K 5 >>>print(s.capitalize()) #将字符串首字母大写 6 Abcdef ghg k 7 >>>print(s.count('d',0,len(s))) #计算出子串 'd'在母串中出现的次数,默认是在整个母串中查找 8 1 9 >>>print(s.startswith('a'))

day1-02 python程序语法分析

匿名 (未验证) 提交于 2019-12-02 22:51:30
程序的格式框架 命名与保留字 数据类型 语句与函数 Python程序的输入输出 # TempConvert.py # 输入温度 TempStr = input("请输入带有符号的温度值: ") if TempStr[-1] in ['F', 'f']: C = (eval(TempStr[0:-1]) - 32) / 1.8 print(f"转换后的温度是{C:.2f}C") elif TempStr[-1] in ['C', 'c']: F = 1.8 * eval(TempStr[0:-1]) + 32 print(f"转换后的温度是{F:.2f}F") else: print("输入格式错误") 代码高亮:编程的色彩辅助体系,不是语法要求 缩进:一行代码开始前的空白区域,表达程序的格式框架 严格明确:缩进是语法的一部分,缩进不正确程序运行错误 所属关系:表达代码间包含和层次关系的唯一手段 长度一致:程序内一致即可,一般用4个空格或1个TAB 注释:用于提高代码可读性的辅助性文字,不被执行,不被程序执行的辅助性说明信息 单行注释:以#开头,其后内容为注释 # 这里是单行注释 多行注释:以'''or"""开头和结尾 ''' 这是多行注释第一行 这是多行注释第二行 ''' 变量:程序中用于保存和表示数据的占位符号 变量采用标识符(名字) 来表示,关联标识符的过程叫命名,

Python基础数据类型考试题

匿名 (未验证) 提交于 2019-12-02 22:51:30
# Python基础数据类型考试题 # 考试时间:两个半小时 满分100分(80分以上包含80分及格) # 一,基础题。 # 1, 简述变量命名规范(3分) # 1、变量由字母、数字、下划线任意组成 # 2、不能以数字开头 # 3、不能使用python关键字 # 4、变量要具有可描述性 # 5、变量不能是中文 # 5、官网推荐骆峰体和下划线,这里推荐下划线 # 2,字节和位的关系。(2分) # 1字节 = 8位 # 3,’太白’使用utf-8编码时,占的位数和字节数,是多少?使用gbk编码时,占的位数 # 和字节数,是多少。(2分) # 太白 utf-8 位数:48 字节:6 # gbk 位数:32 字节:4 # 4,默写字符串的十二个功能,并描述其作用。(12分) # 1、capitalize() 首字母大写 # 2、upper() 字符串全部大写 # 3、lower() 字符串全部小写 # 4、format() 格式化输出 # 5、strip() 去字符串左右空格,tab,换行符 # 6、replace() 字符串替换 # 7、lstrip() 去字符串左边空格,tab,换行符 # 8、rstrip() 去字符串右边边空格,tab,换行符 # 9、startswith() 检测字符串是否是相同的开头,结果是True,False # 10、endswith()

Python 常用内置函数

匿名 (未验证) 提交于 2019-12-02 22:51:30
1. abs()函数返回数字的绝对值。 print ( abs (- 45 ) ) # 返回 45print("abs(0.2):",abs(0.2)) # 返回 abs(0.2): 0.2 2. all() 函数用于判断给定的参数中的所有元素是否都为 TRUE,如果是返回 True,否则返回 False。元素除了是 0、空、None、False 外都算 True;空元组、空列表返回值为True。 print ( all ( [ 0.1 , 1 ,- 1 ] ) ) # 返回 True print ( all ( ( None , 1 ) ) ) # 返回 False(其中一个元素为None) print ( all ( [ 0 , 1 ,- 1 ] ) ) # 返回 False(其中一个元素为0) print ( all ( [ " " , "a" , "" ] ) ) # 返回 False(第三个元素为空) 3. any() 函数用于判断给定的参数是否全部为False,是则返回False,如果有一个为True,则返回True。 元素除了是 0、空、False外都算 TRUE。 # 参数全部不为 0、空、FALSE print ( any ( "-45" )) # True print ( any ([ "-45" ])) # True print ( any ( ( "0" ,

python关于字符串的常用方法

匿名 (未验证) 提交于 2019-12-02 22:51:30
1、capitalize--将字符串的首字母转换为大写 a = 'attention' b = a . capitalize () print ( b ) 2、casefold--将字符串中所有的大写字母字母变成小写(首字母为大写) a = 'ABCention' b = a . casefold () print ( b ) 3、lower--将字符串中所有的大写字母字母变成小写(包括首字母) a = 'aBCention' b = a . lower () print ( b ) 4、center--插入设置的字符以补齐它设置的长度,可用空格 a = 'aBCention' b = a . center ( 20 , '&' ) print ( b ) 5、startswith/endwith--判断字符串中的子序列以什么结尾,其中,start和end可以控制起始位置和结束位置,其中start和end可为空。 a = 'aBCention' b = a . endswith ( 'n' ) print ( b ) 6、format--格式化,将字符串中的占位符用自定值替代 a = 'aBCention {0} is {1} years old' b = a . format ( 'zhangsan' , 13 ) print ( b ) 注:如果字符串中并没有占位符