python字符串操作

Python基础语法学习

南楼画角 提交于 2019-12-14 00:52:00
基础语法学习 果然学完 C++ 后再看其他语言的确有很多的共性,只需要熟悉一下python的独特语法和 C++ 中的差异就可以写出一些小的程序,而写得过程中也再次体会出python代码的精简和灵活; 关键字 所有可用的关键字只要看keyword模块就可以了 >>> import keyword >>> keyword.kwlist ['False', 'None', 'True', 'and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield'] 编码注释# 在python中如果有需要加中文注释的需求,是需要添加编码注释的。否则就会报错。而python2和python3的编码转换形式还不太一样; 所以通常写程序前需要在最顶部增加编码的声明。其实只要注释里面有coding 和对应的编码就可以了 一般用以下的格式进行声明: # -*- coding:utf

非结构化和结构化数据提取

心已入冬 提交于 2019-12-12 09:10:05
页面解析和数据提取 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值。内容一般分为两部分,非结构化的数据和结构化的数据。 非结构化数据:先有数据,再有结构 结构化数据:先有结构、再有数据 不同类型的数据,我们需要采用不同的方式来处理。 非结构化的数据处理 文本、电话号码、邮箱地址 正则表达式 HTML 文件 正则表达式 XPath CSS选择器 结构化的数据处理 JSON 文件 JSON Path 转化成Python类型进行操作(json类) XML 文件 转化成Python类型(xmltodict) XPath CSS选择器 正则表达式 正则表达式 正则表达式匹配规则 Python的re模块 在Python中,可以使用内置的re模块来使用正则表达式。 有一点需要特别注意的是,正则表达式使用对特殊字符进行转义,所以如果我们要使用原始字符串,只需加一个 r 前缀,例如: r’chuanzhiboket.tpython’ re模块的一般使用步骤 使用 compile() 函数将正则表达式的字符串形式编译为一个 Pattern 对象; 通过 Pattern 对象提供的一系列方法对文本进行匹配查找,获得匹配结果,一个 Match 对象; 最后使用 Match 对象提供的属性和方法获得信息,根据需要进行其他的操作。 compile 函数

python中字符串的常见操作

点点圈 提交于 2019-12-11 22:56:14
1、find检测str是否包含在mystr,如果是返回开始的索引值,否则返回-1 In [5]: mystr='hello world itcast and hahaitcast' In [6]: mystr.find('world') Out[6]: 6 In [7]: mystr.find('heihei') Out[7]: -1 2、index和find一样只不过,str不在mystr中会报一个异常 In [8]: mystr.index('itcast') Out[8]: 12 In [9]: mystr.index('heihei') --------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-9-2cd231cae32a> in <module>() ----> 1 mystr.index('heihei') ValueError: substring not found 3、rfind、rindex从右往左找 In [10]: mystr.rfind('itcast') Out[10]: 27 In [12]: mystr.rindex('itcast')

Python 变量类型

末鹿安然 提交于 2019-12-11 16:43:52
Python 变量类型 变量存储在内存中的值。这就意味着在创建变量时会在内存中开辟一个空间。 基于变量的数据类型,解释器会分配指定内存,并决定什么数据可以被存储在内存中。 因此,变量可以指定不同的数据类型,这些变量可以存储整数,小数或字符。 变量赋值 Python 中的变量赋值不需要类型声明。 每个变量在内存中创建,都包括变量的标识,名称和数据这些信息。 每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。 等号(=)用来给变量赋值。 等号(=)运算符左边是一个变量名,等号(=)运算符右边是存储在变量中的值。例如: 实例(Python 2.0+) #!/usr/bin/python # -*- coding: UTF-8 -*- counter = 100 # 赋值整型变量 miles = 1000.0 # 浮点型 name = " John " # 字符串 print counter print miles print name 运行实例 » 以上实例中,100,1000.0和"John"分别赋值给counter,miles,name变量。 执行以上程序会输出如下结果: 100 1000.0 John 多个变量赋值 Python允许你同时为多个变量赋值。例如: a = b = c = 1 以上实例,创建一个整型对象,值为1,三个变量被分配到相同的内存空间上。

js基础

*爱你&永不变心* 提交于 2019-12-11 15:40:27
JavaScript """ JavaScript(JS)是脚本编程语言,JS语言开发的文件是以.js为后缀,通过在html文件中引入该js文件来控制html代码的交互功能以及前台数据处理的业务逻辑(js语言代码也可以直接写在html文件中),采用的ECMAScript语法,属于编程语言。 ECMAScript目前普遍使用的存在ES5与ES6两个版本,我们也会基于这两个版本来介绍JS这么应用的学习 ES5:基于对象语言(没有class),通常学的多。 ES6:面向对象语言,有新特性,新框架。 """ """ 学习方向:从JS代码书写位置、JS基础语法、JS选择器和JS页面操作四部分进行学习 学习目的:完成页面标签与用户的人机交互及前台数据处理的业务逻辑 """ 脚本语言 脚本语言:通过这门语言,可以去写一些代码片段,这些代码片段可以嵌入到其他语言中,只要给予一个执行的入口,就可以执行代码。如c,java,这些语言必须要有明确的入口,也就是main函数,从main函数入,从main函数出。python则处处是入口处处是出口,没有所谓的main函数,这就是脚本语言的特点,也就是说只要给一个执行的入口,我就能够让代码跑起来。 脚本:像python可以直接用解释器运行,不管文件中有没有main函数,甚至是空的,也可以跑起来,只是没结果,也就是说可以通过代码块来执行

《Python编程:从入门到实践》学习笔记(一)

风流意气都作罢 提交于 2019-12-11 11:49:28
《Python编程:从入门到实践》学习笔记 (一) 2019.12.10 星期二 由于博主对Python已经用过一段时间,所以笔记仅记录相对薄弱或不熟悉的部分,不会过于细致。仅作为学习记录使用。另外,笔记中仅记录Python3的相关内容,不记录Python2的内容。 Flag:从2019.12.10开始,每天抽时间学习并更新一点,直到学完全书。 原书封面镇楼,感谢作者和译者。PS:博主用的也是正版书哦~ 2019.12.10 星期二 字符串中空格的删除 str = ' abc def ' # 该字符串左、右、中间均有空格 str . lstrip ( ) # 删除字符串开头的空格, 输出:'abc def ' str . rstrip ( ) # 删除字符串结尾的空格,输出:' abc def' str . strip ( ) # 删除字符串开头和结尾的空格,输出:'abc def' str . replace ( ' ' , '' ) # 删除字符串中所有空格,输出:'abcdef' str.replace(’ ‘,’’) 实际上是将’ ‘(空格)替换为’’(空),属于一种通用的字符替换方法。 值得注意的是,上述方法都只是生成了一个新的字符串,并不会改变原字符串,即经过上述任意一个或多个操作后,str仍为’ abc def ‘。如果要将str中的相应空格彻底删除,应该使用赋值语句

Python基础之字符串操作

大兔子大兔子 提交于 2019-12-11 10:29:16
字符串基本使用 引用类型 字符串的定义 Str1=”hello1” Str2=’hello2’ Str=”\n” 字符串的输出 %s 字符串的输入 Str=input(“从键盘录入任意字符串”) 字符串求长度 长度=len(变量/常量) 字符串的索引值 范围: {0,len(字符串)-1} str1="\n" print(type(str1)) print(str1+"javaxl") str2="123" print("%s"%str2) str3="http://javaxl.com" # 求字符串长度 print(len("str3")) print(len(str3)) str4='http://javaxl.com' print(str4[0]) print("javaxl的长度:%d" % len(str4)) #越界 IndexError: string index out of range # print(str4[23]) # 获取最后一个 print(str4[-1]) print(str4[4]) print(str4[len(str4) - 1]) 循环打印出str字符串中的内容 # 使用循环完成字符串中每个自负的打印,使用\t隔开(1、while 2、for) i=0 while i<len(str4): print(str4[i],end='\t') i

物联网技术部培训——python基本语法及numpy

无人久伴 提交于 2019-12-11 06:02:51
python 基础语法,numpy入门 python - 冉冉升起的高级语言 python入门篇:基本语法 第一个程序:helloworld! python语法 - 基本数据类型 1.1 变量的定义 1.2 连续赋值 1.3 python的基本输入和输出 1.3.1 输入输出语句格式拓展 python语法 - 分支语句,循环语句 2.1 分支语句 2.2 循环语句 python语法 - 组合数据类型 3.1 集合 3.2 列表 3.3 元组 3.4 字典 python语法 - 字符串 4.1 字符串的定义 4.2 字符串的各种操作 python语法 - 函数 python语法 - 常用库 5.1 库的调用 5.2 常用库:time库 5.3 常用库:jieba库 numpy简介 numpy 安装 为什么使用numpy中的array python list 的特点 array类型 numpy.array numpy.array的创建方法 整体创建 arange linspace random numpy.array 的基本操作 查看基本属性 数据访问 reshape 合并操作 分割操作 运算操作 Universal Functions 矩阵运算 向量和矩阵的运算 python - 冉冉升起的高级语言 终于来到激动人心的时刻辣!我们要开始进行对python的学习!

Python随笔——正则表达式

一世执手 提交于 2019-12-11 04:55:14
文章目录 正则表达式--随笔 一、什么是正则表达式 二、使用正则表达式 match search findall finditer split sub subn 三、正则表达式语法 1、匹配单个字符的语法 2、区间匹配——列举 3、利用特殊符号表示任意一个字符 4、正则语法的限制修饰 5、量词符号 正则表达式–随笔 一、什么是正则表达式 正则表达式(regular expression)是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 正则表达式有自己独立的操作处理引擎,可以匹配任何的编程语言。 我个人理解,正则表达式本质上是用于对字符串进行筛选的规则。但是如果系统自带的字符串能完成对应操作,尽量使用系统字符串提供的功能,因为它的处理效率比正则表达式要高! 二、使用正则表达式 Python提供的机制是存放再re模块下的。若要使用,则首先需要导入re模块 import re 接下来: 第一步:生成正则对象(指定匹配规则) 第二步:根据需要使用对应的匹配方法(放置待校验的字符串) 注:匹配方法有:match,search,findall,finder,split,sub,subn match 当匹配规则(正则表达式)中没有设置^开头和\$结尾限制时

Python 正则表达式急速入门

房东的猫 提交于 2019-12-11 03:12:45
正则表达式在程序开发中会经常用到,比如数据(格式)验证、替换字符内容以及提取字符串内容等等情况都会用到,但是目前许多开发人员对于正则表达式只是处于了解或者是基本会用的阶段。一旦遇到大批量使用正则表达式的情况(例如网络爬虫)可以说基本上就抓瞎了。这篇文章我将带领大家利用 Python 来学习一下正则表达式。在阅读这篇文章前你需要掌握 Python 基础知识,或者具有其他开发语言的基础知识也可以,因为基本上每种语言使用正则表达式的方式都是类似的。 零、正则表达式基础 提取字符(串) 有时我们需要从一个字符串中获取一段内容,这段内容可能是一个字符也可能是一段字符串,如果用逐字对比遍历的话不仅耗时耗力而且还容易出错。那么这个时候我们就可以用到正则表达式中的 字符匹配 功能。正则表达式为我们提供了 4 中字符匹配的方法,见下表: 语法 说明 例子 可匹配字符串 . 匹配除了换行符 “\n” 以外的任意字符 a.b acb、adb、a2b、a~b \ 转义,将转移字符后面的一个字符改变原来的意思 a[b\.\\]c abc、a.c、a\c [] 匹配括号内的任意字符 a[b,c,d,e]f abd、acf、adf、aef [^] 除了括号内的字符外,其他的字符都匹配 a[^a,b,c,d,e]f a1f、a#f、azf、agf 预定义字符