python 的re库为:
raw string 类型(原生字符串类型,即不含转义字符)
在字符串前面加 r'...'就行了
Re库主要功能函数
re.rearch(pattern,string,flags=0) 在一个字符串中搜索匹配表达式第一个位置,返回match对象
*pattern:正则表达式的字符串或原生字符串表示
*string:待匹配字符串
*flags:控制标记
常用标记:
re.I re.IGNORECASE #忽略表达式的大小写,[A-Z]能够匹配小写[a-z]
re.M re.MULTILINE #表达式中的^操作符,从每行的开始进行匹配
re.S re.DOTALL #表达式中的 . 点操作符,能够匹配所以字符,默认匹配除换行外的所有字符串
re.match(pattern,string,flags=0) 从一个字符串的开始位置匹配,返回match对象
re.findall(pattern,string,flags=0) 以列表类型返回全部匹配
re.split(pattern,string,maxsplit=0,flags=0) 将一个字符串安装表达式匹配结果进行分割,返回列表类型
*maxsplit约定分割成几段
re.finditer(pattern,string,flags=0) 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象
re.sub(pattern,repl,string,count=0,flags=0) 在一个字符串中替换所以匹配表达式的子串,返回替代后的字符串
regex = re.compile(pattren,flags=0)
编译成一个对象分别适应: regex.search() .match() .findall .split() .finditer() .sub()
re 的match对象:
match对象属性 | 说明 |
.string | 待匹配的文本 |
.re |
匹配时使用的pattern对象(正则表达式) |
.pos | 正则表达式搜索文本的开始位置 |
.endpos | 。。。。。。。。。。结束位置 |
.group(0)
.start()
.end()
.span()