Python中的正则表达式-re模块
有时候我们需要模糊查找我们需要的字符串等值,这个时候需要用到正则表达式。 正则表达式的使用,在python中需要引入re包 import re 1、首先了解下正则表达式的常用语法 ——单个字符 . 任意的一个字符 a|b 字符a或字符b [afg] a或者f或者g的一个字符 [0-4] 0-4范围内的一个字符 [a-f] a-f范围内的一个字符 [^a] 不是a的一个字符 \s 一个空格 \S 一个非空格 \d [0-9],即0-9的任意字符 \D [^0-9],即非0-9的任意字符 \w [0-9a-zA-Z] \W [^0-9a-zA-Z] \b 匹配一个单词边界,也就是指单词和空格间的位置。例如,“er\b”可以匹配“never”中的“er”,但不能匹配“verb”中的“er” \B 匹配非单词边界。“er\B”能匹配“verb”中的“er”,但不能匹配“never”中的“er” ——重复 * 重复>=0次 + 重复>=1次 ? 重复0次或是1次 {m} 重复m次,如[01]{2}匹配字符串00或11或01或10 {m,n} 重复m-n次,如a{1,3}匹配字符串a或aa或aaa ——位置 ^ 字符串的起始位置 $ 字符串的结尾位置 ——返回控制 对搜索的结果进行进一步精简信息,可以使用小括号扩住对应的正则表达式。如 m = re.search("output_(\d{4})