re模块
目录 简介 元字符 案例 常用函数 match search findall finditer compile split sub subn 简介 正则表达式本身是一种小型的、高度专业化的编程语言,它并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式,只需要简单看一看就可以上手了。而在python中,通过内嵌集成re模块,程序员们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。 元字符 字符 描述 . 匹配任意字符,除了'\n' \ 转义字符,使后一个字符改变原来的意思 如果字符串中有字符*需要匹配,可以使用\*或者字符集[*] [] 字符集。对应的位置可以是字符中任意字符。字符集可以逐个列出,也可以给出范围,例如:[abc]或者[a-c] 第一个字符如果是^表示取反,如[^abc]表示不是abc的 \d 数字: [0-9] \D 非数字: [^0-9] \s 空白字符: [<空格>\t\n\r\f\v] \S 非空白字符: [^\s