爬虫解析Re 之(六 ) --- Re模块
正则表达式 正则表达式其实就是特殊的字符串, 帮助进行检索, 校验, 查询等行为,是对字符串操作的一种逻辑公式, 事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符”,这个“规则字符” 来表达对字符的一种过滤逻辑。 Python提供的正则表达式机制: 需要导入模块 re 正则表达式使用场景 验证的作用: 密码的验证 用户名的验证 邮箱 手机号等等 爬虫: 查询校验 正则表达式的规则 正则表达式处理字符串的强大工具, 拥有自己独特的语法, 并且拥有一个独立处理正则表达式的引擎. 正则表达式处理字符串的效率要比系统本身提供的低, 如果系统的能够完成, 就不用正则表达式 替换 ---- 将字符串中b小写字母 替换成B --- 系统的能完成直接使用系统的即可 替换 ---- 将第一个替换成B 第二个替换成 m --- 系统不能完成 使用正则表达式 在re模块下常用的方法 1. re. compile( 正则表达式的语法 ) 根据正则表达式语法生成对应正则表达式对象,方便复用该正则表达式 2. 正则表达式对象 .match( 要进行验证的字符串 ) 如果正则表达式语法中没有限制头尾, 验证字符串是否以正则表达式对应字符串开头 如果限制了头尾, 也就是限制了字符串的长度, 验证的字符串内容是否满足正则表达式的需求 如果满足 返回的match对象