Python正则表达式【转载】
原作者: LouieZhang 原文出处: https://www.cnblogs.com/LouieZhang/p/7399836.html 0x00 简介 正则表达式就是描述字符串排列的一套规则。利用正则表达式可以做很多事情,主要用于字符串的匹配 在实际项目中,我们经常需要找到某一类符合某种格式的信息,此时,我们可以观察这些数据的规律,然后将这些数据的格式规律用正则表达式形式描述出来,然后利用正则表达式函数进行相应的处理即可。 本节主要为大家介绍正则表达式怎么去写,将从原子、原子符、模式修正符、贪婪模式与懒惰模式等方面介绍 0x01 原子 原子是正则表达式中最基本的组成单位,每个正则表达式中至少要包含一个原子 1.1 普通字符作为原子 我们可以使用一些普通的字符,比如数字,大小写字母,下划线等都可作为原子使用. 如下程序中,‘yue’作为原子使用,这里有三个原子,分别是y,u,e import re pattern = "yue"#yue作为原子使用,有三个原子,分别是y,u,e string = "http://yum.iqianyue.com" resultl = re.search(pattern,string)#在string中匹配正确的正则表达式,若匹配成功,将匹配结果返回给变量result print(resultl) <_sre.SRE_Match object;