Python正则表达式(阿里云大学)
Python正则表达式 正则表达式是用于信息筛选的工具,其地位非常重要 #使用格式如下 re.compile(正则表达式).findall(源字符串) 基础1 普通字符——正常匹配 \n——匹配换行符 \t——匹配制表符 \w——匹配字母、数字、下划线(也统称非特殊字符) \W——匹配除字母、数字、下划线 \d——匹配十进制数字 \D——匹配除十进制数字 \s——匹配空白字符 \S——匹配除空白字符 [sean010]——原子表,匹配sean010中的任意一个字符 [^sean010]——原子表,匹配除sean010中的任意一个字符 案例展示 基础2 .——匹配除换行外任意一个字符 ^——匹配开始位置 $——匹配结束位置 *——前一个字符出现0\1\多次 ?——前一个字符出现0\1次 +——前一个字符出现1\多次 {n}——前一个字符恰好出现n次 {n,}——前一个字符出现至少n次 {n,m}——前一个字符出现至少n次,至多m次 |——模式选择符或 ()——模式单元,想要什么内容就写什么 案例展示 注意上图*默认是贪婪,即尽可能多地匹配 基础3 贪婪模式(默认) 懒惰模式(精准模式),出现下面两种组合即为懒惰模式 *? +? 案例展示 上面一种为贪婪模式,下面一种为懒惰模式。 基础4 模式修正符:在不改变正则表达式的情况下,通过模式修正符使得匹配结果发生更改 re.S——让