看了挺多博客,终于弄懂了,现在用表格整理一下:
| 符号 | 作用 |
|---|---|
| . | 匹配任意除换行符“\n”外的字符 |
| * | 匹配前面的字符0次或多次 |
| + | 匹配前面的字符1次或多次 |
| ? | 匹配前面的子表达式零次或一次,或指明一个非贪婪限定符 |
| .* | 匹配任意除换行符“\n”外的字符0次或多次 |
| .+ | 匹配任意除换行符“\n”外的字符1次或多次 |
| .*? | 匹配任意除换行符“\n”外的字符0次或多次,但尽可能少重复 |
| .+? | 匹配任意除换行符“\n”外的字符0次或多次,但尽可能少重复 |
此处?的作用就是指明一个非贪婪限定符,什么叫尽可能少重复?简单点说就是匹配最短的符合要求的表达式,下面举出例子:
re.match(r'a.*b', 'aababa') # 1 re.match(r'a.*?b', 'aababa') # 2
1式没有非贪婪限定符,匹配最长表达式,结果为aabab
2式有非贪婪限定符,尽可能少重复,结果为aab和ab
re.match(r'a.+?b', 'aababa') # 3
同理.+?也一样,只是不包括匹配0次的情况,所以3式结果为aab
再比如:
re.match(r'hello.*?world', 'xxxhelloworldxxhelloxxworld') # 4
4式的结果显而易见:helloworld和helloxxworld
来源:https://www.cnblogs.com/kreios/p/12382403.html