PYTHON3.day01RE
正则表达式 一. 动机 1. 文本处理已经成为计算机常见工作之一 2. 对文本内容搜索,定位,提取是逻辑比较复杂的工作 3. 为了快速方便的解决上述问题,产生了正则表达式技术 二. 简介 定义:即文本的高级匹配模式,提供搜索,替换等功能。其本质是一系列由字符和特殊符号构成的字串,这个字串即正则表达式 匹配原理:通过普通字符和有特定含义的字符,来组成字符串,用以描述一定的字符串规则,比如重复,位置等,来表达一种特定类型的字符串,进而匹配。 目标:1. 熟练掌握正则表达式符号 2. 能够读懂常用正则表达式,编辑基本表达式匹配内容 3. 能够熟练使用re模块操作正则表达式 三. 元字符的使用 1. 普通字符 匹配规则:每个普通字符匹配其对应的字符 In [14]: re.findall('ab','abcdefabcda') Out[14]: ['ab', 'ab'] 注意事项:正则表达式也可以匹配中文 2. 或 元字符 : | 匹配规则:匹配 | 两侧任意正则表达式即可 In [17]: re.findall('ab|ef','abcdefabcda') Out[17]: ['ab', 'ef', 'ab'] 3. 匹配开始位置 元字符: ^ 匹配规则: 匹配目标字符串的开始位置 In [21]: re.findall('^Jame','Jame,hello') Out[21]: [