正则表达式

Python基础知识点整理

那年仲夏 提交于 2020-02-12 18:23:29
一、Python转义字符 \a :响铃(BEL) \b : 退格(BS) ,将当前位置移到前一列 \f :换页(FF),将当前位置移到下页开头 \n :换行(LF) ,将当前位置移到下一行开头 \r :回车(CR) ,将当前位置移到本行开头 \t :水平制表(HT) (跳到下一个TAB位置) \v :垂直制表(VT) \\ :代表一个反斜线字符 \' :代表一个单引号(撇号)字符 \" :代表一个双引号字符 \? :代表一个问号 \0 :空字符(NULL) \ddd :3位八进制数所代表的任意字符 \xhh :2位十六进制所代表的任意字符 二、Python字符串格式化符号 1、百分号%方式 %c:格式化字符及其ASCII码 %s:格式化字符串 %d:格式化整数 %u:格式化无符号整型 %o:格式化无符号八进制数 %x:格式化无符号十六进制数 %X:格式化无符号十六进制数(大写) %f:格式化浮点数字,可指定小数点后的精度 %e:用科学计数法格式化浮点数 %E:作用同%e,用科学计数法格式化浮点数 %p:用十六进制数格式化变量的地址 例子: %r 与 %s 区别: %r 用来做 debug 比较好,因为它会显示变量的原始数据(raw data),而其它的符号则是用来向用户显示输出的。 # 格式化部分用单引号输出 # 可以看见与上面输出存在明显的区别 format方式 三

qt正则表达式类QRegExp

拈花ヽ惹草 提交于 2020-02-12 18:17:27
QRegExp是Qt的正则表达式类Qt中有两个不同类的正则表达式. 第一类为元字符.它表示一个或多个常量表达式. 令一类为 转义字符,它代表一个特殊字符. 一.元字符 在表达式中有特殊意义,需要添加 "\" 才能匹配该字符本身的字符汇总 字符 说明 ^ 匹配输入字符串的开始位置。要匹配 "^" 字符本身,请使用 "\^" $ 匹配输入字符串的结尾位置。要匹配 "$" 字符本身,请使用 "\$" ( ) 标记一个子表达式的开始和结束位置。要匹配小括号,请使用 ""和"" [ ] 用来自定义能够匹配 '多种字符' 的表达式。要匹配中括号,请使用 " "和" " { } 修饰匹配次数的符号。要匹配大括号,请使用 "\{" 和 "\}" . 匹配除了换行符(\n)以外的任意一个字符。要匹配小数点本身,请使用 "\." ? 修饰匹配次数为 0 次或 1 次。要匹配 "?" 字符本身,请使用 "\?" + 修饰匹配次数为至少 1 次。要匹配 "+" 字符本身,请使用 "\+" * 修饰匹配次数为 0 次或任意次。要匹配 "*" 字符本身,请使用 "\*" | 左右两边表达式之间 "或" 关系。匹配 "|" 本身,请使用 "\|" 你可以使用QRegExp::exactMatch来判断一个字符串是否符合一个pattern。 { QString pattern(“.*=.*”); QRegExp

python 正则表达式

為{幸葍}努か 提交于 2020-02-12 17:01:20
文章目录 正则表达式 一. 相关函数 1. **re.match():** 2. **re.search():** 3. **re.findall():** 4. **re.split():** 5. **re.finditer():** 6. **re.sub() 和 re.subn():** 二. 匹配单个字符或数字 1. 元字符 2. code 三. 匹配多个字符或数字 1. 又一些元字符(边界字符) 2.又一些code 3. 又又一些元字符 4. 又又一些code 四. 提取子串 1. 概念: 五. 相关实例 1. 需求:提取chu……man 正则表达式 一. 相关函数 1. re.match(): 原型: match(pattern, string, flags=0) 参数: pattern : 匹配的正则表达式 string : 要匹配的字符串 flags : 标志位,用于控制正则表达式的匹配方式,值如下: re.I:   忽略大小写 re.L:   做本地户识别 re.M:   多行匹配,影响^和$ re.S:  是 . 匹配包括换行符在内的所有字符 re.U:  根据Unicode字符集解析字符,影响\w \W \b \B re.X:  使我们以更灵活的格式理解正则表达式   功能:尝试从字符串的起始位置匹配一个模式,如果不是    起始位置匹配成功的话

正则表达式 Pattern Matche find() matches() lookingAt()

喜夏-厌秋 提交于 2020-02-12 16:17:39
1 matces() lookingAt() find()区别 matches 方法尝试将整个输入序列与该模式匹配。 lookingAt 尝试将输入序列从头开始与该模式匹配。 find 方法扫描输入序列以查找与该模式匹配的下一个子序列。 // matches()对整个字符串进行匹配,只有整个字符串都匹配了才返回true Pattern p=Pattern.compile("\\d+"); Matcher m=p.matcher("22bb23"); m.matches();//返回false,因为bb不能被\d+匹配,导致整个字符串匹配未成功. Matcher m2=p.matcher("2223"); m2.matches();//返回true,因为\d+匹配到了整个字符串 // lookingAt()对前面的字符串进行匹配,只有匹配到的字符串在最前面才返回true Pattern p1=Pattern.compile("\\d+"); Matcher m3=p1.matcher("22bb23"); m.lookingAt();//返回true,因为\d+匹配到了前面的22 Matcher m4=p1.matcher("aa2223"); m2.lookingAt();//返回false,因为\d+不能匹配前面的aa // find()对字符串进行匹配

12 JavaScript正则表达式 RegExp

心已入冬 提交于 2020-02-12 15:24:20
正则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE)使用单个字符串来描述、匹配一系列符合某个句法规则的字符串搜索模式。 搜索模式可用于文本搜索和文本替换。 一、正则表达式 正则表达式是由一个字符序列形成的搜索模式。当你在文本中搜索数据时,你可以用搜索模式来描述你要查询的内容。 正则表达式可以是一个简单的字符,或一个更复杂的模式。正则表达式可用于所有文本搜索和文本替换的操作。 语法 /正则表达式主体/修饰符(可选) 其中修饰符是可选的。 var patt = /runoob/i 实例解析: /runoob/i 是一个正则表达式。 runoob 是一个 正则表达式主体 (用于检索)。 i 是一个 修饰符 (搜索不区分大小写)。 二、使用字符串方法 search() 方法:用于检索字符串中指定的子字符串,或检索与正则表达式相匹配的子字符串,并返回子串的起始位置。 使用正则表达式搜索 "Runoob" 字符串,且不区分大小写: var str = "Visit Runoob!"; var n = str.search(/Runoob/i); 输出结果为:6 search() 方法使用字符串 search 方法可使用字符串作为参数。字符串参数会转换为正则表达式: 检索字符串中 "Runoob" 的子串: var str = "Visit

python正则表达式详解

荒凉一梦 提交于 2020-02-12 13:20:28
前言正则表达式是一个特殊的字符序列,用来判断一个字符串与我们所设定的字符序列是否相匹配。实现快速检索文本和一些替换文本的操作。 在Python中我们有专门的正则表达式模块re,re 模块使 Python 语言拥有全部的正则表达式功能。compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。 一.常见函数 1.re.match re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。 *函数语法:*re.match(pattern, string, flags=0) 函数参数说明: pattern 匹配的正则表达式 string 要匹配的字符串。 flags 标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。 匹配成功re.match方法返回一个匹配的对象,否则返回None。 可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。 group(num=0) 匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。 groups()

C# 正则进阶

强颜欢笑 提交于 2020-02-12 12:52:26
.NET 中的正则表达式是基于 Perl 5 的正则表达式。 超时 从 .NET Framework 4.5 开始,正则表达式支持在匹配操作中指定超时时间。如果匹配超时,就会抛出 RegexMatchTimeoutException 。 所有方法都增加了带超时时间参数的重载: public static Match Match(string input, string pattern, RegexOptions options, TimeSpan matchTimeout); public static MatchCollection Matches(string input, string pattern, RegexOptions options, TimeSpan matchTimeout); public static string Replace(string input, string pattern, string replacement, RegexOptions options, TimeSpan matchTimeout); public static string[] Split(string input, string pattern, RegexOptions options, TimeSpan matchTimeout);

正则表达式入门

守給你的承諾、 提交于 2020-02-12 04:34:49
正则表达式入门 元字符 字符转义 数量 集合 分支 分组 反义 元字符 \b 代表着单词的开头或结尾,也就是单词的分界处,它只匹配一个位置。 . 匹配除了换行符以外的任意字符。 * 代表的不是字符,也不是位置,而是数量,它指定*前边的内容可以连续重复使用任意次以使整个表达式得到匹配。 \d 匹配一位数字。 \s 匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等。 \w 匹配字母或数字或下划线。 ^ 匹配字符串的开始。 $ 匹配字符串的结束。 例子: hi 匹配包含两个连续字符h和i的hi,包括hi,him,high中的hi。而 \bhi\b 则会精确匹配hi这个单词。 \bhi\b.*\bTom\b 首先匹配的一个单词hi,然后是任意个换行符之外的字符,最后是Tom这个单词。 字符转义   如果想查找元字符本身的话,例如 . 或者是 * 就会出现问题,这时候就要使用 \ 来取消这些字符的特殊意义。因此,应该使用 \. 和 * 。 数量 正则表达式中所有的限定符: 限定符 说明 * 重复零次或更多次 + 重复一次或更多次 ? 重复零次或一次 {n} 重复n次 {n,} 重复n次或更多次 {n,m} 重复n到m次 例子: Windows\d+ 匹配Windows后面跟着1个或更多个数字。 ^\w+ 匹配整个字符串的第一个单词。 集合  

python—正则表达式

余生长醉 提交于 2020-02-12 04:08:57
正则表达式: 一种用来提取有用信息的表达式 原子: 原子是正则表达式的基本组成单位,每个正则表达式至少含有一个原子。 原子主要有以下几种类型: a:普通字符 b:非打印字符 c:通用字符 d:原子表 对应模块 re #普通字符 作为原子 string = "dfsffsfsg" pat = "ffs" rs = re . search ( pat , string ) print ( rs ) # 结果(<_sre.SRE_Match object; span=(3, 6), match='ffs'>) # 非打印字符作为原子(\n,\t等) string = '''sfrgagr fa''' #'''换行,若是"则需加/n pat = "\n" rs = re . search ( pat , string ) print ( rs ) #通用字符 作为原子 ''' 常见通用字符 \w 字母,数字,下划线 \W 除去字母,数字,下划线... \d 十进制数字 \D 除十进制数字 \s 空白字符 \S 除空白字符 ''' string = "dfsff12323242sfsg" pat = "\d\d\d" #匹配三位十进制数字 rs = re . search ( pat , string ) print ( rs ) #结果 <_sre.SRE_Match object;