正则表达式

ASP.NET-第六天-HTML基础

♀尐吖头ヾ 提交于 2020-02-16 21:34:16
第六天 Js 中的正则表达式:元字符 . 表示任意一个字符 \d [0-9] 大小写,表示的正好相反 \w [a-z A-Z 0-9] \s 所有的空字符串 | 或 通过()改变优先级,()还能提取组 限定符: * 出现 0 次或多次 + 出现最少一次 ? {n} 出现 n 次 {5 , } 最少出现 5 次 {5,10} 最少 5 次,最多 10 次 ^ 非 ^ 开始 $ 结束,加上开始和结束,表示完全匹配; Matchs 提取 创建正则表达式(六位整数的变量) 验证是否是合法的变量:(返回值是 bool 类型 ) E-mail 的正则表达式: Test 相当于 IsMatch Exec 相当于 match ,如果正则表达式中没有提取组,则返回的当前提取到的匹配字符串,如果正则表达式中有提取组信息,则返回一个数组,该数组中第一个元素时匹配 要想让 exec ()方法,提取所有的匹配字符,需要: 1. 在创建正则表达式之后,加上一个 g ,表示全局模式; 2. 反复调用 exec ()方法; 3. 注意:如果不加 g ,就算是反复调用,结果也只是,第一个符合的字符; var res = regN.exec(msg); 直接调用一次 exec 方法相当于 c# 中的 Match() 方法,只能提取字符串中第一个匹配的字符串 var regN = /\d{5}/g; var res =

用正则表达式找出不包含连续字符串abc的单词

柔情痞子 提交于 2020-02-16 21:30:29
写过一篇" 正则表达式30分钟入门教程 ",有读者问: [^abc]表示不包含a、b、c中任意字符, 我想实现不包含字符串abc应该如何写表达式? 就我自己而言,这个问题最简单的解决方法是使用编程语言的配合,找出那些包含abc的,剩下的就是不包含的了——懒人的风格。但我写的是教程,读者未必都有编程的基础,有些只是使用一些工具从txt文档中抽取出一些信息,所以要回答还是必须完全通过正则表达式来完成。 于是打开了 RegexTester ,开始试验,先是试了使用 ((?'test'abc)|.)*(?(test)(?!)) (含意是:查找abc,或任意的字符,如果找到了abc,就把它存入命名为test的组里,到最后检查test组里是否有内容,如果有就匹配失败,相关说明见 教程 ),结果是"abc","aabc","abcd","aa"都能通过测试,看来是到最后测试到test组存在后又回溯了,此解决方案不可行。 然后又试了 (.(?!abc))* (找出所有后面不是abc的字符),结果是"abc","abcd"通过测试,"aabc"则只截取了后面的"abc",显然不行。 那加强条件试试: ((?<!abc).(?!abc))* (找出所有前面和后面都不是abc的字符),结果是所有包含abc的字符串都只截取了里面的"abc",不包含abc的则直接通过。 现在看来有点戏了

正则表达式匹配

爱⌒轻易说出口 提交于 2020-02-16 16:18:42
给定一个字符串 (s) 和一个字符模式 (p)。实现支持 ‘.’ 和 ‘*’ 的正则表达式匹配。 ‘.’ 匹配任意单个字符。 ‘*’ 匹配零个或多个前面的元素。 匹配应该覆盖整个字符串 (s) ,而不是部分字符串。 说明: s 可能为空,且只包含从 a-z 的小写字母。 p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。12 示例 1: 输入: s = "aa" p = "a" 输出: false 解释: "a" 无法匹配 "aa" 整个字符串。 class Solution(object): def isMatch(self, s, p): """ :type s: str :type p: str :rtype: bool """ if p == "": return s == "" if len(p) > 1 and p[1] == "*": return self.isMatch(s, p[2:]) or (s and (s[0] == p[0] or p[0] == '.') and self.isMatch(s[1:], p)) else: return s and (s[0] == p[0] or p[0] == '.') and self.isMatch(s[1:], p[1:]) if __name__ == '__main__': s =

python-正则表达式

徘徊边缘 提交于 2020-02-16 13:42:29
正则表达式为高级的文本模式匹配、抽取、与/或文本形式的搜索和替换功能提供了基础。 简单地说,正则表达式(简称为 regex)是一些由字符和特殊符号组成的字符串,它们描述了 模式的重复或者表述多个字符,于是正则表达式能按照某种模式匹配一系列有相似特征的字符串。 一、使用择一匹配符号匹配多个正则表达式模式 表示择一匹配的管道符号(|),也就是键盘上的竖线,表示一个“从多个模式中选择其 一”的操作。它用于分割不同的正则表达式。有了这个符号,就能够增强正则表达式的灵活性,使得正则表达式能够匹配多个字符串 而不仅仅只是一个字符串。择一匹配有时候也称作并(union)或者逻辑或(logical OR)。 二、匹配任意单个字符 点号或者句点(.)符号匹配除了换行符\n 以外的任何字符,无论字母、 数字、空格(并不包括“\n”换行符)、可打印字符、不可打印字符,还是一个符号,使用点 号都能够匹配它们。然而要显式匹配一个句点符号本身,必须使用反斜线转义句点符号的功能,例如“\.”。 三、从字符串起始或者结尾或者单词边界匹配 四、创建字符集 五、限定范围和否定 括号中两个符号中间用连字符 (-)连接,用于指定一个字符的范围;例如,A-Z、a-z 或者 0-9 分别用于表示大写字母、小 写字母和数值数字。 六、使用闭包操作符实现存在性和频数匹配 星号或者星号操作符(*)将匹配其左边的正则表达式

php中正则表达式详解

五迷三道 提交于 2020-02-16 06:39:16
概述 正则表达式是一种描述字符串结果的语法规则,是一个特定的格式化模式,可以匹配、替换、截取匹配的字符串。常用的语言基本上都有正则表达式,如JavaScript、java等。其实,只有了解一种语言的正则使用,其他语言的正则使用起来,就相对简单些。文本主要围绕解决下面问题展开。 有哪些常用的转义字符 什么是限定符与定位符 什么是单词定位符 特殊字符有哪些 什么是逆向引用以及怎样使用逆向引用 匹配模式 php中怎样使用正则表达式 php中哪些方面需要用到正则 怎样进行邮箱匹配,url匹配,手机匹配 怎样使用正则替换字符串中某些字符 贪婪匹配与惰性匹配区别 正则表达式之回溯与固态分组 正则优缺点有哪些 正则表达式的基本知识汇总 行定位符(^与$) 行定位符是用来描述字符串的边界。 “$” 表示行结尾 “^” 表示行开始如 "^de" ,表示以de开头的字符串 "de$" ,表示以de结尾的字符串。 单词定界符 我们在查找的一个单词的时候,如an是否在一个字符串”gril and body”中存在,很明显如果匹配的话,an肯定是可以匹配字符串“gril and body”匹配到,怎样才能让其匹配单词,而不是单词的一部分呢?这时候,我们可以是哟个单词定界符\b。 \ban\b 去匹配”gril and body”的话,就会提示匹配不到。 当然还有一个大写的\B,它的意思,和\b正好相反

正则表达式全集

℡╲_俬逩灬. 提交于 2020-02-16 06:12:34
本文转自: http://tool.oschina.net/uploads/apidocs/jquery/regexp.html 正则表达式全集 字符 描述 \ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如,“ n ”匹配字符“ n ”。“ \n ”匹配一个换行符。串行“ \\ ”匹配“ \ ”而“ \( ”则匹配“ ( ”。 ^ 匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配“ \n ”或“ \r ”之后的位置。 $ 匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配“ \n ”或“ \r ”之前的位置。 * 匹配前面的子表达式零次或多次。例如,zo*能匹配“ z ”以及“ zoo ”。*等价于{0,}。 + 匹配前面的子表达式一次或多次。例如,“ zo+ ”能匹配“ zo ”以及“ zoo ”,但不能匹配“ z ”。+等价于{1,}。 ? 匹配前面的子表达式零次或一次。例如,“ do(es)? ”可以匹配“ does ”或“ does ”中的“ do ”。?等价于{0,1}。 {n} n是一个非负整数。匹配确定的n次。例如,“ o{2} ”不能匹配“ Bob ”中的“ o ”,但是能匹配“ food ”中的两个o。 {n,} n是一个非负整数。至少匹配n次

shell中的case

混江龙づ霸主 提交于 2020-02-15 23:49:56
和其它编程语言类似, Shell 也支持两种分支结构(选择结构),分别是 if else 语句和 case in 语句 。在《Shell if else》一节中我们讲解了 if else 语句的用法,这节我们就来讲解 case in 语句。 当分支较多,并且判断条件比较简单时,使用 case in 语句就比较方便了 [root@server1 mnt]# cat test.sh #!/bin/bash printf "Input integer number: " read num case $num in 1) echo "Monday" ;; 2) echo "Tuesday" ;; 3) echo "Wednesday" ;; 4) echo "Thursday" ;; 5) echo "Friday" ;; 6) echo "Saturday" ;; 7) echo "Sunday" ;; *) echo "error" esac 看了这个例子,相信大家对 case in 语句有了一个大体上的认识,那么,接下来我们就正式开始讲解 case in 的用法,它的基本格式如下: case expression in pattern1) statement1 ;; pattern2) statement2 ;; pattern3) statement3 ;; …… *)

nginx

纵然是瞬间 提交于 2020-02-15 22:04:22
文章目录 常用命令 配置文件 1.全局块 2.event块 3.http块 3.1 http全局块 3.2 server块 nginx实例 负载均衡策略 指令说明 常用命令 nginx -v ngxin -s stop nginx 启动 nginx -s reload 重新加载nginx.conf配置文件 配置文件 1.全局块 从配置文件开始到events块之间的内容为全局块,主要会设置一些影响nginx服务器整体运行的配置指令。 如: worker_processes 1; worker_processes值越大,可以支持的并发处理量也越多 2.event块 涉及的指令主要影响nginx服务器与用户的网络连接,常用的设置包括是否开启多个work process下的网络连接进行序列化,是否允许同时接收多个网络连接,选取哪种事件驱动模型来处理连接请求,每个word peocess可以同时支持的最大连接数等。如worker_connections 1024; 上述例子就表示每个work process支持的最大连接为 1024 这部分的配置对nginx的性能影响较大,在世界中应该灵活配置。 3.http块 3.1 http全局块 http全局块配置的指令包括文件引入,MIME-TYPE定义,日志自定义,连接超时时间,单链接请求数上限等。 3.2 server块 这块和虚拟主机有密切关系

笔记:正则表达式

人盡茶涼 提交于 2020-02-15 15:22:22
正则表达式(regular expression)用于指定字符串的模式,可以在任何需要定位匹配某种特定模式的字符串的情况下使用正则表达式,正则表达式的语法如下: 语法 解释 字符 c 表示字符 c \unnnn,\xnn,\0n,\0nn,\0nnn 具有给定十六进制或者十进制值的码元 \t,\n,\r,\f,\a 控制符:制表符、换行符、回车符、换页符、警告符 字符类 [C 1 ,C 2 ,…] 任何由C 1 、C 2 ,…表示的字符,其中C 1 可以表示多个字符,字符范围C 1 -C 2 或者字符类 [^…] 排除匹配,^之后的字符不能匹配 [… && …] 二个字符集的交集 预定义字符类 . 除了行终止符之外的所有字符(在 DOTALL 标志被设置时,则表示所有字符) \d 一个数字,等价 [0-9] \D 一个非数字,等价[^0-9] \s 一个空白字符[\t\n\r\f\x0B] \S 一个非空白字符 \w 一个词语字符[a-zA-Z0-9_] \W 一个非词语字符 \p{name} 一个命名字符类,命名字符参考命名字符表 \P{name} 一个命名字符类的补集 边界匹配符 ^ $ 表示输入的开头和结尾(或者在多行模式下行的开头和结尾) \b 一个词语边界 \B 一个非词语边界 \A 输入的开头 \z 输入的结尾 \Z 除了行终止符之外的输入结尾 \G 前一个匹配的结尾

Python 与 html解析

纵然是瞬间 提交于 2020-02-15 05:47:16
Python 与 html解析 文章目录 Python 与 html解析 正则表达式 RE in Python `match()` 修饰符 `search()` `findall()` XPath & LXML XPath常用规则 导入 HTML 从字符串导入 HTML 从文件导入 HTML 获取节点 获取所有节点 获取所有指定标签 获取子节点 获取特定属性的节点 获取父节点 获取节点中的的文本 获取属性 补充 BeautifulSoup BeaufulSoup对象的初始化 节点选择器 选择标签 嵌套选择 关联选择 获取**子孙节点** 获取父节点和祖先节点 获取兄弟节点 方法选择器 `find()` `findall()` 更多 CSS选择器 提取信息 获取完整标签 获取标签类型 获取标签内容 获取属性 PyQuery 初始化 字符串初始化 URL初始化 CSS选择器 查找节点 遍历 获取信息 `attr()` 获取属性 `text()` 获取文本 节点操作 本文由 CDFMLR 原创,收录于个人主页 https://clownote.github.io ,并同时发布到 CSDN。本人不保证 CSDN 排版正确,敬请访问 clownote 以获得良好的阅读体验。 正则表达式 正则表达式是一种处理字符串的强大的工具,它有自己特定的语法结构,可以高效地实现字符串的检索、替换