正则表达式

java:正则表达式 --转http://blog.csdn.net/yangjiali014/archive/2007/06/19/1658235.aspx

别说谁变了你拦得住时间么 提交于 2020-02-15 05:44:05
正则表达式用来指定字符串模式。当你需要定位匹配某种模式的字符串时就可以使用正则表达式。例如,我们下面的一个例程就是在一个HTML文件中通过查找字符串模式<a href="...">来定位所有的超链接。 当然,为了指定一种模式,使用...这种记号是不够精确的。你需要精确地指定什么样的字符排列是一个合法的匹配。当描述某种模式时,你需要使用一种特殊的语法。 这里有一个简单例子。正则表达式 [Jj]ava.+ 匹配下列形式的任何字符串: 首字母是J或j 后续的三个字母是ava 字符串的剩余部分由一个或多个任意字符组成 例如,字符串“javaness”匹配这个特殊的正则表达式,但是字符串“Core Java”却不匹配。 如你所见,你需要了解一点语法来理解正则表达式的含意。幸运的是对于大多数的用途,使用少量的简单构造(straightforward constructs)就已足够。 字符类是可选自符的集合,用‘[’封装,比如[Jj],[0-9],[A-Za-z]或[^0-9]。这里的-表示范围(Unicode落在两个边界之间的所有字符),^表示求补(指定字符外的所有字符)。 有许多预定以的字符类,像\d(数字)或\p{Sc}(Unicode货币符号),见表12-8和12-9。 大多数字符与它们自身匹配,像上例中的ava字符。 符号.匹配任何字符(可能行终止符(line terminators

正则表达式不包含特定字符串

偶尔善良 提交于 2020-02-15 05:33:02
概述 做日志分析工作的经常需要跟成千上万的日志条目打交道,为了在庞大的数据量中找到特定模式的数据,常常需要编写很多复杂的 正则表达式 。例如枚举出日志文件中不包含某个特定字符串的条目,找出不以某个特定字符串打头的条目,等等。 使用否定式前瞻 正则表达式中有前瞻(Lookahead)和后顾(Lookbehind)的概念,这两个术语非常形象的描述了正则引擎的匹配行为。需要注意一点,正则表达式中的前和后和我们一般理解的前后有点不同。一段文本,我们一般习惯把文本开头的方向称作“前面”,文本末尾方向称为“后面”。但是 对于正则表达式引擎来说,因为它是从文本头部向尾部开始解析的(可以通过正则选项控制解析方向),因此对于文本尾部方向,称为“前”,因为这个时候,正则引擎还没走到那块,而对文本头部方向,则称为“后”,因为正则引擎已经走过了那一块地方 。如下图所示: 所谓的前瞻就是在正则表达式匹配到某个字符的时候,往“尚未解析过的文本”预先看一下,看是不是符合/不符合匹配模式,而后顾,就是在正则引擎已经匹配过的文本看看是不是符合/不符合匹配模式。符合和不符合特定匹配模式我们又称为 肯定式匹配和否定式匹配 。 现代高级正则表达式引擎一般都支持都支持前瞻,对于后顾支持并不是很广泛,因此我们这里采用否定式前瞻来实现我们的需求。 实现 测试数据: 2009-07-07 04:38:44 127.0.0.1

正则表达式

回眸只為那壹抹淺笑 提交于 2020-02-14 22:56:16
正则表达式用来指定字符串模式。当你需要定位匹配某种模式的字符串时就可以使用正则表达式。例如,我们下面的一个例程就是在一个HTML文件中通过查找字符串模式<a href="...">来定位所有的超链接。 当然,为了指定一种模式,使用...这种记号是不够精确的。你需要精确地指定什么样的字符排列是一个合法的匹配。当描述某种模式时,你需要使用一种特殊的语法。 这里有一个简单例子。正则表达式 [Jj]ava.+ 匹配下列形式的任何字符串: 首字母是J或j 后续的三个字母是ava 字符串的剩余部分由一个或多个任意字符组成 例如,字符串“javaness”匹配这个特殊的正则表达式,但是字符串“Core Java”却不匹配。 如你所见,你需要了解一点语法来理解正则表达式的含意。幸运的是对于大多数的用途,使用少量的简单构造(straightforward constructs)就已足够。 字符类是可选自符的集合,用‘[’封装,比如[Jj],[0-9],[A-Za-z]或[^0-9]。这里的-表示范围(Unicode落在两个边界之间的所有字符),^表示求补(指定字符外的所有字符)。 有许多预定以的字符类,像\d(数字)或\p{Sc}(Unicode货币符号),见表12-8和12-9。 大多数字符与它们自身匹配,像上例中的ava字符。 符号.匹配任何字符(可能行终止符(line terminators

正则表达式

北城余情 提交于 2020-02-14 20:09:25
正则表达式的概念及演示 概念:“正则表达式”:它是由“一组规则”组成的一个“字符串”,这个规则定义了:对其它字符串进行验证的一些规则。在Java中,我们经常需要验证一些字符串,例如:年龄必须是2位的数字、用户名必须是8位长度 而且只能包含大小写字母、数字等。正则表达式就是用来验证各种字符串的规则。它内部描述了一 些规则,我们可以验证用户输入的字符串是否匹配这个规则。 演示: 下面的程序让用户输入一个QQ号码,我们要验证: QQ号码必须是5–15位长度 而且必须全部是数字 而且首位不能为0 public class Demo { public static void main ( String [ ] args ) { Scanner sc = new Scanner ( System . in ) ; System . out . println ( "请输入你的QQ号码:" ) ; String qq = sc . next ( ) ; System . out . println ( checkQQ2 ( qq ) ) ; } //使用正则表达式验证 private static boolean checkQQ2 ( String qq ) { String regex = "[1-9]\\d{4,14}" ; //正则表达式 return qq . matches (

学点Java正则表达式

一曲冷凌霜 提交于 2020-02-14 16:32:26
正则表达式用来指定字符串模式。当你需要定位匹配某种模式的字符串时就可以使用正则表达式。例如,我们下面的一个例程就是在一个HTML文件中通过查找字符串模式<a href="...">来定位所有的超链接。 当然,为了指定一种模式,使用...这种记号是不够精确的。你需要精确地指定什么样的字符排列是一个合法的匹配。当描述某种模式时,你需要使用一种特殊的语法。 这里有一个简单例子。正则表达式 [Jj]ava.+ 匹配下列形式的任何字符串: 首字母是J或j 后续的三个字母是ava 字符串的剩余部分由一个或多个任意字符组成 例如,字符串“javaness”匹配这个特殊的正则表达式,但是字符串“Core Java”却不匹配。 如你所见,你需要了解一点语法来理解正则表达式的含意。幸运的是对于大多数的用途,使用少量的简单构造(straightforward constructs)就已足够。 字符类是可选自符的集合,用‘[’封装,比如[Jj],[0-9],[A-Za-z]或[^0-9]。这里的-表示范围(Unicode落在两个边界之间的所有字符),^表示求补(指定字符外的所有字符)。 有许多预定以的字符类,像\d(数字)或\p{Sc}(Unicode货币符号),见表12-8和12-9。 大多数字符与它们自身匹配,像上例中的ava字符。 符号.匹配任何字符(可能行终止符(line terminators

Java正则表达式教程

帅比萌擦擦* 提交于 2020-02-14 14:54:13
参考英文资料: http://docs.oracle.com/javase/tutorial/essential/regex/index.html Java 正则表达式教程 [1] Regular Expressions of Java Tutorial 译者序   正则表达式善于处理文本,对匹配、搜索和替换等操作都有意想不到的作用。正因如此,正则表达式现在是作为程序员七种基本技能之一 * ,因此学习和使用它在工作中都能达到很高的效率。   正则表达式应用于程序设计语言中,首次是出现在 Perl 语言,这也让 Perl 奠定了正则表达式旗手的地位。现在,它已经深入到了所有的程序设计语言中,在程序设计语言中,正则表达式可以说是标准配置了。   Java 中从 JDK 1.4 开始增加了对正则表达式的支持,至此正则表达式成为了 Java 中的基本类库,使用时不需要再导入第三方的类库了。Java 正则表达式的语法来源于象征着正则表达式标准的 Perl 语言,但也不是完全相同的,具体的可以参看 Pattern 类的 API 文档说明。   我在一次偶然中发现了位于 java.sun.com 站点上的 Java Tutorial ,也在那里看到了关于 Java 的正则表达式教程,感觉它不同于其他的正则表达式教程,文中以大量的匹配实例来进行说明。为了能让 Java 学习者能更好地使用正则表达式

Java正则表达式

为君一笑 提交于 2020-02-14 14:34:27
Java正则表达式 java.util.regex 是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包。它包括两个类: Pattern 和 Matcher 。Pattern是一个正则表达式经编译后的表现模式。Matcher对象是一个状态机器,它依据Pattern对象做为匹配模式对字符串展开匹配检查。 首先一个Pattern实例订制了一个所用语法与PERL的类似的正则表达式经编译后的模式,然后一个Matcher实例在这个给定的Pattern实例的模式控制下进行字符串的匹配工作。 正则表达式的构造摘要 详细摘要请看 jdk中文文档 ,下面我只是列出一些经常使用的 构造 匹配 . 任何字符(与行结束符可能匹配也可能不匹配) \d 数字:[0-9] \D 非数字: [^0-9] \s 空白字符:[ \t\n\x0B\f\r] \S 非空白字符:[^\s] \w 单词字符:[a-zA-Z_0-9] \W 非单词字符:[^\w] [abc] a、b 或 c(简单类) [^abc] 任何字符,除了 a、b 或 c(否定) [a-zA-Z] a 到 z 或 A 到 Z,两头的字母包括在内(范围) ^ 行的开头 $ 行的结尾 X? X,一次或一次也没有 X* X,零次或多次 X+ X,一次或多次 X{n} X,恰好 n 次 X{n,} X,至少 n 次 X{n,m} X,至少 n 次

正则表达式匹配域名

不想你离开。 提交于 2020-02-13 22:30:04
我们知道通过正则表达式可以实现对字符的匹配,正好项目中有个需要去掉图片url的域名部分,比如:http://xxx.yyy.cn/aa/bb.jpg,去掉后为aa/bb.jpg。这个用正则表达式可以轻松实现。 表达式如下: ^((http://)|(https://))?([a-zA-Z0-9]([a-zA-Z0-9\-]{0,61}[a-zA-Z0-9])?\.)+[a-zA-Z]{2,6}(/) 该表达式可以匹配以http://或者https://开头且支持域名中有中划线的情况,并且会匹配到域名后的第一个/. 也就是我们开题说的替换完的结果就是 aa/bb.jpg。 简要说明: ()中表示一个子表达式, | 或关系,比如这里匹配http://或https:// ? 表示匹配 0 次或一次。 也就是如果要匹配 xxx.yyy.cn/aa/bb.jpg 这个链接匹配的结果也是 aa/bb.jpg {n,m}限定表达式,最少n次,最大m次。n<=m java处理: public static void main(String[] args) { String pattern = "^((http://)|(https://))?([a-zA-Z0-9]([a-zA-Z0-9\\-]{0,61}[a-zA-Z0-9])?\\.)+[a-zA-Z]{2,6}(/)"; Pattern p

正则表达式匹配任意字符(包括换行符)的写法

China☆狼群 提交于 2020-02-13 22:29:44
  [\s\D]* 匹配换行和空格   今天想使用正则表达式来获取一段文本中的任意字符。 于是很随意得就写出如下匹配规则: (.*) 结果运行之后才发现,无法获得换行之后的文本。 于是查了一下手册,才发现正则表达式中,“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。同时,手册上还有一句话:要匹配包括 '\n' 在内的任何字符,请使用像 '[.\n]' 的模式。   于是我将正则表达式的匹配规则修改如下: ([.\n]*),当然,如果是在C#程序中直接写到话,需要改为([.\\n]*) 结果再次运行程序,发现什么内容也取不到了。   我百思不得其解,又将其修改为如下规则: ([.|\n]*) 以及 (\n.]*) 结果还是不行,什么内容都取不到。看来点符号和换行符卯上劲了~ 然后上网一查,虽然没有查出上述规则到底是什么地方出问题了,但是查出了一个解决办法,经过一试,果然可以匹配包括换行符在内的任意字符,以下为正确的正则表达式匹配规则: ([\s\S]*) 同时,也可以用 “([\d\D]*)”、“([\w\W]*)” 来表示。   ([\s\S]*?) 加上问号 表示最短匹配 来源: https://www.cnblogs.com/yb980/p/4090057.html