简单的笔记
正则表达式 正则表达式又称正规表达式、常规表达式。 在代码中常简写为regex、regexp或RE。 正则表达式是使用单个字符串来描述、匹配一系列符合某个句法规则的字符串,简单来说,是一种匹配字符串的方法,通过一些特殊符号,实现快速查找、删除、替换某个特定字符串。 正则表达式的组成 正则表达式是由普通字符与元字符组成的文字模式。 模式的作用 模式用于描述在搜索文本时要匹配的一个或多个字符串。 正则表达式作为一个模板,将某个字符模式与所搜素的字符串进行匹配。 普通字符 普通字符包括大小写字母、数字、标点符号及一些其他符号 元字符 元字符则是指那些在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。 正则表达式一般用于什么地方 一般用于脚本编程与文本编辑器中 正则表达式的字符串表达方法根据不同的严谨成都与功能分为基本正则表达式与扩展正则表达式。 在Linux中常见的文件处理工具中grep与sed支持基础正则表达式,而egrep与awk支持扩展正则表达式。 sed sed(Stream EDitor)是一个强大而简单的文本解析转换工具,可以读取文本,并根据指定的条件对文本内容进行编辑(删除、替换、添加、移动等),最后输出所有行或者仅输出处理的某些行。 sed也可以在无交互的情况下实现相当复杂的文本处理操作