正则表达式

正则表达式

非 Y 不嫁゛ 提交于 2020-03-06 17:39:07
大写+小写+数字 ^(?=.*[a-z])(?=.*[A-Z])(?=.*\d)[^]{8,16}$ 大写+小写+特殊字符 ^(?=.*[a-z])(?=.*[A-Z])(?=.*\d)[a-zA-Z\d]{8,16}$ 大写+数字+特殊字符 ^(?=.*[A-Z])(?=.*\d)(?=.*[$@$!%*#?&])[A-Z\d$@$!%*#?&]{8,16}$ 小写+数字+特殊字符 ^(?=.*[a-z])(?=.*\d)(?=.*[$@$!%*#?&])[a-z\d$@$!%*#?&]{8,16}$ 字母+数字+特殊字符 ^(?=.*[A-Za-z])(?=.*\d)(?=.*[$@$!%*#?&])[A-Za-z\d$@$!%*#?&]{8,16}$ 来源: https://www.cnblogs.com/gigi2653/p/12427636.html

Linux常用命令

时间秒杀一切 提交于 2020-03-06 17:36:49
Linux必学60个命令 Linux系统信息存放在文件里,文件与普通的公务文件类似。每个文件都有自己的名字、内容、存放地址及其它一些管理信息,如文件的用户、文件的大小等。文件可以是一封信、一个通讯录,或者是程序的源语句、程序的数据,甚至可以包括可执行的程序和其它非正文内容。 Linux文件系统具有良好的结构,系统提供了很多文件处理程序。这里主要介绍常用的文件处理命令。 file 1.作用 file通过探测文件内容判断文件类型,使用权限是所有用户。 2.格式 file [options] 文件名 3.[options]主要参数 -v:在标准输出后显示版本信息,并且退出。 -z:探测压缩过的文件类型。 -L:允许符合连接。 -f name:从文件namefile中读取要分析的文件名列表。 4.简单说明 使用file命令可以知道某个文件究竟是二进制(ELF格式)的可执行文件, 还是Shell Script文件,或者是其它的什么格式。file能识别的文件类型有目录、Shell脚本、英文文本、二进制可执行文件、C语言源文件、文本文件、DOS的可执行文件。 5.应用实例 如果我们看到一个没有后缀的文件grap,可以使用下面命令: $ file grap grap: English text 此时系统显示这是一个英文文本文件。需要说明的是,file命令不能探测包括图形、音频、视频等多媒体文件类型

正则表达式去掉字符串中的特殊字符

情到浓时终转凉″ 提交于 2020-03-06 17:32:39
/*** 去掉字符串中的特殊字符 */ var excludeSpecial = function(s) { // 去掉转义字符 s = s.replace(/[’"\/\b\f\n\r\t]/g, ‘’); // 去掉特殊字符 s = s.replace(/[@#$%^&*{}:"\L<>? ]/); return s; }; function main(){ var s = “He is\tcalled ‘Johnny’”;; console.log(s); console.log(excludeSpecial(s)); console.log(s); }; main(); 来源: CSDN 作者: _必应 链接: https://blog.csdn.net/jbguo/article/details/104695164

学习06-闭包和递归

谁说胖子不能爱 提交于 2020-03-06 14:33:01
闭包 闭包的作用 递归 浅拷贝和深拷贝 正则表达式 正则表达式的特点 创建正则表达式 测试正则表达式test 边界符 字符类 量词符 来源: oschina 链接: https://my.oschina.net/u/4454049/blog/3189026

正则表达式详解

随声附和 提交于 2020-03-06 10:03:21
单字符匹配: # 匹配某个字符串: text = "abc" ret = re . match ( 'b' , text ) print ( ret . group ( ) ) # 点(.):匹配任意的字符(除了'\n'): text = "\nabc" ret = re . match ( '.' , text ) print ( ret . group ( ) ) # \d:匹配任意的数字: text = "aab" ret = re . match ( '\d' , text ) print ( ret . group ( ) ) # \D:匹配任意的非数字: text = "cab" ret = re . match ( '\D' , text ) print ( ret . group ( ) ) # \s:匹配的是空白字符(包括:\n,\t,\r和空格): text = " ab" ret = re . match ( '\s' , text ) print ( "=" * 30 ) print ( ret . group ( ) ) print ( "=" * 30 ) # \S:非空白字符: text = "\nab" ret = re . match ( '\S' , text ) print ( "=" * 30 ) print ( ret . group (

常用正则表达式

霸气de小男生 提交于 2020-03-06 09:13:14
常用正则表达式 i == 不区分大小写 test()是正则表达的式的方法 返回一个布尔值 g == 匹配内容时,全局搜索 exec 使用exec时,正则表达式不是全局匹配,则每次从0位置开始 replace 是字符串的方法,替换 match 将匹配到的结果都放入数组当中,并返回 search 用于查找符合正则的字串位置,只返回第一个匹配的位置 split 字符串方法,拆分为数组 . == 代表除了换行之外的所有单个字符 * == 出现任意次(0-n次)重复*前的单个字符的多次匹配 + == 表示至少一次 ? == 表示0-1次 \ == 表示转义,就是将特殊字符变成普通字符看待 [ ] == 表示欺负可以取到a-z [ 0-9a-zA-Z] \w == 等价于[a-zA-Z0-9—] //字母数字下划线 \w非字母数字下划线 \d == 代表数字 等价于[0-9] \D == 非数字 \D {7,} 至少匹配7个数字 相当于[^0-9] {7,} /^ == 匹配开始 $/ == 匹配结尾 \s == 匹配空格 \b == 可以匹配到是否到了边界 | == 代表或者的意思 匹配其中的一种字符| () == 加上小括号 将内容进行分组,可以作为一个整体进行多次匹配 ||||| var pattern = /8(.*)8/g; //获取 8..8 之间的任意字符 var str =

Julia : 正则表达式

心已入冬 提交于 2020-03-06 08:50:45
name = "000001.XSHE_20100104_093100_20200214_150000.csv" m = eachmatch(r"(?<date>\d{8})_(?<time>\d{6})",name) dts = collect(m) 得到: julia> dts = collect(m) 2-element Array{RegexMatch,1}: RegexMatch("20100104_093100", date="20100104", time="093100") RegexMatch("20200214_150000", date="20200214", time="150000") 获取数据: julia> starttime = (parse(Int64,dts[1][:date]),parse(Int64,dts[1][:time])) (20100104, 93100) julia> endtime = (parse(Int64,dts[2][:date]),parse(Int64,dts[2][:time])) (20200214, 150000) 如果有"IF1902.csv"字符串,提取其中的1902,可以: name ="IF1902.csv" m = match(r"\d{4}",name) m.match julia> output

爬虫初学——爬取京东商品的评论(二)

夙愿已清 提交于 2020-03-05 18:24:52
酱菜Seven7原创,转载请注明出处。 使用的手段:数据库Mysql, 语言python,正则表达式re 在获取了评论url的情况下 (获取京东评论的url方法) ,现在我们可以来爬取用户昵称和url了。作为一个初学者,我用的正则表达式,来对那url的数据,进行匹配获取。 一、根据内容,编写合适的正则表达式 通过分析打开的url地址的数据,我们可以找到所需的两个规律: 1、用户昵称部分 : 所以,我们针对提取用户的正则表达式如下: r'\"nickname\":\"([^",]+)\",\"replyCount2\"' 2、评论部分: 评论部分,因为会有无追评,而造成结尾不一致: 情况一: 情况二: 匹配评论的正则表达式为: r'\"content\":\"([^"]+)\",\"(?:creationTime|vcontent)\"' 二、爬取数据的主要代码: 代码功底不好,不要嫌弃,而且赶时间,能用就行,哈哈哈哈哈 导入的库: import requests import re import pymysql 第一部分 在此部分,我是组装url,循环4类评论。然后每一类,循环页码,这样就可以读取每类每页的url的数据,再调用方法来爬取了。我是创建了数据库的四个表,分别存储,要是没有这个需求的,存一个表就好了。 if __name__ == "__main__" :

最常用的正则表达式

有些话、适合烂在心里 提交于 2020-03-05 15:14:28
一、校验数字的表达式 数字:^[0-9]*$ n位的数字:^\d{n}$ 至少n位的数字:^\d{n,}$ m-n位的数字:^\d{m,n}$ 零和非零开头的数字:^(0|[1-9][0-9]*)$ 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$ 带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})?$ 正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$ 有两位小数的正实数:^[0-9]+(.[0-9]{2})?$ 有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$ 非零的正整数:^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$ 非零的负整数:^\-[1-9][]0-9″*$ 或 ^-[1-9]\d*$ 非负整数:^\d+$ 或 ^[1-9]\d*|0$ 非正整数:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$ 非负浮点数:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ 非正浮点数:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ 正浮点数:^[1-9]

grep、egrep命令用法

99封情书 提交于 2020-03-05 14:22:15
何谓正则表达式 正则表达式,又称正规表示法、常规表示法(Regular Expression,在代码中常简写为regex、regexp或RE),是一类字符所书写的模式,其中许多字符不表示其字面意义,而是表达控制或通配等功能。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。 正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。元字符使正则表达式具有处理能力。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,不表示其字面意义,而用于额外功能性描述。 正则表达式分类 正则表达式根据元字符的数量及功能不同又分为基本正则表达式(grep)和拓展正则表达式(egrep)。而grep和egrep同属于文本搜索工具,可根据用户指定的文本模式(搜索条件)对目标文件进行逐行搜索,显示能匹配到的行。用法上grep –E等同于egrep,与grep和egrep相似的文本搜索工具还有fgrep,因不支持使用正则表达式,所以不再单独介绍。 基本正则表达式(grep) 语法格式:grep[option]... 'PATTERN' FILE... 基本正则表达式元字符: 1.字符匹配: .:任意单个字符 [ ]:匹配指定范围内的任意单个字符 [0