开课吧web架构师实战特训远航班-CFANZ编程社区

https://pan.baidu.com/s/1Ubqj_pn8xMpkmMziMk-XaA?pwd=8888

前言

正则在实际中太多时候用到了，但还没有系统梳理过，这周学了一些正则参考实际经常用到的写一个简单的手册。

基础

字符组

正则	解释
[aA]	字符组[] 允许匹配一组可能出现的字符，如：[jJ]ava 表示匹配java或者Java
[0-9]	字符-代表区间，如：[0-9a-zA-Z] 表示匹配任意大小写字母数字
\	对特殊符号进行转义，如：`[\<\>]` 表示匹配`<>`尖括号
^	实现取反操作，如：[^a-z] 表示匹配不包含小写字母的字符

字符串

正则	解释
^	匹配一个字符串的开始
$	匹配一个字符串的结束
.	匹配任何一个字符，注意：它只能出现在方括号以外，但是匹配的时候不包括\n
？	匹配可选字母，即出现该字母为一次或零次
+	匹配必须至少出现一次的字符，即一次或多次
*	匹配必须至少出现零次的字符，即零次或多次
{n}	匹配n次
{n,m}	匹配n次到m次

快捷方式

基于以上基础，就有了快捷方式的匹配。

正则	解释
\w	表示匹配包括下划线的任何单词字符，等价于[A-Za-z0-9_]
\d	表示匹配任意数字，等价于[0-9]
\s	表示匹配空白字符，如：空格、tab、换行等
\b	表示匹配单词的边界，如：\bcode\b 匹配code.xxxx，xxx.code
取反	\w 将小写改为大写即可\W，如：不以字母开头，[^\w]

高级

分组

正则	解释
()	表示捕捉匹配到的数据，如<div>(.*?)</div>
(\d{4})	表示匹配4个数字
(\d{1,2})	表示匹配到提取的1个到2个数字
(?:code)	非捕捉分组，匹配code但不获取

看个实例：匹配并提取下面的数字。

就可以有多种写法，

第一种写法：(?:\d+|tel)[\-\:](\d{5}) 表示先匹配到数字或者tel字符，接着匹配-和:，最后提取五位数字。

第二种写法， (?:.+)[-:](\d{5}) 表示直接匹配到-和:，再提取五位数字。

开课吧web架构师实战特训远航班_数据

image.png

先行断言、后行断言

正则	解释
\x	分组的回溯调用，匹配某种之前的规则。如`(\w)(\w)\2\1` 表示匹配某种AB-BA对称组合，注意加括号
(?=表达式)	表示匹配到所在位置右侧的表达式。如`(?=.*?[a-z])` 表示匹配至少一个小写的字符串
(?!表达式)	表示右边不能出现某字符。如：`\w+@(?!qq.com)` 表示匹配不是qq邮箱
(?<=表达式)	表示匹配到所在位置左侧的表达式，如：`(?<=王).+` 就表示匹配王姓名字
(?<!表达式)	指在某个位置向左看，表示所在位置左侧不能匹配到表达式，如：`^\$.*?(?<!\$)\$(?!\$)` 表示匹配两个$$之间的数据

再看个匹配小数的实例。

写法一：(?<!\.)\d\.\d+$ 表示从小数点左边匹配。

开课吧web架构师实战特训远航班_正则_02

image.png

写法二：^\d+\.(?!\.)\d+$ 表示从小数点右边匹配。

开课吧web架构师实战特训远航班_字符串_03

image.png

结合上面两种写法，就可以总结出小数点的左右两边都不能再有小数点的写法：\d(?<!\..*)\.(?!.*\.)

实例

下面整理了几个常用的正则写法，往后再慢慢补充。

正则	解释
`^1[3-9]\d{9}$`	匹配手机号码。以1开头的九位纯数字，第二位为3到9数字。
`((25[0-5]\|2[0-4]\d\|1\d{2}\|[1-9]?\d)\.){3}(25[0-5]\|2[0-4]\d\|1\d{2}\|[1-9]?\d)\:\d.+$`	匹配IP地址和端口
`((25[0-5]\|2[0-4]\d\|1\d{2}\|[1-9]?\d)\.){3}(25[0-5]\|2[0-4]\d\|1\d{2}\|[1-9]?\d)`	匹配IP地址，注意IP的地址的取值区间，具体写法参考： https://www.cnblogs.com/FashionDoo/p/10685631.html
`^(http(s)?:\/\/)\w+[^\s]+(\.[^\s]+){1,}[\/]`	匹配域名地址，http://xxx.xxx.xxx.xx/
`^(http(s)?:\/\/)\w+[^\s]+(\.[^\s]+){1,}[\/].+`	匹配url地址，http://xxx.xxx.xxx.xx/xxx
`[1-9][0-9,X]{14,17}`	匹配身份证号码
`\n\s*\r`	匹配空白行
`^\s\|\s$`	匹配首尾的空格
`\b[kK][eE][yY]\b`	匹配私钥key字符
`\w+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)`	匹配邮箱
`[a-zA-Z]:[\\/]{1,2}(?:[a-zA-Z0-9\.\-_ ]+[\\/]{1,2})*([a-zA-Z0-9\.\-_ ]+)`	匹配windows绝对地址

参考资料

https://regexr-cn.com/

https://tool.oschina.net/regex/#

https://www.codejiaonang.com/#/course/regex_chapter1/0/7

https://ihateregex.io/

​​https://pan.baidu.com/s/1Ubqj_pn8xMpkmMziMk-XaA?pwd=8888​​

前言

基础

字符组

字符串

快捷方式

高级

分组

先行断言、后行断言

实例

参考资料

https://pan.baidu.com/s/1Ubqj_pn8xMpkmMziMk-XaA?pwd=8888