正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种字串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
正则表达式是由普通字符(例如,字符a到z)以及特殊字符(称为‘元字符’)组成的文字模式。
普通字符包括所有大小写字母、所有数字、所有标点符号和一些其他符号。
[ABC],匹配[....]中的所有字符。
[^ABC],匹配除了[...]中字符的所有字符
[A-Z],[A-Z]表示一个区间,匹配所有大写字母
., 匹配除换行符(\n, \r)之外的任何单个字符
[\s\S],匹配所有
\w,匹配字母、数字、下划线。
特殊字符,就是一些有特殊含义的字符。
$, 匹配输入字符串的结尾位置
(), 标记一个子表达式的开始和结束位置
*,匹配前面的子表达式零次或多次
+,匹配前面的子表达式一次或多次
?,匹配前面的子表达式零次或一次
^,匹配输入字符串的开始位置
|,指明两项之间的一个选择
限定符包括:
{n},n是一个非负整数,匹配确定的n次
{n,},n是一个非负整数,至少匹配n次
{n,m},m和n均为非负整数,其中n≤m,最少匹配n次且最多匹配m次