正则表达式的完整语法,包括各种元字符、模式和修饰符:
正则表达式要么匹配位置,要么匹配字符
元字符(Metacharacters):
元字符是正则表达式中具有特殊含义的字符,需要进行转义才能匹配字面值。
.
: 匹配任何单个字符,除了换行符。[]
: 字符类,匹配方括号内的任何一个字符。[^]
: 否定字符类,匹配不在方括号内的任何一个字符。*
: 匹配前一个字符零次或多次。+
: 匹配前一个字符一次或多次。?
: 匹配前一个字符零次或一次。|
: 或操作符,匹配两个或多个表达式中的任意一个。()
: 捕获组,用于标记子模式,以便在匹配后获取捕获的文本。
位置限定符:
^
: 匹配字符串的开头。$
: 匹配字符串的结尾。\b
: 匹配单词边界。\B
: 匹配非单词边界。\A
: 匹配输入的开头。\Z
: 匹配输入的结尾,或者在最后的换行符前。
字符转义:
用反斜杠 \
来转义特殊字符,使其匹配字面值。
\d
: 匹配数字字符(0-9)。\D
: 匹配非数字字符。\w
: 匹配字母、数字、下划线。\W
: 匹配非字母、数字、下划线。\s
: 匹配空白字符(空格、制表符、换行等)。\S
: 匹配非空白字符。
量词:
{n}
: 匹配前一个字符恰好 n 次。{n,}
: 匹配前一个字符至少 n 次。{n,m}
: 匹配前一个字符至少 n 次,但不超过 m 次。
修饰符(Modifiers):
修饰符在正则表达式的末尾添加,影响匹配的行为。
i
: 不区分大小写匹配。g
: 全局匹配,匹配所有符合条件的结果。m
: 多行匹配,影响^
和$
的行为。
正则表达式的语法可以根据不同的编程语言和工具略有不同,但以上列出的元字符、位置限定符、字符转义、量词和修饰符是常见的基本元素。根据你的需求,你可以组合这些元素来构建出适用的正则表达式模式。