正则表达式的完整语法,包括各种元字符、模式和修饰符:
正则表达式要么匹配位置,要么匹配字符
元字符(Metacharacters):
元字符是正则表达式中具有特殊含义的字符,需要进行转义才能匹配字面值。
.: 匹配任何单个字符,除了换行符。[]: 字符类,匹配方括号内的任何一个字符。[^]: 否定字符类,匹配不在方括号内的任何一个字符。*: 匹配前一个字符零次或多次。+: 匹配前一个字符一次或多次。?: 匹配前一个字符零次或一次。|: 或操作符,匹配两个或多个表达式中的任意一个。(): 捕获组,用于标记子模式,以便在匹配后获取捕获的文本。
位置限定符:
^: 匹配字符串的开头。$: 匹配字符串的结尾。\b: 匹配单词边界。\B: 匹配非单词边界。\A: 匹配输入的开头。\Z: 匹配输入的结尾,或者在最后的换行符前。
字符转义:
用反斜杠 \ 来转义特殊字符,使其匹配字面值。
\d: 匹配数字字符(0-9)。\D: 匹配非数字字符。\w: 匹配字母、数字、下划线。\W: 匹配非字母、数字、下划线。\s: 匹配空白字符(空格、制表符、换行等)。\S: 匹配非空白字符。
量词:
{n}: 匹配前一个字符恰好 n 次。{n,}: 匹配前一个字符至少 n 次。{n,m}: 匹配前一个字符至少 n 次,但不超过 m 次。
修饰符(Modifiers):
修饰符在正则表达式的末尾添加,影响匹配的行为。
i: 不区分大小写匹配。g: 全局匹配,匹配所有符合条件的结果。m: 多行匹配,影响^和$的行为。
正则表达式的语法可以根据不同的编程语言和工具略有不同,但以上列出的元字符、位置限定符、字符转义、量词和修饰符是常见的基本元素。根据你的需求,你可以组合这些元素来构建出适用的正则表达式模式。