Skip to content
On this page

正则表达式的完整语法,包括各种元字符、模式和修饰符:

正则表达式要么匹配位置,要么匹配字符

元字符(Metacharacters):

元字符是正则表达式中具有特殊含义的字符,需要进行转义才能匹配字面值。

  • . : 匹配任何单个字符,除了换行符。
  • [] : 字符类,匹配方括号内的任何一个字符。
  • [^] : 否定字符类,匹配不在方括号内的任何一个字符。
  • * : 匹配前一个字符零次或多次。
  • + : 匹配前一个字符一次或多次。
  • ? : 匹配前一个字符零次或一次。
  • | : 或操作符,匹配两个或多个表达式中的任意一个。
  • () : 捕获组,用于标记子模式,以便在匹配后获取捕获的文本。

位置限定符:

  • ^ : 匹配字符串的开头。
  • $ : 匹配字符串的结尾。
  • \b : 匹配单词边界。
  • \B : 匹配非单词边界。
  • \A : 匹配输入的开头。
  • \Z : 匹配输入的结尾,或者在最后的换行符前。

字符转义:

用反斜杠 \ 来转义特殊字符,使其匹配字面值。

  • \d : 匹配数字字符(0-9)。
  • \D : 匹配非数字字符。
  • \w : 匹配字母、数字、下划线。
  • \W : 匹配非字母、数字、下划线。
  • \s : 匹配空白字符(空格、制表符、换行等)。
  • \S : 匹配非空白字符。

量词:

  • {n} : 匹配前一个字符恰好 n 次。
  • {n,} : 匹配前一个字符至少 n 次。
  • {n,m} : 匹配前一个字符至少 n 次,但不超过 m 次。

修饰符(Modifiers):

修饰符在正则表达式的末尾添加,影响匹配的行为。

  • i : 不区分大小写匹配。
  • g : 全局匹配,匹配所有符合条件的结果。
  • m : 多行匹配,影响 ^$ 的行为。

正则表达式的语法可以根据不同的编程语言和工具略有不同,但以上列出的元字符、位置限定符、字符转义、量词和修饰符是常见的基本元素。根据你的需求,你可以组合这些元素来构建出适用的正则表达式模式。