正则表达式中使用的 ?:
、?=
和 ?!
是三种不同的正则表达式语法,它们分别代表非捕获组、正向前瞻断言和负向前瞻断言。
(?:...)
是一种非捕获组(non-capturing group)的语法。它用于将一部分正则表达式括在一起,但不将该部分作为单独的捕获组。这意味着即使匹配了这部分表达式,也不会在结果中创建新的捕获组。
正则表达式中的捕获组(capture group)是使用圆括号 () 包围的一部分表达式。这些捕获组在匹配到的字符串中标记了特定的部分,并将其保存起来以供稍后使用。
如果还不清楚什么是捕获组,下面给一个例子就清楚了:
import re
pattern = r'a(.*)test'
text = 'This is a good test.'
match = re.search(pattern, text)
if match:
print("Found word:", match.groups())
# 输出
# Found word: (' good ',)
在这个示例中,(.*)
是一个捕获组,用于将a
和 test
中间的字符提取出来。
知道了捕获组,那么非捕获组也能猜出来了。有时你可能只想将表达式括在一起,但不想保存匹配结果。在这种情况下,可以使用非捕获组 (?: ...)
示例:
import re
pattern = r'(?:abc)def'
text = 'abcdef'
match = re.search(pattern, text)
if match:
print("Match found")
在这个示例中,(?:abc)
是一个非捕获组,它将 abc
与 def
组合在一起进行匹配,但不会作为单独的捕获组。
?=
是正向前瞻断言(positive lookahead assertion)。它用于匹配某个子表达式后的位置,但不包含匹配到的子表达式在最终的结果中。前瞻断言用来确保某一部分的匹配被后续某一部分的条件匹配。
示例:
import re
pattern = r'abc(?=def)'
text = '.x abcdef123'
text2 = '.x abc1def123'
match = re.search(pattern, text)
if match:
print("Match found:", match.group())
# 输出
# Match found: abc
match = re.search(pattern, text2)
if not match:
print("Match not found")
# 输出
# Match not found
在这个示例中,abc(?=def)
使用了正向前瞻断言。它将匹配 abc
后面跟着 def
的部分。在 abcdef
中,它匹配了 abc
,因为 abc
后面是 def
。
?!
是负向前瞻断言(negative lookahead assertion)。它用于确保某个子表达式不匹配之后的位置,而不包含匹配到的子表达式在最终的结果中。
用法示例:
import re
pattern = r'abc(?!def)'
text = 'abcxyz'
text2 = 'abcdef'
match = re.search(pattern, text)
if match:
print("Match found:", match.group())
# 输出
# Match found: abc
match = re.search(pattern, text2)
if not match:
print("Match not found")
# 输出
# Match not found
在这个示例中,abc(?!def)
使用了负向前瞻断言。它将匹配 abc
后面不跟着 def
的部分。在 abcxyz
中,它匹配了 abc
,因为 abc
后面没有 def
。
(?:...)
是非捕获组,不会捕获组内的匹配结果。?=
是正向前瞻断言,确保匹配后的位置满足条件。?!
是负向前瞻断言,确保匹配后的位置不满足条件。