今天遇到一个问题,在使用python的re.findall和re.search的过程中,发现一个奇怪的事情,同样的表达式,两者的表现却不一样,例如下述代码:
s = "gpdk090_nmos1v #(.w(1.5e-6), .l(2.8e-07), .as(9e-13), .ad(4.5e-13), .ps(4.2e-06), .pd(2.1e-06), .m((1)*(2)))"
r1 = "#\((.*?\(.*?\)){0,}\)"
res = re.findall(r1, s)
res1 = re.search(r1,s).group()
print res, res1
'''
输出的结果分表示
res = ['*(2)']
res1 = #(.w(1.5e-6), .l(2.8e-07), .as(9e-13), .ad(4.5e-13), .ps(4.2e-06), .pd(2.1e-06), .m((1)*(2))
'''
res1是我所希望的结果,然后查了一段时间的原因,发现二者是在使用捕获分组(xxx)和非捕获分组(?:xxx)有区别,re.search使用的是非捕获方式,re.findall使用的是捕获方式,具体原因可以查下官方解释
要使用re.findall的解决方式
正则表达式修改为:r1 = “#((?:.?(.?)){0,})”,然后就能匹配到所有符合要求的子串了。
加油,打工人!