什么是正则表达式?
•正则表达式(regex)是描述一组字符串的模式
匹配过程测试给定字符串是否与模式匹配,也可以修改字符串.例如,通过替换子串或将其拆分为子串
•正则表达式是一种功能强大的编程工具,广泛用于计算/文本处理(例如)在Perl、Tcl/Tk、Java、grep、sed、awk、vi、emacs、lex中找到
但请注意,regex语法各不相同
•许多应用-一些随机示例:从一组网页中删除html;从程序中提取注释块(例如构建文档);检查文档中的双字(“the”、“here here”)
简单模式
•正则表达式的最简单示例是文字模式,大多数字符只是与自己匹配.同样,大多数字符序列形成正则表达式以匹配相同的字符串中的字符序列
•但有些字符有特殊的行为:元字符(metachars)
•Python提供了广泛的正则表达式功能
⋄ 非基本语言-必须导入模块“re”
⋄ 可以使用模块函数“直接”进行正则表达式匹配
import sys, re
with open(sys.<