• linux正则表达式


    1. 基础正则表达式

    RE字符意义与范例
    ^word

    意义:待查找的字符串(word)在行首

    —————————————————

    范例:查找行首为#的哪一行,并列出行号

    grep '^#' my_re.txt

    word$

    意义:待查找的字符串(word)在行尾

    —————————————————

    范例:查找行首为!的哪一行,并列出行号

    grep '!$' my_re.txt

    ^$意义:空白行
    .

    意义:代表一定有一个任意字符的字符

    —————————————————

    范例:查找的字符串可以是(bvb)(bab)(bbb)(bb),但不能仅有(bb),即b与b之间一定仅有一个字符,而空格符也是字符

    grep 'b.b' my_re.txt

    \s意义:匹配空格
    \

    意义:转义字符,将特殊符号的特殊意义去除

    ————————————————————

    范例:查找含有单引号'的那一行

    grep '\'' my_re.txt

    *

    意义:重复0个到无穷多个前一个字符

    —————————————————

    范例:找出含有(bs)(bss)(bsss)等的字符串,注意,因为*可以是0个,所以bs也是符合带查找的字符串。另外,因为*为重复"前一个RE字符串"的符号,因此,在*之前必须要紧接着一个RE字符,例如任意字符为".*"

    grep 'bss*' my_re.txt

    [list]

    意义:从字符集合的RE字符里面找出想要选取的字符

    ———————————————————————

    范例:查找含有(gl)或(gd)的那一行,需要特别留意的是,在[]当中代表一个带查找的字符,例如"a[afl]y"代表查找的字符串可以是aay,afy,aly,即[afl]代表a或f或l的意思

    grep 'g[ld]' my_re.txt

    [n1-n2]

    意义:从字符集合的RE字符里面找出想要选取的字符范围

    —————————————————————————

    范例:查找含有任意数字的那一行。需要特别注意,在字符集合[]中减号-是有特殊意义的,它代表两个字符之间的所有连续字符。但这个连续与否与ASII编码有关,因此,你的编码需要设置证券(在bash中,需要确定LANG与LANGUAGE的变量是否正确)例如所有大写字符为[A-Z]

    grep '[0-9]' my_re.txt

    [^list]

    意义:从字符集合的RE字符里面找出不要的字符串或范围

    —————————————————————————

    范例:查找的字符串可以是(oog)(ood)但不能是(oot),那个^在[]内时代表的意义是“反向选择”的意思。例如,我不要大写字符,则为[^A-Z]。但是,需要特别注意的是,如果以grep -n '[^A-Z]' my_re.txt来查找,却发现该文件内所有行都被列出,为什么?因为这个[^A-Z]是“非大写字符”的意思,因为每一行均有非大写字符。

    grep 'oo[^t]' my_re.txt

    \{n,m\}

    意义:连续n到m个的前一个RE字符,若为\{n\}则是连续n个前一个RE字符,若为\{n,\}则是连续n个以上的前一个RE字符

    —————————————————————————————————————————

    范例:在g与g之间有2到3个o存在的字符,即(goog)(gooog)

    grep 'go\{2,3\}g' my_re.txt

    2. 扩展正则表达式

    grep默认只支持基础正则表达式,下面扩展正则表达式需要使用grep -E或者egrep,建议使用egrep,直接区分命令比较好记忆,egrep和grep -E是类似命令和别名的关系。

    RE字符意义与范例
    +

    意义:重复一个或一个以上前一个RE字符

    —————————————————

    范例:查找(god)(good)(goood)等的字符串,o+代表一个以上的o

    egrep -n 'go+d' my_re.txt

    ?

    意义:重复0个或一个前一个RE字符

    —————————————————

    范例:查找(gd)(god)这两个字符串,o?代表0个o或者1个o

    egrep -n 'go?d' my_re.txt

    |

    意义:用或(or)的方式找出数个字符串

    —————————————————

    范例:查找(gd)(good)这两个字符串,如果还想找出dog字符串

    egrep -n 'gd|good' my_re.txt

    egrep -n 'gd|good|dog' my_re.txt

    ( )

    意义:找出“组”字符串

    ——————————

    范例:查找(glad)或(good)这两个字符串,因为g与d是重复的,所以可以将la和oo列与()中,并以|来分隔就好了

    egrep -n 'g(la|oo)d' my_re.txt

    ( )+

    意义:多个重复组判别

    ——————————

    范例:查找"AxyzxyzxyzxyzC"的字符串,意思是需要查找以A开头以C结尾,中间有一个以上xyz字符串

    egrep -n 'A(xyz)+C' my_re.txt

  • 相关阅读:
    几何建模Brep边界表达法
    利用 React 和 Bootstrap 进行强大的前端开发
    C语言指针详解
    C++右值引用、万能引用、完美转发和引用折叠
    Pandas中的Series对象详解(含Python代码)
    IIC 通信协议之stm32 驱动OLED
    3D模型格式汇总
    广度优先(BFS)(例子:迷宫)
    每日一博 - 浅析事务隔离级别& MVCC机制
    关于WEB端实现电子海图研究二GeoServer
  • 原文地址:https://blog.csdn.net/DaxiaLeeSuper/article/details/126455891