AWK是一种编程语言。AWK 有几种实现方式(主要以解释器的形式)。AWK已被编入POSIX中。今天使用的主要实现是:
如果您只关心标准功能,请致电awk,它可以是gawk或nawk或mawk或其他实现。如果要使用GNU awk中的功能,请使用gawk或Perl或Python。
我的理解是: awk是将文本逐行筛选, 再将筛选行按(用-F
指定的)分割符
拆分成多列, 进行处理
awk [选项] # 可以没有
'单引号开始
BEGIN{ BEGIN语句块代码 }
/表达式/{表达式语句块代码}
/表达式2/{表达式语句块代码}
/表达式n/{表达式语句块代码}
END{END语句块代码}
单引号结束'
文件1,文件2...文件n # 如果有表达式块,就要有输入, 输入可以用重定向或文件 , 文件不能写在单引号内
只用BEGIN{}语句块的话,可以不要输入流, 否则都要有输入流
例1 : 查看包含"root"字符串的行
sudo awk /root/{print} /etc/passwd
👆效果如同👇
sudo grep root /etc/passwd
👆效果如同👇
sudo awk '/root/{print $0}' /etc/passwd
例2
awk 'BEGIN{print "hello world"}'
如果语句块中有空格,就要用引号包住
例3
echo hello | awk {print}
例4
echo -e "world\n你" | awk '
BEGIN { print "hello " }
/wo/{print}
/你/{print}
END { print "好" }
'
例5
awk '
BEGIN{print "hello"} BEGIN{print "world"}
BEGIN{print "世界"} BEGIN{print "你好"}
'
例6 : print 等效 print $0
sudo awk /root/{print} /etc/passwd
sudo awk '/root/{print $0}' /etc/passwd
POSIX options: GNU long options: (standard)
-f progfile --file=progfile
-F fs --field-separator=fs
-v var=val --assign=var=val
Short options: GNU long options: (extensions)
-b --characters-as-bytes
-c --traditional
-C --copyright
-d[file] --dump-variables[=file]
-D[file] --debug[=file]
-e ‘program-text’ --source=‘program-text’
-E file --exec=file
-g --gen-pot
-h --help
-i includefile --include=includefile
-l library --load=library
-L[fatal|invalid|no-ext] --lint[=fatal|invalid|no-ext]
-M --bignum
-N --use-lc-numeric
-n --non-decimal-data
-o[file] --pretty-print[=file]
-O --optimize
-p[file] --profile[=file]
-P --posix
-r --re-interval
-s --no-optimize
-S --sandbox
-t --lint-old
-V --version
-F
指定分隔符, 不指定的话, 默认是 空格 和 tab(\t)-f
指定文件, 可以省略, 文件路径全名写在最后即可-v
指定awk自己的变量-V
查看版本awk 是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件,或其它命令的输出(即管道)。它支持用户自定义函数和 动态正则表达式等先进功能,是linux/unix下的一个强大编程工具。它在命令行中使用,但更多是作为脚本来使用。
awk的处理文本和数据的方式是这 样的,它逐行扫描文件,从第一行到最后一行,寻找匹配的特定模式的行,并在这些行上进行你想要的操作。如果没有指定处理动作,则把匹配的行显示到标准输出 (屏幕),即默认处理动作是print;如果没有指定模式,则所有被操作所指定的行都被处理,即默认指定模式是全部。awk分别代表其作者姓氏的第一个字母。因为它的作者是三个人,分别是Alfred Aho、Brian Kernighan、Peter Weinberger。gawk是awk的GNU版本,它提供了Bell实验室和GNU的一些扩展。
像shell一样,awk也有好几种,常见的如awk、nawk、mawk、gawk,其中
awk:最初在1 9 7 7年完成,1 9 8 5年发表了一个新版本的awk,它的功能比旧版本增强了不少,awk 能够用很短的程序对文档里的资料做修改、比较、提取、打印等处理,如果使用C 或P a s c a l 等语言编写程序完成上述的任务会十分不方便而且很花费时间,所写的程序也会很大;
nawk: 在 20 世纪 80 年代中期,对 awk语言进行了更新,并不同程度地使用一种称为 nawk(new awk) 的增强版本对其进行了替换。许多系统中仍然存在着旧的awk 解释器,但通常将其安装为 oawk (old awk) 命令,而 nawk 解释器则安装为主要的 awk 命令,也可以使用 nawk 命令。Dr. Kernighan 仍然在对 nawk 进行维护,与 gawk 一样,它也是开放源代码的,并且可以免费获得;
mawk:mawk 是 awk 编程语言的解释器。awk语言在多媒体数据文件以及文本的检索和处理,算法的原型设计和试验都有广泛的使用。mawk带给awk新的概念,它实现了在《The AWK Programming Language》(Aho, Kernighan and Weinberger, The AWK Programming Language, Addison-Wesley Publishing, 1988.被认为是 AWK 手册。)中定义的 awk语言。mawk遵循 POSIX 1003.2 (草案 11.3)定义的 AWK 语言,包含了一些没有在AWK 手册中提到的特色,同时 mawk 提供一小部分扩展,另外据说mawk是实现最快的awk;
gawk: 是 GNU Project 的awk解释器的开放源代码实现。尽管早期的 GAWK 发行版是旧的 AWK 的替代程序,但不断地对其进行了更新,以包含 NAWK 的特性;
目前,大家都比较倾向于使用awk和gawk,