文本处理 awk
======================================================== 一、awk简介 awk 是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个 或多个文件,或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能,是linux/unix 下的一个强大编程工具。它在命令行中使用,但更多是作为脚本来使用。 awk的处理文本和数据的方式是这样的,它逐行扫描文件,从第一行到最后一行,寻找匹配的特定 模式的行,并在这些行上进行你想要的操作。如果没有指定处理动作,则把匹配的行显示到标准输出( 屏幕),如果没有指定模式,则所有被操作所指定的行都被处理。awk分别代表其作者姓氏的第一个字 母。因为它的作者是三个人,分别是Alfred Aho、Brian Kernighan、Peter Weinberger。gawk是awk的 GNU版本,它提供了Bell实验室和GNU的一些扩展。 二、awk的两种形式语法格式 awk [options] 'commands' filenames awk [options] -f awk-script-file filenames ==options: -F 定义输入字段分隔符,默认的分隔符是空格或制表符(tab) ==command: BEGIN{} {} END{}