文本处理器 - wc cut sort uniq
wc word count统计文本文件中的字符个数 用法: wc filename 行数 字符个数 文件大小 (字节) 文件名 -l -w -c cut 用来做文件分隔 -d 指定分隔符(delimiter) -d[ :]不行 -f 指定输出的列数据: -f2 -f1-3 -f1,3 --output-delimiter='xx' [cut的局限性:1、-d指定分隔符,不能同时指定多个2、不能做高级的格式化输出;所以我要熟练掌握awk] sort 排序,默认查看第一个字符(包括数字字母以及空格和特殊字符),以ASCII码来排序(大小写不是) -f 忽略大小写的差异, 例如A与a视为编码相同; -b忽略最前面的空格符部分; -M以月份的名字来排序,例如JAN DEC等等的排序方法; -n使用纯数字进行排序,默认是以文件形态来排序的; -r反向排序; -u就是uniq,相同的数据中,仅出现一行代表; -t分隔符,默认是用tab键分割; -k以那个区间(field)来进行排序的意思 uniq 连续且相同的命令,才被视为重复 建议,先排序,后去重 tar 归档-》 对目录 -c统计某些字符重复次数(重要) sort filename | uniq -c 来源: