发表新帖

发表新帖

Find unique lines

后端未结

关注

 11  1914

情书的邮戳

How can I find the unique lines and remove all duplicates from a file? My input file is

I would like the result to be:

相关标签:

11条回答

甜味超标

2020-12-23 11:21

You could also print out the unique value in "file" using the cat command by piping to sort and uniq

cat file | sort | uniq -u

0 讨论(0)
发布评论:

提交评论
- 加载中...
春和景丽

2020-12-23 11:22
Use as follows:
```
sort < filea | uniq > fileb
```
0 讨论(0)
发布评论:

提交评论
- 加载中...
孤城傲影

2020-12-23 11:26
you can use:
```
sort data.txt| uniq -u
```
this sort data and filter by unique values
0 讨论(0)
发布评论:

提交评论
- 加载中...
南笙

2020-12-23 11:27
I find this easier.
```
sort -u input_filename > output_filename
```
-u stands for unique.
0 讨论(0)
发布评论:

提交评论
- 加载中...
野性不改

2020-12-23 11:32

uniq should do fine if you're file is/can be sorted, if you can't sort the file for some reason you can use awk:

awk '{a[$0]++}END{for(i in a)if(a[i]<2)print i}'

0 讨论(0)
发布评论:

提交评论
- 加载中...
难免孤独

2020-12-23 11:34
While sort takes O(n log(n)) time, I prefer using
```
awk '!seen[$0]++'
```
awk '!seen[$0]++' is an abbreviation for awk '!seen[$0]++ {print}', print line(=$0) if seen[$0] is not zero. It take more space but only O(n) time.
0 讨论(0)
发布评论:

提交评论
- 加载中...

1 2 下一页

热议问题