📜  bash 计算文件中的重复行数 - Shell-Bash (1)

📅  最后修改于: 2023-12-03 15:29:35.832000             🧑  作者: Mango

Bash 计算文件中的重复行数

在Shell脚本中,常需要对文本文件中的行数进行操作。本文将介绍如何使用Bash脚本计算文件中的重复行数。

实现

我们可以使用 sort 命令对文件进行排序,然后使用 uniq 命令统计重复行数。

sort filename | uniq -dc

这个命令会输出每个重复行与其出现的次数,如下所示:

3 apple
2 banana
1 orange

我们也可以将结果保存到文件中:

sort filename | uniq -dc > output.txt
参数说明
  • sort 命令会按照字典序对文件行进行排序。
  • uniq 命令会去重。-d 参数会仅显示重复行, -c 参数会给出重复行的出现次数。
注意事项

使用 sort 命令可以确保重复行在文件中相邻,因此可用于有效地计算重复行数。但是,这可能会影响文件的原始顺序。如果不想更改文件的原始顺序,请不要在计算重复行数时使用 sort 命令。

总结

使用 Bash 脚本计算文件中的重复行数是一种实用且基本的技巧,适用于可以在命令行中完成的文本处理工作。使用 sortuniq 命令可以轻松地实现此操作。