linux两个文件取交集、并集、差集

如何得到两个文件的交集、并集和差集?

交集:两个文件中都出现的行

并集:两个文件中的所有行加起来,去掉重复

差集:在一个文件中存在,而在另一个文件中不存在。

比如以下两个文件:

a.txt

aaa

bbb

ccc

111

222

b.txt

ccc

ddd

eee

111

333

结果:

a.txt和b.txt的交集:

ccc

111

a.txt和b.txt的并集:

111

222

333

aaa

bbb

ccc

ddd

eee

a.txt中存在b.txt中不存在:

222

aaa

bbb

b.txt中存在a.txt中不存在:

333

ddd

eee

方法一:sort+uniq

sort:用于将文本文件内容加以排序

uniq:删除文件中重复的行,得到文件中唯一的行

交集

sort a.txt b.txt | uniq -d

(用sort将a.txt b.txt文件进行排序,uniq使得两个文件中的行唯一,使用-d输出两个文件中次数大于1的内容,即是得到交集)

并集

sort a.txt b.txt | uniq

(将a.txt b.txt文件进行排序&#x

你可能感兴趣的:(notes,linux,运维,服务器)