【R语言】R语言常用函数:交集intersect、并集union、找不同setdiff、判断相同setequal

交集intersect、并集union、差集setdiff、判断相同setequal


在使用R语言进行生物信息数据分析的过程中,需要经常比较不同集合之间元素的共性和差异,所以需要使用到交集、并集、找不同、判断相同等操作。

交集:intersect

两个向量的交集,集合可以是数字、字符串等

# 两个数值向量取交集
intersect(x=1:4, y = 2:6)
# [1] 2 3 4

# 两个字符向量取交集
intersect(x=letters[1:4], y = letters[2:6])
# [1] "b" "c" "d"

# 混合向量
intersect(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))
[1] "a" "4"

并集:union

求两个向量的并集,集合可以是任何数值类型

# 两个数值向量取并集
union(x=1:4, y = 2:6)
# [1] 1 2 3 4 5 6

# 两个字符向量取并集
union(x=letters[1:4], y = letters[2:6])
# [1] "a" "b" "c" "d" "e" "f"

# 混合向量
union(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))
[1] "a" "b" "c" "4" "2" "3"

差集:setdiff

求向量x与向量y中不同的元素(只取x中不同的元素,即存在于向量x减去向量x与向量y的交集) 
setdiff(x, y)

x = 1:4
y = 2:6
# 找x中不同于y的元素
setdiff(x, y)
# [1] 1
# 找y中不同于x的元素
setdiff(y, x)
# [1] 5 6

判断相同:setequal

x = 1:4
y = 2:6
# 判断x与y是否相同,结果为假
setequal(x, y)
# [1] FALSE
# 找y与x是否相同,结果为假
setequal(y, x)
# [1] FALSE

# 只有完全相同的才返回TRUE
y = 1:4
setequal(x, y)
# [1] TRUE

案例

# 两个字符向量
treeleaf <- as.vector(treeleaf)
treeotu <- as.vector(treeotu)
length(treeleaf)
length(treeotu)
# 取交集
intersect_res <- intersect(treeleaf,treeotu)
length(intersect_res)

#取并集
union_res <- union(treeleaf,treeotu)
length(union_res)

# 取差集
diff1 <- setdiff(treeotu,treeleaf)
length(diff1)
diff1

# 判断相同
equals_res <- setequal(treeotu,treeleaf)
equals_res

 

你可能感兴趣的:(我的学习历程,Data,Mining&Analysis)