2-gsub()函数——替换字符工具

要想批量替换一些字符串还需要在excel完成吗？Nope,代码也可哦，今天又get到了一个新的知识点，认识了一个新的函数了，一起来学习一下吧~

image

gsub()可以用于字段的删减、增补、替换和切割，可以处理一个字段也可以处理由字段组成的向量。

具体的使用方法为：gsub("目标字符", "替换字符", 对象)

>text1 <- "ABcdEfgh . ljkl MNNM"
>gsub("Efg","RRR",text1)  # #将Efg改为RRR，区分大小写
[1] "ABcdRRRh . ljkl MNNM"

任何符号，包括空格、Tab和换行都是可以识别的

> gsub(" l","q",text1)   # #可识别空格
[1] "ABcdEfgh .qjkl MNNM"

同时字符可以识别多个，进行批量置换

> gsub("M","O",text1)
[1] "ABcdEfgh . ljkl ONNO"

除此之外，gsub还有其他批量操作的方法

> gsub("^.* ", "a", text1) #选择从开头到第一个空格（注意字符"^.* "后引号前有一个空格）替换为a
[1] "aMNNM"
> gsub("^.*l(j).*$","\\1",text1) ##只保留一个j
[1] "j"
> gsub(" .*$","b",text1)  # #第一个空格直达结尾替换成b
[1] "ABcdEfghb"
> gsub("\\.","\\+",text1)  # #句号.和加号+是特殊的，要添加\\来识别
[1] "ABcdEfgh + ljkl MNNM"

sub（）提供一个替换值，可以是字符串或函数，和一个要被处理的字符串。

那么sub()和gsub()函数有什么区别呢？

> text <- c("we are the world", "we are the children")
> sub("w", "W", text)  #第一个句子有两个w，但sub()只识别第一个相应的字符
[1] "We are the world"    "We are the children"
> sub("W","w",text)
[1] "we are the world"    "we are the children"
> gsub("W","w",text) #gsub()识别全部对应的字符
[1] "we are the world"    "we are the children"
> gsub("w","W",text) 
[1] "We are the World"    "We are the children"

> sub(" ", "", "abc def ghi")
[1] "abcdef ghi"
> gsub(" ", "", "abc def ghi")
[1] "abcdefghi"

从上面的输出结果可以看出，sub（）和gsub（）的区别在于，前者只替换第一次匹配的字符串，而后者会替换掉所有匹配的字符串。
注意：gsub()是对向量里面的每个元素进行搜素，如果发现元素里面有多个位置匹配了模式，则全部进行替换，而grep()也是对向量里每个元素进行搜索，但它仅仅知道元素是否匹配了模式（并返回该元素在向量中的下标），但具体元素中匹配了多少次却无法知道。

参考来源：
https://www.cnblogs.com/nkwy2012/p/8625063.html
https://blog.csdn.net/lztttao/article/details/82086346

2-gsub()函数——替换字符工具

你可能感兴趣的:(2-gsub()函数——替换字符工具)