2-gsub()函数——替换字符工具

要想批量替换一些字符串还需要在excel完成吗?Nope,代码也可哦,今天又get到了一个新的知识点,认识了一个新的函数了,一起来学习一下吧~


image

gsub()可以用于字段的删减、增补、替换和切割,可以处理一个字段也可以处理由字段组成的向量。

具体的使用方法为:gsub("目标字符", "替换字符", 对象)

>text1 <- "ABcdEfgh . ljkl MNNM"
>gsub("Efg","RRR",text1)  # #将Efg改为RRR,区分大小写
[1] "ABcdRRRh . ljkl MNNM" 
  • 任何符号,包括空格、Tab和换行都是可以识别的
> gsub(" l","q",text1)   # #可识别空格
[1] "ABcdEfgh .qjkl MNNM"
  • 同时字符可以识别多个,进行批量置换
> gsub("M","O",text1)
[1] "ABcdEfgh . ljkl ONNO"
  • 除此之外,gsub还有其他批量操作的方法
> gsub("^.* ", "a", text1) #选择从开头到第一个空格(注意字符"^.* "后引号前有一个空格)替换为a
[1] "aMNNM"
> gsub("^.*l(j).*$","\\1",text1) ##只保留一个j
[1] "j"
> gsub(" .*$","b",text1)  # #第一个空格直达结尾替换成b
[1] "ABcdEfghb"
> gsub("\\.","\\+",text1)  # #句号.和加号+是特殊的,要添加\\来识别
[1] "ABcdEfgh + ljkl MNNM"

sub()提供一个替换值,可以是字符串或函数,和一个要被处理的字符串。

那么sub()和gsub()函数有什么区别呢?

> text <- c("we are the world", "we are the children")
> sub("w", "W", text)  #第一个句子有两个w,但sub()只识别第一个相应的字符
[1] "We are the world"    "We are the children"
> sub("W","w",text)
[1] "we are the world"    "we are the children"
> gsub("W","w",text) #gsub()识别全部对应的字符
[1] "we are the world"    "we are the children"
> gsub("w","W",text) 
[1] "We are the World"    "We are the children"
> sub(" ", "", "abc def ghi")
[1] "abcdef ghi"
> gsub(" ", "", "abc def ghi")
[1] "abcdefghi"
  • 从上面的输出结果可以看出,sub()和gsub()的区别在于,前者只替换第一次匹配的字符串,而后者会替换掉所有匹配的字符串。
  • 注意:gsub()是对向量里面的每个元素进行搜素,如果发现元素里面有多个位置匹配了模式,则全部进行替换,而grep()也是对向量里每个元素进行搜索,但它仅仅知道元素是否匹配了模式(并返回该元素在向量中的下标),但具体元素中匹配了多少次却无法知道。

参考来源:
https://www.cnblogs.com/nkwy2012/p/8625063.html
https://blog.csdn.net/lztttao/article/details/82086346

你可能感兴趣的:(2-gsub()函数——替换字符工具)