[R字符串] 字符串长度、分割、拼接、截取、替代、匹配和大小写替换

获取字符串长度:nchar()
字符串分割:strsplit()
字符串拼接:paste()
字符串截取:substr()
字符串替代:gsub() chartr() sub()
字符串匹配:grep()
大小写替换:toupper() tolower()

1. 获取字符串长度

nchar()能够获取字符串的长度,它也支持字符串向量操作。注意它和length()的结果是有区别的。

fruit <- 'apple orange grape banana'
nchar(fruit)
length(fruit)   #元素个数为1
[1] 1

2. 字符串分割

strsplit()负责将字符串按照某种分割形式将其进行划分,需要设定分隔符。下面我们是用空格来作为
分隔符将fruit分为四个元素。

> strsplit(fruit,split=' ')
[[1]]
[1] "apple"  "orange" "grape"  "banana"    #list结构

> fruitvec <- unlist(strsplit(fruit,split=' '))
> fruitvec
[1] "apple"  "orange" "grape"  "banana"   #转化为向量

3. 字符串拼接

paste()负责将若干个字符串相连结,返回成单独的字符串。其优点在于,就算有的处理对象不是字符
型也能自动转为字符型。另一个相似的函数paste0是设置无需分隔符的拼接。

paste(fruitvec,collapse=',')    #逗号作为分隔符
[1] "apple,orange,grape,banana"

4. 字符串截取

substr()能对给定的字符串对象取出子集,其参数是子集所处的起始和终止位置。

substr(fruit, 1,5)
[1] "apple"

5. 字符串替代

chartr是字母替换,不是字符串替换。
gsub()负责搜索字符串的特定表达式,并用新的内容加以替代。
sub()函数类似gsub(),但只替代第一个。

> chartr('world','bear',a)   #字母替换
Error in chartr("world", "bear", a) : 'old' is longer than 'new' #字符长度要求一致
> chartr('world','beara',a)
[1] "herre beara"
> x<-'i love you'
> chartr('you','she',x)   #实际是字母替换,不是字符串替换
[1] "i lhve she"

> a<-'i love you, do you love me ?'
> sub('you','she', a)            #只替换第一个参数you
[1] "i love she, do you love me ?"

> gsub('you','she', a)           #可以替换全部参数 
[1] "i love she, do she love me ?"  
gsub('apple','strawberry',fruit)
[1] "strawberry orange grape banana"

6. 字符串匹配

grep()负责搜索给定字符串对象中特定表达式 ,并返回其位置索引。grepl()函数与之类似,但其后面
的”l”则意味着返回的将是逻辑值。

grep('grape',fruitvec)   #返回grape在fruitvec中的位置
[1] 3 

7. 大小写替换

> a <- "Hello World"
> toupper(a)    #全部替换为大写
[1] "HELLO WORLD"
> tolower(a)    #全部替换为小写
[1] "hello world"

你可能感兴趣的:(R)