获取字符串长度:nchar()
字符串分割:strsplit()
字符串拼接:paste()
字符串截取:substr()
字符串替代:gsub() chartr() sub()
字符串匹配:grep()
大小写替换:toupper() tolower()
nchar()能够获取字符串的长度,它也支持字符串向量操作。注意它和length()的结果是有区别的。
fruit <- 'apple orange grape banana'
nchar(fruit)
length(fruit) #元素个数为1
[1] 1
strsplit()负责将字符串按照某种分割形式将其进行划分,需要设定分隔符。下面我们是用空格来作为
分隔符将fruit分为四个元素。
> strsplit(fruit,split=' ')
[[1]]
[1] "apple" "orange" "grape" "banana" #list结构
> fruitvec <- unlist(strsplit(fruit,split=' '))
> fruitvec
[1] "apple" "orange" "grape" "banana" #转化为向量
paste()负责将若干个字符串相连结,返回成单独的字符串。其优点在于,就算有的处理对象不是字符
型也能自动转为字符型。另一个相似的函数paste0是设置无需分隔符的拼接。
paste(fruitvec,collapse=',') #逗号作为分隔符
[1] "apple,orange,grape,banana"
substr()能对给定的字符串对象取出子集,其参数是子集所处的起始和终止位置。
substr(fruit, 1,5)
[1] "apple"
chartr是字母替换,不是字符串替换。
gsub()负责搜索字符串的特定表达式,并用新的内容加以替代。
sub()函数类似gsub(),但只替代第一个。
> chartr('world','bear',a) #字母替换
Error in chartr("world", "bear", a) : 'old' is longer than 'new' #字符长度要求一致
> chartr('world','beara',a)
[1] "herre beara"
> x<-'i love you'
> chartr('you','she',x) #实际是字母替换,不是字符串替换
[1] "i lhve she"
> a<-'i love you, do you love me ?'
> sub('you','she', a) #只替换第一个参数you
[1] "i love she, do you love me ?"
> gsub('you','she', a) #可以替换全部参数
[1] "i love she, do she love me ?"
gsub('apple','strawberry',fruit)
[1] "strawberry orange grape banana"
grep()负责搜索给定字符串对象中特定表达式 ,并返回其位置索引。grepl()函数与之类似,但其后面
的”l”则意味着返回的将是逻辑值。
grep('grape',fruitvec) #返回grape在fruitvec中的位置
[1] 3
> a <- "Hello World"
> toupper(a) #全部替换为大写
[1] "HELLO WORLD"
> tolower(a) #全部替换为小写
[1] "hello world"