R语言中的字符串处理函数

简单字符串处理函数

尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串同样极为重要。从医疗研究数据里的出生日期到文本挖掘的应用,字符串数据在R程序中使用的频率非常高。R语言提供了很多字符串操作函数,本文仅简要以下几种常用的字符串函数。

字符串分割函数:strsplit( )

字符串连接函数:paste( )

计算字符串长度:nchar( )

字符串截取函数:substr( )及substring( )

字符串替换函数:chartr( )

大小写转换函数:toupper( )、tolower( )及casefold( )

字符串分割函数:strsplit( )
strsplit( )函数用于字符串分割,其中split 是分割参数。所得结果以默认以list形式展示。

字符串连接函数:paste( )
主要参数:paste(…, sep = " ", collapse = NULL)

paste( )函数用于字符串连接,其中sep 负责两组字符串间的连接;collapse 负责一组字符串内部的连接。

计算字符串长度:nchar( )
nchar( )返回字符串的长度。

字符串截取函数:substr( );substring( )
substr( )函数和substring( )函数是截取字符串最常用的函数,两个函数功能方面是一样的,只是其中参数设置不同。

substr( )函数:必须设置参数start和stop,如果缺少将出错。

substring( )函数:可以只设置first参数,last参数若不设置,则默认为1000000L,通常是指字符串的最大长度。

详情见:
https://www.cnblogs.com/xuancaoyy/p/5310172.html

高级字符串处理函数gsub()

gsub()可以用于字段的删减、增补、替换和切割,可以处理一个字段也可以处理由字段组成的向量。

具体的使用方法为:gsub(“目标字符”, “替换字符”, 对象)

在gsub函数中,任何字段处理都由将“替换字符”替换到“目标字符”这一流程中实现,令替换字符为’’’'可实现删除,令替换字符为"目标字符+增补内容"可实现增补,替换和切割也是使用类似的操作。
————————————————
版权声明:本文为CSDN博主「lztttao」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/lztttao/article/details/82086346

你可能感兴趣的:(R)