生信必备技巧之R语言基础教程--字符串处理进阶

  R语言是数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。R语言是解释运行的语言(与C语言的编译运行不同),它的执行速度比C语言慢得多,不利于优化。但它在语法层面提供了更加丰富的数据结构操作并且能够十分方便地输出文字和图形信息,所以它广泛应用于数学尤其是统计学领域。这也是大多数生信工作者选择R语言的原因。

数据类型和数据结构

  • 字符串类型数据的常用进阶操作:

    # 大小写转换
    toupper("Runoob") # 大写
    tolower("Runoob") # 小写
    
    # 统计字符串长度
    nchar("中文", type="bytes") # 统计字节长度
    nchar("中文", type="char") # 总计字符数量
    
    # 截取字符串:substring()函数
    substring("123456789", 1, 5) # 截取字符串,从 1 到 5
    substring("1234567890", 5) # 截取字符串,从 5 到结束,默认从第一个开始;
    
    # 将字符串转换为数字
    as.numeric("12") 
    
    # 将数字转换为字符串
    as.character(12.34) 
    
    # 分隔符拆分字符串--非常重要;以后会经常用到;
    strsplit("2019;10;1", ";") 
    
    # 替换字符串
    gsub("/", "-", "2019/10/1")
    
    # R 支持 perl 语言格式的正则表达式:关于正则表达式,如果大家需要的话,我后面会单独出一期视频;
    gsub("[[:alpha:]]+", "$", "Two words")
    

    往期文章

  1. 生信必备技巧之R语言基础教程--R包安装和载入
  2. 生信必备技巧之R语言基础教程--向量基础和进阶
  3. 生信必备技巧之R语言基础教程--逻辑值用途

你可能感兴趣的:(生信必备技巧之R语言基础教程--字符串处理进阶)