首先,关于R的基本认识以及基础知识点请看:https://blog.csdn.net/jack237/article/details/8210598,该链接的内容非常全面。
关于周结,其精髓在于第一天晓娟姐的课堂内容。其次,就是做题中涉及到的一些小的问题在前面的总结中也有提到,这里不在赘述。
1、关于Warning
Warning为警告信息
Warning≠Erro #当出现Warning是提醒我们可能有问题,并非绝对,只要input正确,output必然有.比如在Rstudio中,初始值个数>程序默认的循环数,会出现Warning
2、关于路径
绝对路径:从根目录开始直到文件位置
相对路径:相对于程序当前所在目录到文件位置
Eg:程序运行在C:/user/dell下,假设有一个文件test.txt
绝对路径:C:/user/dell/test.txt
相对路径:./test.txt
./ :代表文件所在的目录(可以省略不写)
../ :代表文件所在的父级目录
Eg:
./当前所在目录
setwd("./")
getwd()
../父级所在的目录
①setwd("..")
getwd()
②setwd("../") #两者的作用相同。
getwd()
返回上一级目录
③setwd("E:/生信技能树/Qi_study(1 month)/7.2学习/3天培训_R")
getwd()
3、关于几个快捷键
Alt和- 一起使用为“<-”
Tab 自动补全
Ctrl和L 清空consule
魔幻操作:rm(list=ls())
在网页中搜索:Ctrl+F
4、关于RStudio的使用
5、函数
①rm():可以单独清空一个变量,也可以一键清空全部变量。
②rep():生成重复内容的向量
③paste:有默认的分隔符(空格)
④paste0:默认无分隔符
[PS]向量中,元素个数不定时,清楚循环补齐的概念
⑤apply()函数
⑥定义功能函数:function.name<-function{ }
这样的函数在代码中还是很常见的,要掌握哦~ 具体情况具体分析
6、数据
一、数据类型:
A、数值型
B、字符型
C、逻辑型
二、数据结构
A、向量:一维
B、矩阵:二维;长短一致
C、数组:多维
D、数据框:一行或一列为一种数据类型,但是要整齐
F、列表:行与列可以不整齐;列表包含多个数据结构
三、数据的变量名称:
A、组成:数字、字符、下划线 (R的名字尽量避免中文和空格)
B、变量名大小写敏感
C、便于记忆、有意义
7、索引
①必须清楚索引的三种方法:
postion
name
logical [TRUE/FALSE]
[PS]在data.frame中有一种使用符号索引
②data.frame的索引
ID <- c(1,2,3,4,5)
Name <- c("Liming","Xiaofang","Xiaohong","Lihua","Shanshan")
Gender <- c("M","F","M","M","F")
Birthday <- c("1999-10","2000-1","1998-6","2000-6","1999-6")
Score <- c(99,100,69,90,99)
Grade <- c(1,2,2,1,1)
V3 <- data.frame(ID,Name,Gender,Birthday,Score,Grade)
V3
比如使用位置等方法就不说了;也可以使用列的Index或者列名可以选取要访问的哪些列。比如要ID和Name,那么代码为:
idnames <- Name[1:2]
③List
值得注意的是,list的索引要用两个中括号;在list中第一个[]索引,第二个[]代表他是第几个数据结构(可能为向量、字符串、矩阵等)
Eg:
V4 <- list(V4_list=Name <- c("Liming","Xiaofang","Xiaohong","Lihua","Shanshan"),Gender <- c("M","F","M","M"),score <- matrix(1:12,3,4))
>V4
$V4_list
[1] "Liming" "Xiaofang" "Xiaohong" "Lihua" "Shanshan"
[[2]]
[1] "M" "F" "M" "M"
[[3]]
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
>V4[[3]]
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
> V4[[3]][,1]
[1] 1 2 3
要学会根据根据它显示的内容作出适当的索引,注意查看变化的情况哦。
用名字进行索引
V4$V4_list
④对象中取子集:@
8、运算
取整:%/%
取余:%%
9、矩阵
索引:和向量一样名字 位置 逻辑值
无论是向量还是矩阵取索引时,要注意如果是取一个值,直接用[]即可,如果索引出多个值,需要借助[c()]
Eg:
b<-seq(2,11,1)
b
b[1]
b[c(1,2,4)]
一定要注意如果我们输入的是一个函数,那么在<-的左侧为input的函数,在<-的右侧为输出的函数
10、读入文件
①常见:CSV、table 一套(还有其他的格式,有很多)读入文件:
d<-read.csv('xxx.txt.gz',comment.char = '!',sep='\t',row.names = 1)
其中comment.char = '!'
代表!注释信息;row.names = 1
代表将第一列作为行名
f<-read.table('xxx.txt.gz', comment.char = '!',header=T,row.names = 1)
读出文件:[2种]
write.table(x = f,file = 'xxx.txt')
write.csv(x = f,file = 'xxx.csv')
②关于在外部读取文件推荐的软件:runotepad++ 右键扩充
EXCEL
TXT
③读入部分 read 都是data.frame
④Rdata的需求
A、存成Rdata格式:
save(f,file = 'xxx.Rdata')
B、常见的如下:
⑤加载load
⑥图标显示.Rdata
11、Packages
①R包来源:
A、CRAN:install.packages()
B、Bioconductor:BiocManager::install() C、Github:
devools::install_github()```
②镜像:
当不清楚R包来源时,可以进行谷歌搜索该包,而后在进行安装。 ##注意镜像
镜像推荐:
A、
②
示范代码如下:
options()$repos
options()$BioC_mirror
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
③R包内容:
代码+函数+说明文档+数据集等
[PS]不要庸俗的认为R包只是R包,它的功能很强大的!
安装方法:[对应方式有三种方法]
①.CRAN
Install.packages('')
②.Biocductor
install.packages('BiocManger')
BiocManager::install()
③.github
install.packages('devtools')
devtools::install()
12、作图
之前在学代码的时候 忘记了
aes
的功能,这里的主要作用是映射
之前讲的脚本plot不是部分清楚,画布等等代码需要仔细仔细再仔细的解决一下!
13、实战部分
进入RStudio进行操作。