生信小组DAY5-JANE

数据类型

先上思维导图
生信小组DAY5-JANE_第1张图片
思维导图

向量(vector):重要
矩阵(Matrix)
数组(Array)
数据框(Data frame):重要
List

一、向量

生信小组DAY5-JANE_第2张图片
向量
  • 1.标量和向量的区分

元素:可为数字或字符串
数字:1,2,3
字符串:s=“abcdefghij”,则s[1]=“a”,s[10]="j"
标量:一个元素组成的变量
向量:多个元素组成的变量
赋值:赋予这个变量一个数值(其实也不一定是数值,还可以是字符串/数据框等等)

生信小组DAY5-JANE_第3张图片
赋值

  • 2.从向量中提取元素

(1)根据元素位置
(2)根据值的大小的

  • 根据元素位置

    下图应该说是元素,也有可能不是单纯的数值
    生信小组DAY5-JANE_第4张图片
    提取
  • 根据数值大小
    a[a %in% c(1,2,3)] :存在于向量c(1,2,5)中的元素


    生信小组DAY5-JANE_第5张图片
    2

二、数据框

1、读取本地数据

**read.table(file = "huahua.txt",sep = "\t",header =T) **:读取文件,分隔符为Tab,有表头
a<-read.table(file = "huahua.txt",sep = "\t",header =T) :把这个数据框赋给一个变量a

开始时一直报错
生信小组DAY5-JANE_第6张图片
报错

结果是因为这个软件每次开启时要重置工作目录
生信小组DAY5-JANE_第7张图片
重置

终于好了,还是出错了
生信小组DAY5-JANE_第8张图片
读取数据

把数据框赋给变量a
生信小组DAY5-JANE_第9张图片
数据框赋值

2、设置行名和列名

  • 打开本地目录
  • colnames(X) :查看列名
  • rownames(X) :查看行名,默认值的行名就是行号,1.2.3.4...
  • colnames(X)[1]<-"bioplanet":有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改
  • X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1):最后row.names的意思是修改第一列为行名
生信小组DAY5-JANE_第10张图片
打开目录

生信小组DAY5-JANE_第11张图片
查看行列名

生信小组DAY5-JANE_第12张图片
修改表头

生信小组DAY5-JANE_第13张图片
第一列变为行名

3、数据框的导出

导出
生信小组DAY5-JANE_第14张图片
更改后

4、变量的保存与重新加载

这次没有处理完的数据下次想接着用怎么办?
学会保存和重新加载。保存的格式是RData。

  • save.image(file="bioinfoplanet.RData"):保存当前所有变量
  • save(frame1,file="frame1.RData"):保存其中一个变量
  • load("frame1.RData"):再次使用RData时的加载命令

保存当前所有变量
生信小组DAY5-JANE_第15张图片
保存所有变量

保存其中一个变量
生信小组DAY5-JANE_第16张图片
单个变量保存

生信小组DAY5-JANE_第17张图片
更改后

再次使用RData时的加载命令
再次加载

5、提取元素

生信小组DAY5-JANE_第18张图片
提取元素

6、直接使用数据框中的变量

提取某两列作散点图:


image.png

其中case和value为某列的名称

生信小组DAY5-JANE_第19张图片
散点图

你可能感兴趣的:(生信小组DAY5-JANE)