R语言之数据结构

RStudio清空控制台快捷键:cltr+l


R语言的数据结构主要包括:向量c(),矩阵matrix(),数组array(),数据框data.frame()、因子factor()、列表list()

一、向量:c(value),一维,通过索引遍历,索引 的起始值为1(不同于python的0)

1、向量的定义

2、向量的单个元素读取

3、向量的元素切片

4、向量的多个非连续元素读取(比较独特)

向量的基本操作

二、矩阵matrix(value,nrow,ncol,byrow,dimname):二维,包括行列

定义:

参数分别是:矩阵中将要填充的元素,nrow行数,ncol列数,dimnames行名和列名(注意dimnames中包含了可选的、以字符型向量c表示的行名和列名)

定义

遍历:通过索引遍历

下图框框中分别对应:获取第二行,获取第3列,获取第二行第三列的元素,获取第4行的第2,4,5的元素(R中获取不连续的元素都是通过向量c)。

索引遍历

三、数组:array(value, dim),与矩阵类似,只不过可以不只是二维

定义:参数1为数值,参数2指定array维度(shape)

array定义

索引:

1,2、获取指定位置的单个数值

3、获取指定维度的几个不连续数值

4、获取某整个维度的值,即仅仅指定该维度,其他维度,,

array索引取值

四、数据框:data.frame(col1,col2,...),类似于python中的pandas.DataFrame()

定义:直接将向量作为参数,向量名就是列名

数据框定义

索引取值:

1、获取指定列的值

使用索引对列切片
通过索引向量指定列,获取不连续列
使用列名获取列
使用列名向量,获取不连续列

2、获取指定行或单个值:通过索引直接使用[] + ,

通过指定行索引,获取第一行

3、选取一个给定数据框中的某个特定变量,$,attach(),with()/within()(within允许你修改数据框)

$与attach()使用

    其中,如果存在多个c_age同名变量,attach()会有局限。

with()使用

    其中,函数with()的局限性在于,赋值仅在此函数的括号内生效,定义外部变量需使用<<-特殊赋值符。

对frame进行修改:

    1、增加新列

    2、获取列名,并更改列名

五、因子:factor(vector,ordered,level),以一个整数向量的形式存储类别值,整数的取值范围是[1... k ](其中k 是名义

型变量中唯一值的个数),同时一个由字符串(原始值)组成的内部向量将映射到这些整数上。

    参数:vector为一个类别(名义型)变量和有序类别向量,

                level:覆盖整数映射的默认排序,默认顺序为根据字母排序

因子factor定义

六、列表:list():以上介绍的所有数据类型都可以存在一个list中

定义:

list定义

list的索引取值:

获取list里面第三个元素的正确方法
跟python有着比较大的区别
获取list中第三个元素中的第三个元素(下面方法)

处理对象常用的一些函数:

    1、获取对象中元素数:length(object)。补充:类似于Python中的len()

    2、获取对象维度:dim(object)。补充:类似于python中的object.shape

    3、显示对象的内部结构:str()。注意:不同于python中将其他数据类型转化为string

    4、缺失值情况:1)判断是否存在缺失值is.na(object);2)na.omit(object)可以删除所有含有缺

失数据的行;3)多数的数值函数都拥有一个na.rm=TRUE选项,可以在计算之前移除缺失值并使用剩余

值进行计算。

    5、日期处理:Sys.Date():获取当时日期;date();获取当时时间和日期;format(date,format):对日期指定格式输出

你可能感兴趣的:(R语言之数据结构)