R数据框实用操作方法总结

一、开场

R语言中的数据框data.frame被定义为由不同变量值（列）和不同观察值（行）所组成的二维数据结构，每一列存储的数据类型必须相同，不同数据列的数据类型可以相同，也可以不同，但是每列的行数（长度）必须相同。其实R数据框就是标准的Excel表格数据，对，你可以这样理解……

数据框是R语言进行数据处理和分析常用的数据结构类型，这也为什么R的内置数据集有占46%的是数据框。通常用R基础函数read.table()读取的excel表格数据，在R中存储为数据框data.frame或者列表list。

数据框的特征很有意思，关于数据框实用方法有很多，都是为解决现实实际问题而发展出来的方法，关于R数据框的知识和使用方法书上的案例比较呆板老旧，网上的一般资源又比较零散和随意，往往你查到的不是你想要的。

我现在集中精力帮助大家整理出一个实用的、有效的、可以当速查救命手册的帮助文档来！接下来一系列简书日更将主要对数据框进行总结和分享，希望能帮到大家！对我也是一次比较重要的R知识的整理、归纳、总结和提升。

当你参透R数据框的时候，其实你的R语言已经达到一定的水平了……

一、开场

1.数据框的定义

2.我的初衷

二、数据框实用操作方法

1.创建数据框的几种方法

2.数据框的大小和维度查看

3.数据框的行和列查看及操作

4.数据框的元素操作问题

5.数据框的排序问题

6.数据框的分离与合并问题

7.数据框的转置问题

8.数据框的删除、增加和替换问题

二、数据框实用操作方法

### 1.创建数据框的几种方法

#### 1.1 data.frame()创建

df <- data.frame(编号 = 1:10, 姓名 = c("王明", "李磊", "张乐", "刘能", "黄粲", "赵月", "朱忻", "陈振", "武琳", "孙晔"), 性别 = c("男", "男", "男", "男", "女", "女", "女", "男", "女", "女"), 数学成绩 = c("90", "88", "80", "70", "95", "91", "90", "81", "80", "76"), 语文成绩 = c("91", "75", "83", "89", "90", "91", "88", "77", "85", "90"))

#@ 查看df内容

# 编号姓名性别数学成绩语文成绩

# 1 1 王明男 90 91

# 2 2 李磊男 88 75

# 3 3 张乐男 80 83

# 4 4 刘能男 70 89

# 5 5 黄粲女 95 90

# 6 6 赵月女 91 91

# 7 7 朱忻女 90 88

# 8 8 陈振男 81 77

# 9 9 武琳女 80 85

# 10 10 孙晔女 76 90

class(df)

# [1] "data.frame"

#### 1.2 as.data.frame()强制转换其他数据结构为数据框

#@ 转换矩阵matrix为数据框data.frame：as.data.frame(matrix)

data(volcano) # 载入内置数据集volcano

class(volcano)

# [1] "matrix"

df1 <- as.data.frame(volcano)

class(df1)

# [1] "data.frame"

#@ 转换列表list为数据框data.frame：as.data.frame(list)

library(datasets)

data(state)

class(state.center) # 查看state.center的数据结构类型

# [1] "list"

df2 <- as.data.frame(state.center)

head(df2)

# x y

# 1 -86.7509 32.5901

# 2 -127.2500 49.2500

# 3 -111.6250 34.2192

# 4 -92.2992 34.7336

# 5 -119.7730 36.5341

# 6 -105.5130 38.6777

class(df2)

# [1] "data.frame"

#@ 转换数组array为数据框data.frame

data(iris3) # 载入内置数据集

class(iris3)

# [1] "array"

head(iris3)

# [1] 5.1 4.9 4.7 4.6 5.0 5.4

df3 <- as.data.frame(iris3)

class(df3)

# [1] "data.frame"

head(df3)

# Sepal L..Setosa Sepal W..Setosa Petal L..Setosa

# 1 5.1 3.5 1.4

# 2 4.9 3.0 1.4

# 3 4.7 3.2 1.3

# 4 4.6 3.1 1.5

# 5 5.0 3.6 1.4

# 6 5.4 3.9 1.7

# Petal W..Setosa Sepal L..Versicolor Sepal W..Versicolor

# 1 0.2 7.0 3.2

# 2 0.2 6.4 3.2

# 3 0.2 6.9 3.1

# 4 0.2 5.5 2.3

# 5 0.2 6.5 2.8

# 6 0.4 5.7 2.8

# Petal L..Versicolor Petal W..Versicolor Sepal L..Virginica

# 1 4.7 1.4 6.3

# 2 4.5 1.5 5.8

# 3 4.9 1.5 7.1

# 4 4.0 1.3 6.3

# 5 4.6 1.5 6.5

# 6 4.5 1.3 7.6

# Sepal W..Virginica Petal L..Virginica Petal W..Virginica

# 1 3.3 6.0 2.5

# 2 2.7 5.1 1.9

# 3 3.0 5.9 2.1

# 4 2.9 5.6 1.8

# 5 3.0 5.8 2.2

# 6 3.0 6.6 2.1

#@ 以上转换在条件满足的时候是可以相互强制转换的，例如：可以矩阵到数据框，也可以数据框到矩阵。

#### 1.3 R函数读取数据文件，存为数据框对象

#@ 为了大家测试方便，我们先用R内置函数write.csv保存R一个内置数据框数据集到本地：mtcars，然后再读取这个表格文件：mtcars.csv，用下面三种方法读取。这个文件默认保存到你的工作目录中，查看你的工作目录的方法是getwd()，也可以直接用函数dir()查看，如果你设置了自己的工作路径，那这个文件就在你的当前工作路径内

data("mtcars")

dim(mtcars)

# [1] 32 11

class(mtcars)

# [1] "data.frame"

write.csv(mtcars, file = "mtcars.csv")

dir()

# [1] "mtcars.csv"

# [2] "R数据框实用操作方法大总结.docx"

# [3] "简书日更挑战_20191222_Sunday.R"

#@ 我的已经保存到本地电脑文件夹中了（当前工作目录）

getwd()

# [1] "E:/学习空间/博客/简书/简书日更挑战/2019年/12月/20191222_Sunday"

#@ 现在我们用函数读取数据文件

#@ read.table()，R基础函数

df4 <- read.table("mtcars.csv", sep = ",", header = T)

dim(df4)

# [1] 32 11

class(df4)

# [1] "data.frame"

#@ read.xlsx()，R扩增包openxlsx函数，使用这个函数之前你需要安装这个包：openxlsx，如果已经安装就OK，没有的话执行安装代码：install.packages("openxlsx")，安装成功之后就可以往下走了，然后手动操作一下，用Excel软件打开我们刚才保存的mtcars.csv文件，然后另存为xlsx文件，文件格式变为.xlsx，文件名不变，还是mtcars，然后关闭文件，执行dir()

dir()

# [1] "mtcars.csv"

# [2] "mtcars.xlsx"

# [3] "R数据框实用操作方法大总结.docx"

# [4] "简书日更挑战_20191222_Sunday.R"

#@ 我们看到多出一个mtcars.xlsx文件

df5 <- openxlsx::read.xlsx("mtcars.xlsx", sheet = 1, startRow = 1, colNames = T, rowNames = T, detectDates = FALSE)

dim(df5)

# [1] 32 11

class(df5)

# [1] "data.frame"

#@ import()，R扩增包rio函数import()，同样这个是扩增包，使用前需要安装rio包，安装完成之后就可以继续往下走了

df6 <- rio::import("mtcars.csv", sep = ",")

df7 <- rio::import("mtcars.xlsx")

#@ 神包rio就这个牛，这只是小试牛刀，它可以支持32种格式文件的读和写

#@ 使用SQL查询Data Frame对象或者数据库文件，sqldf包，同样使用前需要安装它

library(sqldf)

# 载入需要的程辑包：gsubfn

# 载入需要的程辑包：proto

# 载入需要的程辑包：RSQLite

library(chron) # 同样使用前需要安装

DF <- read.table(textConnection(Lines), skip = 1, as.is = TRUE, col.names = c("Id", "Date", "Time", "Quality", "Lat", "Long"))

# Id Date Time Quality Lat Long

# 1 STM05-1 28/02/2005 17:35 Good -35.562 177.158

# 2 STM05-1 28/02/2005 19:44 Good -35.487 177.129

# 3 STM05-1 28/02/2005 23:01 Unknown -35.399 177.064

# 4 STM05-1 01/03/2005 07:28 Unknown -34.978 177.268

# 5 STM05-1 01/03/2005 18:06 Poor -34.799 177.027

# 6 STM05-1 01/03/2005 18:47 Poor -34.850 177.059

# 7 STM05-2 28/02/2005 12:49 Good -35.928 177.328

# 8 STM05-2 28/02/2005 21:23 Poor -35.926 177.314

dim(DF)

# [1] 8 6

class(DF)

# [1] "data.frame"

str(DF)

# 'data.frame': 8 obs. of 6 variables:

# $ Id : chr "STM05-1" "STM05-1" "STM05-1" "STM05-1" ...

# $ Date : chr "28/02/2005" "28/02/2005" "28/02/2005" "01/03/2005" ...

# $ Time : chr "17:35" "19:44" "23:01" "07:28" ...

# $ Quality: chr "Good" "Good" "Unknown" "Unknown" ...

# $ Lat : num -35.6 -35.5 -35.4 -35 -34.8 ...

# $ Long : num 177 177 177 177 177 ...

#@ 用transform()对数据框对象进行操作，为原数据框添加新的列，改变原变量列的值，通过赋值NULL删除列变量

DF2 <- transform(DF, Date = chron(Date, format = "d/m/y"), Time = times(paste(Time, "00", sep = ":")), Quality = factor(Quality, levels = c("Good", "Poor", "Unknown")))

dim(DF2)

# [1] 8 6

class(DF2)

# [1] "data.frame"

#@ 用sqldf函数获取R内置数据集

data("mtcars")

DF3 <-sqldf("select am,hp,mpg from mtcars where cyl='4' and wt<3")

DF3

# am hp mpg

# 1 1 93 22.8

# 2 1 66 32.4

# 3 1 52 30.4

# 4 1 65 33.9

# 5 0 97 21.5

# 6 1 66 27.3

# 7 1 91 26.0

# 8 1 113 30.4

# 9 1 109 21.4

class(DF3)

# [1] "data.frame"

#@ R就是这么强大！

### 2.数据框的大小及维度查看

#@ dim()查看数据维度

dim(df) # 我们利用函数data.frame手动创建了一个10行、5列的数据框，即10个观察值："1" "2" "3" "4" "5" "6" "7" "8" "9" "10"，5个变量值："编号" "姓名" "性别" "数学成绩" "语文成绩"

# [1] 10 5

#@ attributes() 获取对象属性列表，记住不只是数据集的，也可以是R中的一切对象，对于R来说一切都是对象，正如对于Linux一切都是文件

attributes(df)

# $names

# [1] "编号" "姓名" "性别" "数学成绩" "语文成绩"

# $class

# [1] "data.frame"

# $row.names

# [1] 1 2 3 4 5 6 7 8 9 10

#@ str() 显示任意R对象的结构

str(df)

# 'data.frame': 10 obs. of 5 variables:

# $ 编号 : int 1 2 3 4 5 6 7 8 9 10

# $ 姓名 : Factor w/ 10 levels "陈振","黄粲",..: 6 3 8 4 2 9 10 1 7 5

# $ 性别 : Factor w/ 2 levels "男","女": 1 1 1 1 2 2 2 1 2 2

# $ 数学成绩: Factor w/ 8 levels "70","76","80",..: 6 5 3 1 8 7 6 4 3 2

# $ 语文成绩: Factor w/ 8 levels "75","77","83",..: 8 1 3 6 7 8 5 2 4 7

### 3.数据框的行、列查看及操作

#### 3.1 数据框行查看及操作

# 编号姓名性别数学成绩语文成绩

# 1 1 王明男 90 91

# 2 2 李磊男 88 75

# 3 3 张乐男 80 83

# 4 4 刘能男 70 89

# 5 5 黄粲女 95 90

# 6 6 赵月女 91 91

# 7 7 朱忻女 90 88

# 8 8 陈振男 81 77

# 9 9 武琳女 80 85

# 10 10 孙晔女 76 90

rownames(df) # 查看df的行名

# [1] "1" "2" "3" "4" "5" "6" "7" "8" "9" "10"

row.names(df)

# [1] "1" "2" "3" "4" "5" "6" "7" "8" "9" "10"

NROW(df) # 统计有多少行

# [1] 10

row.names.data.frame(df) # 查看数据框的行名

# [1] "1" "2" "3" "4" "5" "6" "7" "8" "9" "10"

#@ 对行数据进行求平均值rowMeans()

dim(df1)

# [1] 87 61

df1[1:5,1:5]

# V1 V2 V3 V4 V5

# 1 100 100 101 101 101

# 2 101 101 102 102 102

# 3 102 102 103 103 103

# 4 103 103 104 104 104

# 5 104 104 105 105 105

df1_rowmean <- rowMeans(df1)

length(df1_rowmean)

# [1] 87

class(df1_rowmean)

# [1] "numeric"

#@ 对行数据进行求和rowSums()

df1_rowsum <- rowSums(df1)

length(df1_rowsum)

# [1] 87

class(df1_rowsum)

# [1] "numeric"

#### 3.2 数据框列查看及操作

colnames(df)

# [1] "编号" "姓名" "性别" "数学成绩" "语文成绩"

#@ 对数据框列进行求平均colMeans()

df1_colmean <- colMeans(df1)

length(df1_colmean)

# [1] 61

class(df1_colmean)

# [1] "numeric"

#@ 对数据框列进行求和colSums()

df1_colsum <- colSums(df1)

length(df1_colsum)

# [1] 61

class(df1_colsum)

# [1] "numeric"

#### 3.3 其他的操作

#@ 当前你也可以对数据框整体或者行、列求其他的值：例如最小值、最大值、对数值、幂值、方差、标准差、MAD等等，前题是这个数据框是数值型的数据框，因为字符串无法参与计算

max(df)

# Error in FUN(X[[i]], ...) : 只适用于全数值数据框

max(df1)

# [1] 195

min(df1)

# [1] 94

df1_log2 <- log2(df1)

dim(df1_log2)

# [1] 87 61

df1[1:5,1:5]

# V1 V2 V3 V4 V5

# 1 100 100 101 101 101

# 2 101 101 102 102 102

# 3 102 102 103 103 103

# 4 103 103 104 104 104

# 5 104 104 105 105 105

df1_log2[1:5,1:5]

# V1 V2 V3 V4 V5

# 1 6.643856 6.643856 6.658211 6.658211 6.658211

# 2 6.658211 6.658211 6.672425 6.672425 6.672425

# 3 6.672425 6.672425 6.686501 6.686501 6.686501

# 4 6.686501 6.686501 6.700440 6.700440 6.700440

# 5 6.700440 6.700440 6.714246 6.714246 6.714246

df1_row1_log2 <- log2(df1[1,]) # 只对第一行进行log2转化

df1_row1_log2[1:5,1:5]

# V1 V2 V3 V4 V5

# 1 6.643856 6.643856 6.658211 6.658211 6.658211

# NA NA NA NA NA NA

# NA.1 NA NA NA NA NA

# NA.2 NA NA NA NA NA

# NA.3 NA NA NA NA NA

df1_col1_log2 <- log2(df1[,1]) # 只对第一列进行log2转化

head(df1_col1_log2)

# [1] 6.643856 6.658211 6.672425 6.686501 6.700440 6.714246

sum(df1) # 对数值型的数据框求和

# [1] 690907

#@ 其他的自己去测试，记住R可以计算一切数学计算，如果没有现成的工具就自己构建工具

### 4.数据框的元素操作问题

# 编号姓名性别数学成绩语文成绩

# 1 1 王明男 90 91

# 2 2 李磊男 88 75

# 3 3 张乐男 80 83

# 4 4 刘能男 70 89

# 5 5 黄粲女 95 90

# 6 6 赵月女 91 91

# 7 7 朱忻女 90 88

# 8 8 陈振男 81 77

# 9 9 武琳女 80 85

# 10 10 孙晔女 76 90

#### 4.1 根据某一元素，提取行，然后存为一个新的数据框

#@ 提取数据框df中所有男生的信息

df_new1 <- df[which(df$性别 == "男"),]

df_new1

编号姓名性别数学成绩语文成绩

1 1 王明男 90 91

2 2 李磊男 88 75

3 3 张乐男 80 83

4 4 刘能男 70 89

8 8 陈振男 81 77

#@ 提取数据框df中所有女生的信息

df_new2 <- df[which(df$性别 == "女"),]

df_new2

# 编号姓名性别数学成绩语文成绩

# 5 5 黄粲女 95 90

# 6 6 赵月女 91 91

# 7 7 朱忻女 90 88

# 9 9 武琳女 80 85

# 10 10 孙晔女 76 90

#### 4.2 根据某一个元素，提取列，然后另存为一个新的数据框

df_new3 <- df[,4:5]

df_new3

# 数学成绩语文成绩

# 1 90 91

# 2 88 75

# 3 80 83

# 4 70 89

# 5 95 90

# 6 91 91

# 7 90 88

# 8 81 77

# 9 80 85

# 10 76 90

df_new4 <- df[2:4, 2:4] # 提取数据框的一小部分：子集

df_new4

# 姓名性别数学成绩

# 2 李磊男 88

# 3 张乐男 80

# 4 刘能男 70

df[2,2]

# [1] 李磊

# 10 Levels: 陈振黄粲李磊刘能孙晔王明武琳张乐 ... 朱忻

df[3,3]

# [1] 男

# Levels: 男女

df[4,4]

# [1] 70

#@ 根据条件筛选数据框

df_new5 <- df[df$数学成绩 > 80,]

df_new5

# 编号姓名性别数学成绩语文成绩

# 1 1 王明男 90 91

# 2 2 李磊男 88 75

# 5 5 黄粲女 95 90

# 6 6 赵月女 91 91

# 7 7 朱忻女 90 88

# 8 8 陈振男 81 77

df_new6 <- df[df$语文成绩 == 91,]

df_new6

# 编号姓名性别数学成绩语文成绩

# 1 1 王明男 90 91

# 6 6 赵月女 91 91

#@ 多条件判断进行数据框的筛选

df_new7 <- df[c(df$性别 == "男" & df$数学成绩 == 90),]

df_new7

# 编号姓名性别数学成绩语文成绩

# 1 1 王明男 90 91

df_new8 <- df[df$性别 == "女" & df$数学成绩 > 90 & df$语文成绩 >90,]

df_new8

# 编号姓名性别数学成绩语文成绩

# 6 6 赵月女 91 91

### 5.数据框的排序问题

#### 5.1 按照某一列进行排序

#@ 默认是升序排序，由低到高排序

df_new9 <- df[order(df$数学成绩),]

df_new9

# 编号姓名性别数学成绩语文成绩

# 4 4 刘能男 70 89

# 10 10 孙晔女 76 90

# 3 3 张乐男 80 83

# 9 9 武琳女 80 85

# 8 8 陈振男 81 77

# 2 2 李磊男 88 75

# 1 1 王明男 90 91

# 7 7 朱忻女 90 88

# 6 6 赵月女 91 91

# 5 5 黄粲女 95 90

#@ 也可以降序排序：由高到低进行

df_new10 <- df[order(-df$数学成绩),]

df_new10

# 编号姓名性别数学成绩语文成绩

# 5 5 黄粲女 95 90

# 6 6 赵月女 91 91

# 1 1 王明男 90 91

# 7 7 朱忻女 90 88

# 2 2 李磊男 88 75

# 8 8 陈振男 81 77

# 3 3 张乐男 80 83

# 9 9 武琳女 80 85

# 10 10 孙晔女 76 90

# 4 4 刘能男 70 89

#### 5.2 按照多个列进行排序

#@ 多列同为升序排序，有主次之分，第一个是主要的，先排第一个OK了之后，再排第二个，考虑到一列有相同的排序，第二列、第三列大小不一……，才可以区分开

df_new11 <- df[order(df$数学成绩, df$语文成绩),]

df_new11

# 编号姓名性别数学成绩语文成绩

# 4 4 刘能男 70 89

# 10 10 孙晔女 76 90

# 3 3 张乐男 80 83

# 9 9 武琳女 80 85

# 8 8 陈振男 81 77

# 2 2 李磊男 88 75

# 7 7 朱忻女 90 88

# 1 1 王明男 90 91

# 6 6 赵月女 91 91

# 5 5 黄粲女 95 90

#@ 多列排序，一个为升序，一个为降序

df_new12 <- df[order(-df$数学成绩, df$语文成绩),]

df_new12

# 编号姓名性别数学成绩语文成绩

# 5 5 黄粲女 95 90

# 6 6 赵月女 91 91

# 7 7 朱忻女 90 88

# 1 1 王明男 90 91

# 2 2 李磊男 88 75

# 8 8 陈振男 81 77

# 3 3 张乐男 80 83

# 9 9 武琳女 80 85

# 10 10 孙晔女 76 90

# 4 4 刘能男 70 89

#@ 多列都为降序排序

df_new13 <- df[order(-df$数学成绩, -df$语文成绩),]

df_new13

# 编号姓名性别数学成绩语文成绩

# 5 5 黄粲女 95 90

# 6 6 赵月女 91 91

# 1 1 王明男 90 91

# 7 7 朱忻女 90 88

# 2 2 李磊男 88 75

# 8 8 陈振男 81 77

# 9 9 武琳女 80 85

# 3 3 张乐男 80 83

# 10 10 孙晔女 76 90

# 4 4 刘能男 70 89

### 6.数据框的分离与合并问题

#### 6.1 数据框分离，其实就是获取数据框的子集问题，方法有很多

#@ 利用数据框行列位置索引获取新的数据集

# 编号姓名性别数学成绩语文成绩

# 1 1 王明男 90 91

# 2 2 李磊男 88 75

# 3 3 张乐男 80 83

# 4 4 刘能男 70 89

# 5 5 黄粲女 95 90

# 6 6 赵月女 91 91

# 7 7 朱忻女 90 88

# 8 8 陈振男 81 77

# 9 9 武琳女 80 85

# 10 10 孙晔女 76 90

df_new14 <- df[,1:3]

df_new14

# 编号姓名性别

# 1 1 王明男

# 2 2 李磊男

# 3 3 张乐男

# 4 4 刘能男

# 5 5 黄粲女

# 6 6 赵月女

# 7 7 朱忻女

# 8 8 陈振男

# 9 9 武琳女

# 10 10 孙晔女

df_new15 <- df[2:5,]

df_new15

# 编号姓名性别数学成绩语文成绩

# 2 2 李磊男 88 75

# 3 3 张乐男 80 83

# 4 4 刘能男 70 89

# 5 5 黄粲女 95 90

#### 6.2 根据数据框的行名和列名进行子集的提取

#@ 根据行名进行提取数据框子集，为了方便识别，我们重新定义一个数据框df的行名

row.names(df) <- df$姓名

# 编号姓名性别数学成绩语文成绩

# 王明 1 王明男 90 91

# 李磊 2 李磊男 88 75

# 张乐 3 张乐男 80 83

# 刘能 4 刘能男 70 89

# 黄粲 5 黄粲女 95 90

# 赵月 6 赵月女 91 91

# 朱忻 7 朱忻女 90 88

# 陈振 8 陈振男 81 77

# 武琳 9 武琳女 80 85

# 孙晔 10 孙晔女 76 90

df_new16 <- df[c("王明", "赵月", "孙晔"),]

df_new16

# 编号姓名性别数学成绩语文成绩

# 王明 1 王明男 90 91

# 赵月 6 赵月女 91 91

# 孙晔 10 孙晔女 76 90

#@ 根据列名进行数据框子集的提取

df_new17 <- df[,c("数学成绩", "语文成绩")]

df_new17

# 数学成绩语文成绩

# 王明 90 91

# 李磊 88 75

# 张乐 80 83

# 刘能 70 89

# 黄粲 95 90

# 赵月 91 91

# 朱忻 90 88

# 陈振 81 77

# 武琳 80 85

# 孙晔 76 90

df_new18 <- df[c("王明", "赵月", "孙晔"), c("数学成绩", "语文成绩")]

df_new18

# 数学成绩语文成绩

# 王明 90 91

# 赵月 91 91

# 孙晔 76 90

#### 6.3 subset函数提取数据框子集

df_new19 <- subset(df, select = 数学成绩)

df_new19

# 数学成绩

# 王明 90

# 李磊 88

# 张乐 80

# 刘能 70

# 黄粲 95

# 赵月 91

# 朱忻 90

# 陈振 81

# 武琳 80

# 孙晔 76

#@ 根据列名范围进行筛选

df_new20 <- subset(df, select = 数学成绩:语文成绩)

df_new20

# 数学成绩语文成绩

# 王明 90 91

# 李磊 88 75

# 张乐 80 83

# 刘能 70 89

# 黄粲 95 90

# 赵月 91 91

# 朱忻 90 88

# 陈振 81 77

# 武琳 80 85

# 孙晔 76 90

#@ 有条件的筛选某一列数据

df_new21 <- subset(df, 数学成绩> 80, select = 语文成绩)

df_new21

# 语文成绩

# 王明 91

# 李磊 75

# 黄粲 90

# 赵月 91

# 朱忻 88

# 陈振 77

#### 6.4 dplyr包中的%in%和select()函数

df_new22 <- dplyr::select(df,数学成绩)

df_new22

# 数学成绩

# 王明 90

# 李磊 88

# 张乐 80

# 刘能 70

# 黄粲 95

# 赵月 91

# 朱忻 90

# 陈振 81

# 武琳 80

# 孙晔 76

df_new23 <- dplyr::select(df, 数学成绩, 语文成绩)

df_new23

# 数学成绩语文成绩

# 王明 90 91

# 李磊 88 75

# 张乐 80 83

# 刘能 70 89

# 黄粲 95 90

# 赵月 91 91

# 朱忻 90 88

# 陈振 81 77

# 武琳 80 85

# 孙晔 76 90

#### 6.5 数据框的合并方法也有很多

#@ 按列进行合并，行数必须相同

df_new24 <- cbind(df_new13, df_new14)

df_new24

# 编号姓名性别数学成绩语文成绩编号姓名性别

# 5 5 黄粲女 95 90 1 王明男

# 6 6 赵月女 91 91 2 李磊男

# 1 1 王明男 90 91 3 张乐男

# 7 7 朱忻女 90 88 4 刘能男

# 2 2 李磊男 88 75 5 黄粲女

# 8 8 陈振男 81 77 6 赵月女

# 9 9 武琳女 80 85 7 朱忻女

# 3 3 张乐男 80 83 8 陈振男

# 10 10 孙晔女 76 90 9 武琳女

# 4 4 刘能男 70 89 10 孙晔女

#@ 按行进行合并，列数必须相同

df_new25 <- rbind(df_new18, df_new20)

df_new25

# 数学成绩语文成绩

# 王明 90 91

# 赵月 91 91

# 孙晔 76 90

# 王明1 90 91

# 李磊 88 75

# 张乐 80 83

# 刘能 70 89

# 黄粲 95 90

# 赵月1 91 91

# 朱忻 90 88

# 陈振 81 77

# 武琳 80 85

# 孙晔1 76 90

#@ merge合并，两个数据框根据相同的列进行合并：merge()，merge.data.frame()

#@ 主要参数有by.x，by.y和all.x，all.y和all，设置合理就会得到你想要的结果，不合理的话可能啥也没有

df_new26 <- merge(x = df_new2, y = df_new5, by.x = "姓名", by.y = "姓名", all = T)

df_new26

# 姓名编号.x 性别.x 数学成绩.x 语文成绩.x 编号.y 性别.y

# 1 陈振 NA 8 男

# 2 黄粲 5 女 95 90 5 女

# 3 李磊 NA 2 男

# 4 孙晔 10 女 76 90 NA

# 5 王明 NA 1 男

# 6 武琳 9 女 80 85 NA

# 7 赵月 6 女 91 91 6 女

# 8 朱忻 7 女 90 88 7 女

# 数学成绩.y 语文成绩.y

# 1 81 77

# 2 95 90

# 3 88 75

# 4 NA NA

# 5 90 91

# 6 NA NA

# 7 91 91

# 8 90 88

### 7.数据框的转置问题

df_t <- t(df)

df_t

# [,1] [,2] [,3] [,4] [,5] [,6] [,7]

# 编号 " 1" " 2" " 3" " 4" " 5" " 6" " 7"

# 姓名 "王明" "李磊" "张乐" "刘能" "黄粲" "赵月" "朱忻"

# 性别 "男" "男" "男" "男" "女" "女" "女"

# 数学成绩 "90" "88" "80" "70" "95" "91" "90"

# 语文成绩 "91" "75" "83" "89" "90" "91" "88"

# [,8] [,9] [,10]

# 编号 " 8" " 9" "10"

# 姓名 "陈振" "武琳" "孙晔"

# 性别 "男" "女" "女"

# 数学成绩 "81" "80" "76"

# 语文成绩 "77" "85" "90"

#@ 转置之后的数据结构类型发生了变化

class(df_t)

# [1] "matrix"

#@ 且无法强制转换

df_t_new < -as.data.frame(t(df))

# 错误: 找不到对象'df_t_new'

### 8.数据框的删除、增加和替换问题

#### 8.1 删除数据框某一列或多列

# 编号姓名性别数学成绩语文成绩

# 王明 1 王明男 90 91

# 李磊 2 李磊男 88 75

# 张乐 3 张乐男 80 83

# 刘能 4 刘能男 70 89

# 黄粲 5 黄粲女 95 90

# 赵月 6 赵月女 91 91

# 朱忻 7 朱忻女 90 88

# 陈振 8 陈振男 81 77

# 武琳 9 武琳女 80 85

# 孙晔 10 孙晔女 76 90

dim(df)

# [1] 10 5

df_new1

# 编号姓名性别数学成绩语文成绩

# 1 1 王明男 90 91

# 2 2 李磊男 88 75

# 3 3 张乐男 80 83

# 4 4 刘能男 70 89

# 8 8 陈振男 81 77

df_new1$编号 <- NULL

df_new1

# 姓名性别数学成绩语文成绩

# 1 王明男 90 91

# 2 李磊男 88 75

# 3 张乐男 80 83

# 4 刘能男 70 89

# 8 陈振男 81 77

df_new1[,2:4] <- NULL

df_new1

# 姓名

# 1 王明

# 2 李磊

# 3 张乐

# 4 刘能

# 8 陈振

#### 8.2 删除数据框某一行或多行

df_new2

# 编号姓名性别数学成绩语文成绩

# 5 5 黄粲女 95 90

# 6 6 赵月女 91 91

# 7 7 朱忻女 90 88

# 9 9 武琳女 80 85

# 10 10 孙晔女 76 90

df_new2[1,] <- NULL

# Error in x[[jj]][iseq] <- vjj : 更换参数长度为零

df_new2[1,] <- ""

# Warning messages:

# 1: In `[<-.factor`(`*tmp*`, iseq, value = "") :

# invalid factor level, NA generated

# 2: In `[<-.factor`(`*tmp*`, iseq, value = "") :

# invalid factor level, NA generated

# 3: In `[<-.factor`(`*tmp*`, iseq, value = "") :

# invalid factor level, NA generated

# 4: In `[<-.factor`(`*tmp*`, iseq, value = "") :

# invalid factor level, NA generated

df_new2

# 编号姓名性别数学成绩语文成绩

# 5

# 6 6 赵月女 91 91

# 7 7 朱忻女 90 88

# 9 9 武琳女 80 85

# 10 10 孙晔女 76 90

df_new27 <- df_new2[-c(1),] # 用c()和-的组合，可以很轻松的删除你不想要的行

df_new27

# 编号姓名性别数学成绩语文成绩

# 6 6 赵月女 91 91

# 7 7 朱忻女 90 88

# 9 9 武琳女 80 85

# 10 10 孙晔女 76 90

df_new3

# 数学成绩语文成绩

# 1 90 91

# 2 88 75

# 3 80 83

# 4 70 89

# 5 95 90

# 6 91 91

# 7 90 88

# 8 81 77

# 9 80 85

# 10 76 90

df_new28 <- df_new3[-c(1,3,5,7), ] #删除掉1/3/5/7行

df_new28

# 数学成绩语文成绩

# 2 88 75

# 4 70 89

# 6 91 91

# 8 81 77

# 9 80 85

# 10 76 90

df_new29 <- df_new3[-c(1:3),] # 也可以指定行的范围进行删除

df_new29

# 数学成绩语文成绩

# 4 70 89

# 5 95 90

# 6 91 91

# 7 90 88

# 8 81 77

# 9 80 85

# 10 76 90

#### 8.3 替换数据框中的缺失值为0

#@ 咱们先构建一个含有缺失值的数据框

set.seed(110)

m <- matrix(sample(c(NA, 1:10), 100, replace = TRUE), 10)

mydf <- as.data.frame(m)

mydf

# V1 V2 V3 V4 V5 V6 V7 V8 V9 V10

# 1 3 2 4 10 NA 8 NA 7 6 9

# 2 7 2 8 4 4 8 5 6 9 8

# 3 5 9 9 6 8 6 2 3 6 2

# 4 2 9 5 7 5 4 7 7 9 4

# 5 8 NA 9 10 5 4 5 9 2 9

# 6 6 9 6 9 7 3 7 10 1 10

# 7 2 NA 1 3 1 2 7 4 2 5

# 8 8 4 10 NA 3 10 9 9 5 6

# 9 10 6 2 NA 1 5 2 2 9 9

# 10 3 8 8 7 5 2 5 8 7 7

is.na(mydf) # is.na()函数返回数据类型是否是缺失值的真假值

# V1 V2 V3 V4 V5 V6 V7 V8 V9

# [1,] FALSE FALSE FALSE FALSE TRUE FALSE TRUE FALSE FALSE

# [2,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [3,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [4,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [5,] FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [6,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [7,] FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [8,] FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE

# [9,] FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE

# [10,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# V10

# [1,] FALSE

# [2,] FALSE

# [3,] FALSE

# [4,] FALSE

# [5,] FALSE

# [6,] FALSE

# [7,] FALSE

# [8,] FALSE

# [9,] FALSE

# [10,] FALSE

mydf[is.na(mydf)] <- 0 # 然后数据框根据真假值进行替换0，为真的替换为0，为真就是NA

mydf

# V1 V2 V3 V4 V5 V6 V7 V8 V9 V10

# 1 3 2 4 10 0 8 0 7 6 9

# 2 7 2 8 4 4 8 5 6 9 8

# 3 5 9 9 6 8 6 2 3 6 2

# 4 2 9 5 7 5 4 7 7 9 4

# 5 8 0 9 10 5 4 5 9 2 9

# 6 6 9 6 9 7 3 7 10 1 10

# 7 2 0 1 3 1 2 7 4 2 5

# 8 8 4 10 0 3 10 9 9 5 6

# 9 10 6 2 0 1 5 2 2 9 9

# 10 3 8 8 7 5 2 5 8 7 7

#### 8.4 根据某个元素进行删除行或列

set.seed(110)

mydf2 <- as.data.frame(matrix(sample(c(NA, 1:20), 100, replace = TRUE), 10))

mydf2

# V1 V2 V3 V4 V5 V6 V7 V8 V9 V10

# 1 19 18 11 10 7 19 5 9 2 1

# 2 5 9 13 9 1 2 7 15 20 NA

# 3 18 NA 17 3 3 18 6 2 5 4

# 4 8 NA 13 16 1 NA 3 1 6 4

# 5 15 20 2 16 5 5 7 2 11 7

# 6 6 6 13 NA 13 18 4 5 7 9

# 7 2 20 8 4 8 7 12 11 7 15

# 8 8 8 11 8 6 14 2 12 18 19

# 9 3 11 20 5 20 9 8 8 17 4

# 10 18 9 6 5 4 18 15 11 9 18

#@ 根据某个元素删除行，例如这个元素是NA

mydf2 <- mydf2[complete.cases(mydf2),]

mydf2

# V1 V2 V3 V4 V5 V6 V7 V8 V9 V10

# 1 19 18 11 10 7 19 5 9 2 1

# 5 15 20 2 16 5 5 7 2 11 7

# 7 2 20 8 4 8 7 12 11 7 15

# 8 8 8 11 8 6 14 2 12 18 19

# 9 3 11 20 5 20 9 8 8 17 4

# 10 18 9 6 5 4 18 15 11 9 18

?complete.cases

# Find Complete Cases

# Return a logical vector indicating which cases are complete, i.e., have no missing values.

set.seed(110)

mydf3 <- as.data.frame(matrix(sample(c(NA, 1:10), 100, replace = TRUE), 10))

mydf3

# V1 V2 V3 V4 V5 V6 V7 V8 V9 V10

# 1 3 2 4 10 NA 8 NA 7 6 9

# 2 7 2 8 4 4 8 5 6 9 8

# 3 5 9 9 6 8 6 2 3 6 2

# 4 2 9 5 7 5 4 7 7 9 4

# 5 8 NA 9 10 5 4 5 9 2 9

# 6 6 9 6 9 7 3 7 10 1 10

# 7 2 NA 1 3 1 2 7 4 2 5

# 8 8 4 10 NA 3 10 9 9 5 6

# 9 10 6 2 NA 1 5 2 2 9 9

# 10 3 8 8 7 5 2 5 8 7 7

mydf3 <- na.omit(mydf3)

mydf3

# V1 V2 V3 V4 V5 V6 V7 V8 V9 V10

# 2 7 2 8 4 4 8 5 6 9 8

# 3 5 9 9 6 8 6 2 3 6 2

# 4 2 9 5 7 5 4 7 7 9 4

# 6 6 9 6 9 7 3 7 10 1 10

# 10 3 8 8 7 5 2 5 8 7 7

?na.omit

# Handle Missing Values in Objects

#@ 根据某个元素删除列，例如这个元素是NA

set.seed(110)

mydf4 <- as.data.frame(matrix(sample(c(NA, 1:30), 100, replace = TRUE), 10))

mydf4

# V1 V2 V3 V4 V5 V6 V7 V8 V9 V10

# 1 19 3 27 11 8 16 3 4 14 7

# 2 23 18 27 30 26 23 1 19 21 25

# 3 5 18 6 22 11 NA 5 2 23 26

# 4 18 30 24 13 20 4 27 26 23 4

# 5 8 25 20 17 6 8 13 21 9 12

# 6 15 9 8 26 23 29 29 18 18 25

# 7 6 NA 11 13 10 5 8 NA 5 2

# 8 2 25 25 2 9 5 24 5 7 8

# 9 8 NA 21 13 3 7 6 18 6 28

# 10 26 20 9 28 16 1 20 7 3 15

is.na(mydf4)

# V1 V2 V3 V4 V5 V6 V7 V8 V9

# [1,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [2,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [3,] FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE

# [4,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [5,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [6,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [7,] FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE

# [8,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [9,] FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# [10,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

# V10

# [1,] FALSE

# [2,] FALSE

# [3,] FALSE

# [4,] FALSE

# [5,] FALSE

# [6,] FALSE

# [7,] FALSE

# [8,] FALSE

# [9,] FALSE

# [10,] FALSE

na_flag <- apply(is.na(mydf4), 2, sum)

mydf4 <- mydf4[,which(na_flag == 0)]

mydf4

# V1 V3 V4 V5 V7 V9 V10

# 1 19 27 11 8 3 14 7

# 2 23 27 30 26 1 21 25

# 3 5 6 22 11 5 23 26

# 4 18 24 13 20 27 23 4

# 5 8 20 17 6 13 9 12

# 6 15 8 26 23 29 18 25

# 7 6 11 13 10 8 5 2

# 8 2 25 2 9 24 7 8

# 9 8 21 13 3 6 6 28

# 10 26 9 28 16 20 3 15

三、收官

sessionInfo()

# R version 3.6.2 (2019-12-12)

# Platform: x86_64-w64-mingw32/x64 (64-bit)

# Running under: Windows 10 x64 (build 18363)

# Matrix products: default

# locale:

# [1] LC_COLLATE=Chinese (Simplified)_China.936

# [2] LC_CTYPE=Chinese (Simplified)_China.936

# [3] LC_MONETARY=Chinese (Simplified)_China.936

# [4] LC_NUMERIC=C

# [5] LC_TIME=Chinese (Simplified)_China.936

# attached base packages:

# [1] stats graphics grDevices utils datasets

# [6] methods base

# other attached packages:

# [1] chron_2.3-54 sqldf_0.4-11 RSQLite_2.1.5 gsubfn_0.7

# [5] proto_1.0.0

# loaded via a namespace (and not attached):

# [1] zip_2.0.4 Rcpp_1.0.3 cellranger_1.1.0

# [4] pillar_1.4.3 compiler_3.6.2 forcats_0.4.0

# [7] tools_3.6.2 zeallot_0.1.0 digest_0.6.23

# [10] packrat_0.5.0 bit_1.1-14 memoise_1.1.0

# [13] tibble_2.1.3 pkgconfig_2.0.3 rlang_0.4.2

# [16] openxlsx_4.1.4 DBI_1.1.0 rstudioapi_0.10

# [19] curl_4.3 haven_2.2.0 rio_0.5.16

# [22] dplyr_0.8.3 vctrs_0.2.1 hms_0.5.2

# [25] tidyselect_0.2.5 bit64_0.9-7 glue_1.3.1

# [28] data.table_1.12.8 R6_2.4.1 tcltk_3.6.2

# [31] readxl_1.3.1 foreign_0.8-72 purrr_0.3.3

# [34] blob_1.2.0 magrittr_1.5 backports_1.1.5

# [37] assertthat_0.2.1 stringi_1.4.3 crayon_1.3.4

你可能感兴趣的:(R)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
光盘文件系统 (iso9660) 格式解析穷人小水滴光盘文件系统 iso9660 deno GNU/Linux javascript
越简单的系统,越可靠,越不容易出问题.光盘文件系统(iso9660)十分简单,只需不到200行代码,即可实现定位读取其中的文件.参考资料:https://wiki.osdev.org/ISO_9660相关文章:《光盘防水嘛?DVD+R刻录光盘泡水实验》https://blog.csdn.net/secext2022/article/details/140583910《光驱的内部结构及日常使用》ht
《跃迁》5/7-5组-橙子-张静12.16 静言物于
【便签5】【片段来源】《跃迁：成为高手的技术》第四章【R原文】一位客户咨询时抱怨：“这个我做不到。”我问他：“如果我请你现在出去裸奔，你能做到吗？”“这个我也做不到”“其实并不是做不到，而是不愿意做，或者不想承担裸奔的代价吧。你不是做不到，而是选择不去做。如果有一天你裸奔能救自己家人、孩子，也许就能做到了。”为什么要做这个区分？如果一个人经常和自己说“做不到”，他的能力范围会越来越小，会成为一个无
✔2848. 与车相交的点程序员小小聪力扣 leetcode
代码实现：方法一：哈希表#definefmax(a,b)((a)>(b)?(a):(b))intnumberOfPoints(int**nums,intnumsSize,int*numsColSize){inthash[101]={0};intmax=0;for(inti=0;i=x){j--;}if(i=nums[i][0]){r=r>nums[i][1]?r:nums[i][1];}else{
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
Acwing 区间合并 Curry_Math 算法学习算法 c++开发语言
区间合并主要思想：给定很多区间。若两个区间有交集，将二者合并成一个区间。具体做法:先按照区间的左端点进行排序然后遍历每个区间，根据不同的情况进行合并，有一下几种情况：第一种情况，区间不变；第二种情况，end更新为区间i的右端点；以上两种情况，可以归结为end更新为max（end，r）;r为区间右端点第三种情况，将当前维护的区间加入结果，并将维护的区间更新为区间i；下面给出区间合并的板子：//区间合
Android shell 常用 debug 命令晨春计 Audio debug android linux
目录1、查看版本2、am命令3、pm命令4、dumpsys命令5、sed命令6、log定位查看APK进程号7、log定位使用场景1、查看版本1.1、Android串口终端执行getpropro.build.version.release#获取Android版本uname-a#查看linux内核版本信息uname-r#单独查看内核版本1.2、linux服务器执行lsb_release-a#查看Lin
Windows安装ciphey编码工具，附一道ciscn编码题例 im-Miclelson CTF工具网络安全
TA是什么一款智能化的编码分析解码工具，对于CTF中复杂性编码类题目可以快速攻破。编码自动分析解码的神器。如何安装Windows环境Python3.864位（最新的版本不兼容，32位的也不行）PIP直接安装pipinstallciphey-ihttps://pypi.mirrors.ustc.edu.cn/simple/安装后若是出现报错请根据错误代码行数找到对应文件，r修改成rb即可。使用标准语
linux简单安装gcc和gdb chn-zgq Linux linux ubuntu
linux安装gcc以及环境配置和gdb安装gcc-10.0添加源:sudoadd-apt-repositoryppa:ubuntu-toolchain-r/ppa更新源:sudoaptupdate下载gcc:sudoaptinstallgcc-10g++-10默认GCC版本设置为gcc-10.0:sudoupdate-alternatives--install/usr/bin/gccgcc/us
梧桐数据库（WuTongDB）：数据库技术中都有哪些常见的优化器鲁鲁517 梧桐数据库梧桐数据库
以下是一些常见的数据库优化器：1.CBO（Cost-BasedOptimizer）应用场景：广泛应用于关系型数据库中，如Oracle、PostgreSQL、MySQL等。工作原理：通过计算不同执行计划的代价（如CPU、I/O等资源消耗），选择最低代价的执行计划。代表数据库：Oracle、PostgreSQL、MySQL。特点：CBO使用统计信息（如表大小、索引分布）来评估查询的代价。2.RBO（R
【机器人建模和控制】读书笔记 Piccab0o 机器人
机器人建模和控制——马克·斯庞A.x10=x1∙x0x^0_1=x_1\bulletx_0x10=x1∙x0，其实就是：1）x1x_1x1轴向量在O0O_0O0系下的坐标2）在x0x_0x0轴上的投影3）坐标变换矩阵的R10R_1^0R10的第一个元素B.点p在o1x1y1z1o_1x_1y_1z_1o1x1y1z1系下的坐标p1p^1p1可以表示为：p=ux1+vy1+wz1p=ux_1+vy_
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
PCIe进阶之TL：Common Packet Header Fields & TLPs with Data Payloads Rules 芯芯之火，可以燎原 PCIe进阶 PCIe进阶硬件工程信息与通信
1TransactionLayerProtocol-PacketDefinitionTLP有四种事务类型：Memory、I/O、Configuration和Messages，两种地址格式：32bit和64bit。构成TLP时，所有标记为Reserved的字段（有时缩写为R）都必须全为0。接收者Rx必须忽略此字段中的值，PCIeSwitch必须对其进行原封不动的转发。请注意，对于某些字段，既有指定值
python下载pandas库镜像_下载pandas库 weixin_39791152
背景交代：在下载matplotlib库时，我已经将pip的下载源手动更改为清华的镜像，所以，如果有小伙伴在下载库遇到问题，如timeout，请先将下载源改为国内镜像，具体操作见我的另一篇文章：今天的主题是安装pandas库~首先，按田字格+R，打开cmd，输入：pipinstallpandas嗯，不出所料地报错了……主要原因：pip._vendor.urllib3.exceptions.ReadT
FlexibleBI系统是现代制造企业提升生产质量和效率的重要工具三坐标CMM质量数据系统制造
SPC（统计过程控制）系统是现代制造企业提升生产质量和效率的重要工具。我们的SPC系统通过一键生成全面的SPC分析报告，帮助企业快速、精准地完成质量分析，并大大减少了手动处理数据的复杂性。FlexibleBI实时更新的控制图在生产过程中，控制图可以实时自动更新，确保企业能够随时掌握生产状态，及时发现并处理潜在问题。系统支持多种标准SPC控制图，如X-bar、R、P等图表，全面覆盖所有常见生产场景。
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
node初奶瓶SAMA
www.nodejs.org下载nodejs的安装文件,然后就直接下一步，下一步，下一步傻瓜式安装（打开命令符widow+r输入cmd）node-v查单当前node的版本号安装nodejs时，会自动安装npm包管理工具npm-v查看npm的版本可以直接在黑窗口中输入node然后点击回车以后，就可以输入javascripnt的代码了既然在浏览器鼠标右键中console和在黑窗口中输入node点击回车
ros2中使用launch.xml启动时，怎么在命令行里设置参数，或者加载参数文件（params.yaml） code . Autoware 自动驾驶 ROS2 xml Ros2 自动驾驶机器人
在ROS2中使用launch.xml启动时，可以通过命令行设置参数或加载参数文件（如params.yaml）。以下是具体的方法：1.在命令行中设置参数你可以在运行ros2launch命令时直接设置参数，使用key:=value的语法。例如：ros2launchparam_name:=param_value例如，如果你有一个参数background_r，你可以这样设置：ros2launchmy_pa
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
商业预测初识R hongyanwin r语言预测
1.打开帮助文档首页，查阅其中的“IntroductiontoR”helpRhelp2.安装vcd包install.packages("vcd")3.列出此包中可用的函数和数据集ls("package:vcd")/data(package="vcd")4.载入包并阅读数据集Arthritis的描述library("v.d")/?Arthritis5.显示数据集Arthritis的内容查看数据集结构
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
2024上半年软考系统架构设计师-综合知识选择题及答案不对法系统架构
1.操作系统先来先服务调度算法2.操作系统多道程序设计，利用率3.操作系统状态流转错误的，执行态到运行态4.数据库2NF每一个非主属性完全依赖主键5.数据库笛卡尔积m*n6.数据库不属于事务的特点，并发性7.数据库交集表达式R-(R-S)8.数据库反规范化属于逻辑设计9.网络没有加密功能，物理层10.网络二层交换机数据，数据链路层11.知识产权专利法是否属于民法12.知识产权商标不属于，其他几个是
python 判断 ‘NoneType’的方法 cuisidong1997 文本转换 python
的错误时说明需要进行判断，而对‘NoneType’进行判断时直接使用‘isNone’即可，如下：iftextisNone:print('testis’+None)else:print('testisnot’+None)a=re.match(r’主叫号码(.*)客户姓名’,r’2、主叫号码：15558191990;3、客户姓名：韩东远;')print(type(a))ifaisNone:print(
R 数据可视化 —— 韦恩图名本无名
前言对于数据集之间交叠关系的可视化，通常想到的是绘制韦恩图。韦恩图是一种关系型图表，通过图形之间的重叠来反映数据集之间的相交关系。下面，我们来简单介绍一下如何绘制韦恩图韦恩图绘制韦恩图的包有很多，比如gplots包的venn()函数、limma包的vennDiagram()函数、venneuler包的venneuler()函数。但是这些包绘制出来的图像效果都不是很好，所以我们使用比较成熟的包Ven
Mac清倒废纸篓提示“voicetrigger“在使用中 ReddingtonLin Mac Mac
删除Mac下的user以后，清倒废纸篓，提示“voicetrigger”在使用中。解决办法：重启Mac，开机的时候按住Cmd+R进入Recovery模式选择语言-简体中文从工具菜单中启动终端，输入密码。输入csrutildisable命令，即可关闭SIP服务。重启电脑。（正常重启即可，不用按住Cmd+R进入Recovery模式）再尝试清空废纸篓。如果还不行，就尝试用命令行删除。处理好后，再开启SI
大数据新视界 --大数据大厂之数据挖掘入门：用 R 语言开启数据宝藏的探索之旅青云交大数据新视界数据库大数据数据挖掘 R 语言算法案例未来趋势应用场景学习建议大数据新视界
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
python做窗口软件界面绑定py程序_PyCharm GUI界面开发和exe文件生成的实现 weixin_39948442
一、安装Python二、安装PyQt5推荐使用pip安装：win+R调出cmd命令窗口pipinstallPyQt5等待片刻，继续安装PyQt5-toolspipinstallPyQt5-tools如果直接pip不成功的话，建议在python库这个网站上搜索相关库，下载相应的.whl文件，然后用以下方法进行安装：①pipwhl文件所在路径whl文件名②在cmd命令窗口先执行cdwhl文件所在路径到
02 Java-Lambda-Java 8 自带的函数接口王小杰at2019
Java8自带的函数接口我们使用lambda在处理自己定义的业务时，需要自定义函数式接口，其实java8已经内置了常用的接口，这样我们在用的时候不要需要自己定义接口，根据需要选择符合自己业务逻辑的接口接口|输入参数|返回值类型|说明---|---|---|---|---Predicate|T|boolean|断言Consumer|T|/|消费一个数据|Function|T|R|输入一个T输出一个R
10.web应用体系以及windows网络常见操作应用 XXX-17 软件测试软件测试
一、Dos命令1.启动方式：win+R，输入cmd2.切换盘符/路径：盘符名称+：（C:)cd目录（cdB111）（目录名按table键自动补全）3.查看目录：dirdir/p分页展示目录及文件dir/b展示文件名称4.创建文件夹：md文件夹名（mdt1)5.删除文件夹：rd文件夹名（rdt1）删除文件：del文件名（del222.txt）6.复制文件：copy复制文件目标路径（copymaste
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name