learnergu

R语言基础介绍

文章目录

软件安装

R语言
RStudio
可视化数据挖掘工具Rattle

菜单栏

Data-数据读入
Explore-数据探索
Test-数据相关检验
Transform-数据转换
Cluster-聚类
Mode-构建模型
Evaluate-模型评估
Log-日志

R语言基础介绍

区分大小写
赋值符号
注释符号
管理工作空间

查看工作空间
显示和修改工作目录

R语言的包
查看帮助

数据结构

向量

创建向量
查看向量长度
向量的模式
向量化

矩阵
数组

创建数组
选取数组中的元素

数据框

创建数据框
选取数据框的元素

因子

名义型变量
有序型变量
创建因子

列表

创建列表
列表的索引
编辑列表

数据的读取

读取文本文件
读取非结构化文本文件
读取网络数据

R语言的基础绘图

散点图

普通散点图
散点图矩阵

柱状图和条形图

绘制饼图
绘制Q-Q图

箱线图
茎叶图
点图

R语言描述性统计分析
参考资料

软件安装

R语言

https://www.r-project.org/

RStudio

https://www.rstudio.com/

可视化数据挖掘工具Rattle

#Rattle的安装
install.packages("RGtk2")
install.packages("rattle")

library(rattle)#载入rattle包
rattle()#调出Rattle界面

菜单栏

数据读入（Data)
数据探索（Explore）
数据相关验证（Test）
数据转换(Transform)
聚类分析（Cluster）
关联规则（Associate）
构建模型(Mode）
模型评估（Evaluate）
日志（Log)

Data-数据读入

在数据来源中，通常有来源于表格的数据（Spreadsheet），例如在Excel中建立的数据：来源于数据库的数据（ODBC），例如通过R直接提取MySQL中的数据；来源于R软件中的数据集（R Dataset）等。

第三行中的参数Partition主要用于数据的划分。在Rattle包中，为了方便进行模型的建立和分析，系统将会把原始数据集划分为三部分：Training、Validation以及Testing。系统将默认划分比例设定为70:15:15，并将按照划分比例从数据集中随机抽取样本。在具体使用过程中，数据集Training主要用于模型的建立，数据集Validation以及数据集Testing主要用于模型评估以及模型测试。

在确定数据来源与数据划分之后，系统将会列出数据集中的各个变量以及变量的数据类型。在数据对话框中，我们可以选择变量在构建模型时的具体作用。

这里我们读取气象数据集，其目标是预测明天是否下雨

Explore-数据探索

Explore选项主要能根据数据集输出关于数据集的一下信息：数据总体概括（Summary）、数据分布情况（Distributions）、数据的相关系数矩阵（Correlation）、数据集的主成分分析（Principal Components）以及各变量之间的相互作用（Interactive）。

描述性统计分析

例如这里对气象数据集进行描述性统计分析，选中"Summary"之后，点击“执行”。

数据的分布

选中Distributions，查看变量MinTemp的箱线图

Test-数据相关检验

Test选项主要进行的统计检验有：KS检验（Kolmogorov-Smirnov）、威尔克特斯检验（Wilcoxon Rank-Sum）、T检验（T-test）以及F检验（F-test）。

Transform-数据转换

选项Transform主要用于数据集的预处理。

Transform选项对数据的转换主要有4种转换类型，分别为数据标准话（Rescale）、数据插值（Impute）、数据重排列（Recode）以及数据清理（Cleanup）。我们可以看到，在数据转换类型Type的下面一行里，显示出了在数据标准化中将要使用到的标准化方式，例如0-1标准化等。

Cluster-聚类

Cluster选项主要存在4种数据的聚类方式，分别为K均值聚类法（KMeans）、自适应的软子空间聚类算法（Ewkm）、层次聚类法（Hierarchical）以及双聚类算法（BiCluster）。在聚类方法Type的下面一行主要用于决定聚类分析的相关参数，例如类别数量以及随机生成器初始值等。

Mode-构建模型

第一行是模型类型Type，总共有6种。

Tree-决策树
Forest-随机森林
组合算法（Boost）
支持向量机（SVM）
线性回归（Linear）
神经网络（Neural Net）

这里的模型类别并非由R软件自定固定决定，而主要取决于读者电脑中相关的程序包。即读者需要评估何类模型，则应先下载安装相应的模型构建程序包。

在确定了模型的预测类别后，界面下面将会出现和模型相关的参数。例如从图中关于决策树的参数中我们可以看到，第一个参数值是决策树的最小节点数。在确定模型的类别以及模型相关的参数之后，我们需要点击"执行"按钮进行模型的构建。

系统在建立出模型之后将会在下面的对话框中展示出模型的相关信息。

我们取rattle默认的数据集“weather.csv”为例，以随机森林为例，详细情况如下图所示。

上图是利用Rattle程序构建随机森林模型的相关结果输出图。在图中我们可以看到，随机森林模型中决策树的个数为500棵，而每一棵决策树的节点分支处所选择的变量个数为4个。

在参数决定窗口的旁边有四个按钮。其中，Importance按钮主要用于绘制模型中各变量在不同标准下的重要值图像；Errors按钮主要用于绘制模型中各个类别以及根据袋外数据计算的误判率的图像；OOB ROC按钮主要用户绘制根据随机森林模型的袋外数据计算而得到的ROC图像。例如点击impotrant可以查看模型中各个变量的重要性

上图是通过Importance按钮生成的重要值图像。该图像总体分为两个图像，其中第一个图像为根据精确度平均减少值所计算得出的重要值所绘制；第二个图像为根据节点不纯度减少平均值计算得出的重要值所绘制。图中纵轴为所有变量的名称，横轴为各变量对应的重要值，越在顶层的变量对于模型的重要程度越大。

上图是通过Errors按钮生成的误判率图像。该图中总共有三条颜色的线，这三条线分别代表了肯定结论的误判率、否定结论的误判率以及根据袋外数据计算而得的误判率。该图中纵轴为具体误判率的值，而横轴为随机森林中决策树的数量。查看模型有没有出现欠拟合或过拟合的结果，误判率图像可以用来帮助决策随机森林中决策树的数量。

Evaluate-模型评估

Evaluate选项中，Rattle程序包提供了一系列模型评估标准。其中有模型混淆矩阵（Error Matrix）、模型风险表（Risk）、模型ROC图像（ROC）以及模型得分数据集（Score）等各类模型评估指标。

在模型评估标准类型的下面一行是需要进行评估的模型类别，这一行的选项只有在前面Model选项中已经建立了的模型才可用。在模型类别的选择栏下面一行是数据类型选择栏，Training数据集用于模型构建，而Validation数据集与Testing数据集用于模型评估。

如选择混淆矩阵，我们选择Error Matrix之后点击执行，查看结果

Log-日志

选项Log主要用于记录以上所介绍的所有功能的具体执行情况。Rattle非常好的地方就是在日志中会将你执行的所有步骤的R脚本保存，我们可以从日志中学习很多的语法，比如我们执行某个变量的箱线图之后，可以在日志中查看如何通过脚本绘制箱线图。

R语言基础介绍

友好编辑器

RStudio

区分大小写

> a<-1:15
> a
 [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15
> A
错误: 找不到对象'A'

> cor(iris[,1:4])#鸢尾花数据集中第1列至第4列变量之间的相关性系数
             Sepal.Length Sepal.Width Petal.Length Petal.Width
Sepal.Length    1.0000000  -0.1175698    0.8717538   0.8179411
Sepal.Width    -0.1175698   1.0000000   -0.4284401  -0.3661259
Petal.Length    0.8717538  -0.4284401    1.0000000   0.9628654
Petal.Width     0.8179411  -0.3661259    0.9628654   1.0000000
> Cor(iris[,1:4])#无法找到Cor这个函数，因此函数也是区分大小写
Error in Cor(iris[, 1:4]) : 没有"Cor"这个函数

赋值符号

R语句由函数和赋值构成，R语言的标准赋值符号是<-（即一个小于号加上一个减号）

> y<-rnorm(5)#创建一个名为y的向量对象，它包含5个来自标准正态分布的随机偏差
> y
[1]  1.3800778 -0.9753630  1.5347207 -1.1228029  0.7462479

c(1:4)
> x
[1] 1 2 3 4
> c(1:4)->x
> x
[1] 1 2 3 4
> assign("x",c(1:4))#使用赋值函数assign()
> x
[1] 1 2 3 4

注意：

R语言允许=为对象赋值，但是它不是标准语法，某些情况下，用等号赋值会出现问题。
R语言还有可以反转赋值方向，例如c(1:4)->x与x<-c(1:4)等价
R语言还有一个赋值函数assign()
使用等号赋值的做法并不常见，不推荐使用

注释符号

注释由符号#开头，在#之后出现的任何文本都会被R解释器忽略

管理工作空间

查看工作空间

在R中可以通过ls()查找当前工作空间的对象。

#创建数据对象
a<-1:6
#创建模型对象fit
fit<-lm(Sepal.Length~Sepal.Width,data=iris)
fit #得到截距为6.5262，自变量的系数为-0.2234
#查看模型的详细内容
summary(fit)
#创建图形对象p
library(ggplot2)
p<-qplot(mpg,wt,data = mtcars)
p
ls() #通过ls()命令查找当前工作空间的对象

#通过rm函数移除一个或多个对象
rm(list = "fit")
ls()

#移除全部对象
rm(list = ls())
ls()


> fit

Call:
lm(formula = Sepal.Length ~ Sepal.Width, data = iris)

Coefficients:
(Intercept)  Sepal.Width  
     6.5262      -0.2234  



> summary(fit)

Call:
lm(formula = Sepal.Length ~ Sepal.Width, data = iris)

Residuals:
    Min      1Q  Median      3Q     Max 
-1.5561 -0.6333 -0.1120  0.5579  2.2226 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   6.5262     0.4789   13.63   <2e-16 ***
Sepal.Width  -0.2234     0.1551   -1.44    0.152    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.8251 on 148 degrees of freedom
Multiple R-squared:  0.01382,	Adjusted R-squared:  0.007159 
F-statistic: 2.074 on 1 and 148 DF,  p-value: 0.1519


> ls()
[1] "a"   "fit" "p"  

> rm(list = "fit")
> ls()
[1] "a" "p"

> rm(list = ls())
> ls()
character(0)

显示和修改工作目录

#显示当前的工作目录
getwd()
#修改当前的工作目录
setwd("mydirectory")

R语言的包

包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。从某种意义上，R的包就是针对R的插件，相当于Python里面的库，不同的插件满足不同的需求。

查看包的位置

> .libPaths()
[1] "F:/Rsoftware/R3.4.4/R-3.4.4/library"

安装包

通过命令

install.packages("package_name","dir")#可以省略安装路径dir，默认是安装我们之前的路径

第一次安装的时候需要选择镜像

通过工具栏（在RStudion）操作

加载包

通过library或者require命令加载包

#加载shiny包并使用runExample函数，必须先加载包之后才能调用里面的函数
library(shiny)
runExample()
runExample("01_hello")

> library(shiny)
> runExample()
Valid examples are "01_hello", "02_text", "03_reactivity", "04_mpg", "05_sliders", "06_tabsets", "07_widgets", "08_html", "09_upload", "10_download", "11_timer

shiny包可以实现平台的交互,改变图像中的滑动条，图形就会跟着改变。

查看帮助

有两种方式

> help(plot)
> ?plot
> ??plot #两个问号，检索所有与plot相关的信息

在RStudio还有另外一种快捷的方式‘

数据结构

向量

创建向量

向量是用于存储数值型、字符型或逻辑型数据的一维数组。执行组合功能的函数c()和相应的参数可用来创建向量。

各类向量的示例如下

a<-c(1:4) #数值型变量
b<-c("one","two","three","four") #字符型变量
d<-c("TRUE","TRUE","FALSE","FALSE") #逻辑型变量

ab<-c(a,b) #数值型+字符型=字符型
ab

bd<-c(b,d) #字符型+逻辑型=字符型
bd

> ab<-c(a,b) #数值型+字符型=字符型
> ab
[1] "1"     "2"     "3"     "4"     "one"   "two"   "three" "four" 


> bd<-c(b,d) #字符型+逻辑型=字符型
> bd
[1] "one"   "two"   "three" "four"  "TRUE"  "TRUE"  "FALSE" "FALSE"

注意：单个向量的数据必须属于相同的类型或模式（数值型、字符型或逻辑型）。如果不是，R将强制执行类型转换

由于R中内置了同名函数c()，最后不要在编码时使用c作为对项目，否则可能产生一些不易察觉的问题

标量是只含一个元素的向量，例如 f<-3、g<-"US"、h<-TRUE

它们用于保存常量。

查看向量长度

查看向量中有多少个元素。

> d<-c(TRUE,TRUE,FALSE,FALSE) #逻辑型变量，可以简写T，F,不过注意要大写
> length(d) #查看长度
[1] 4

向量的模式

> d<-c(TRUE,TRUE,FALSE,FALSE) #逻辑型变量
> mode(d) #查看模式
[1] "logical"

向量化

向量的运算

#长度相同
v1<-seq(1,10,2)
v2<-seq(2,10,2)
v12<-v1+v2
v12
#长度不同
w1<-c(2,4,6,8)
w2<-c(10,12)
w12<-(w1+w2)
w12

> v12
[1]  3  7 11 15 19

> w12
[1] 12 16 16 20

解释w12：

w1的第一个元素2加上w2的第一个元素10等于12

w1的第二个元素4加上w2的第二个元素12等于16

本应该的是，w1的第三个元素加上w2的第三个元素，但是w2没有第三个元素，所以这时候就会进行循环，w1的第三个元素6加上w2的第一个元素10，所以等于16；同理，w1的第四个元素8加上w2的第二个元素12等于20.

注意：如果两个向量的长度不同，R将利用循环规则，该规则重复较短的向量元素，直到得到的向量长度与较长的向量的长度一样

等差数列的创建

> seq(1,-9);seq(1.9) # 只给出首项和尾项，by自动匹配为1或-1
 [1]  1  0 -1 -2 -3 -4 -5 -6 -7 -8 -9
[1] 1
> seq(1,-9,length.out = 5) # 给出首项和尾项数据以及长度，自动计算等差
[1]  1.0 -1.5 -4.0 -6.5 -9.0
> seq(1,-9,by=-2) # 给出首项和尾项数据以及步长，自动计算长度
[1]  1 -1 -3 -5 -7 -9
> seq(1,by=2,length.out = 10) # 给出首项和步长以及长度数据，自动计算尾项
 [1]  1  3  5  7  9 11 13 15 17 19

归纳：向量是一维的数据，但是在日常生活中很多数据是二维或者多维的数据，接下来介绍矩阵和数据框。

矩阵

矩阵是一个二维数组，每个元素都拥有相同的模式（数值型、字符型或逻辑型）。可以通过函数matrix创建矩阵。

一般的使用格式为：

mymatrix<-matrix(vector,nrow = number_of_rows,ncol = number_of_columns,
                 byrow = logical_value,dimnames = list(char_vector_rownames,char_vector_colnames))

其中，vector包含矩阵的元素，nrow和ncol用以指定行和列的维数，dimnames包含了可选的、以字符型向量表示的行名和列名。选项byrow则表明矩阵应当按行填充（byrow=TRUE)还是按列填充（byrow=FALSE)，默认情况下是按列填充

创建矩阵

代码清单

w<-seq(1,10)

(a<-matrix(w,nrow=5,ncol=2))# nrow和ncol用以指定行和列的维数
(b<-matrix(w,nrow = 5,ncol = 2,byrow = T)) # 按行填充
(d<-matrix(w,nrow=5,ncol = 2,byrow = T,dimnames = list(paste0("r",1:5),paste0(list("l",1:2))))) #给行和列设置名称

> (a<-matrix(w,nrow=5,ncol=2))#
     [,1] [,2]
[1,]    1    6
[2,]    2    7
[3,]    3    8
[4,]    4    9
[5,]    5   10

> (b<-matrix(w,nrow = 5,ncol = 2,byrow = T))
     [,1] [,2]
[1,]    1    2
[2,]    3    4
[3,]    5    6
[4,]    7    8
[5,]    9   10

> (d<-matrix(w,nrow=5,ncol = 2,byrow = T,dimnames = list(paste0("r",1:5),paste0(list("l",1:2)))))
   l 1:2
r1 1   2
r2 3   4
r3 5   6
r4 7   8
r5 9  10

矩阵下标的使用

我们可以使用下表和方括号来选择矩阵中的行、列或元素。x[i,]选择矩阵x中的第i行，x[,j]选择矩阵x中的第j列，x[i,j]选择矩阵x中的第i行第j列的元素。选择多行或多列的时候，下标i和j可为数值型向量

(m<-matrix(1:20,nrow=4))
(mr2<-m[2,])# 选择第2行
(mc4<-m[,4]) #选择第4列
(m45<-m[4,5]) #选择第4行第5列的元素
(mk<-m[c(1,2),c(1,2)])# 选择前两行和前两列的元素

> (m<-matrix(1:20,nrow=4))
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    5    9   13   17
[2,]    2    6   10   14   18
[3,]    3    7   11   15   19
[4,]    4    8   12   16   20

> (mr2<-m[2,])# 选择第2行
[1]  2  6 10 14 18

> (mc4<-m[,4]) #选择第4列
[1] 13 14 15 16

> (m45<-m[4,5]) #选择第4行第5列的元素
[1] 20

> (mk<-m[c(1,2),c(1,2)])# 选择前两行和前两列的元素
     [,1] [,2]
[1,]    1    5
[2,]    2    6

矩阵的合并

# 矩阵的合并
(x1<-rbind(c(1,2),c(3,4)))
(x2<-10+x1)
(x3<-cbind(x1,x2))# 列合并，小的矩阵合并成更宽的矩阵
(x4<-rbind(x1,x2)) # 行合并，小的矩阵合并成更长的矩阵
cbind(1,x1)
rbind(1,x1)

> (x1<-rbind(c(1,2),c(3,4)))
     [,1] [,2]
[1,]    1    2
[2,]    3    4

> (x2<-10+x1)
     [,1] [,2]
[1,]   11   12
[2,]   13   14

> (x3<-cbind(x1,x2))#
     [,1] [,2] [,3] [,4]
[1,]    1    2   11   12
[2,]    3    4   13   14

> (x4<-rbind(x1,x2)) #
     [,1] [,2]
[1,]    1    2
[2,]    3    4
[3,]   11   12
[4,]   13   14

> cbind(1,x1)
     [,1] [,2] [,3]
[1,]    1    1    2
[2,]    1    3    4

> rbind(1,x1)
     [,1] [,2]
[1,]    1    1
[2,]    1    2
[3,]    3    4

数组

在R语言中，可以认为数组是矩阵的扩展，它将矩阵扩展到2维以上。如果给定的数组是一维的，则相当于向量，二维的相当于矩阵。

数组可以通过array函数创建，格式如下：

myarray<-array(vector,dimensions,dimnames)

其中vector包含数组中的数据，dimensions是一个数值型向量，给出各个维度下标的最大值，而dimnames是可选的，各维度名称的列表。

创建数组

ar1<-array(1:3)#相当于一维的向量：1 2 3
ar2<-array(1:6,dim = c(2,3))#相当于2行3列的矩阵
ar3<-array(1:24,dim = c(3,4,2))#相当于创建3×4×2维的数组
#给出各维度的名称标签
dim1<-c("a1","a2")
dim2<-c("b1","b2","b3")
dim3<-c("C1","C2","C3","C4")
myarray<-array(1:24,c(2,3,4),dimnames = list(dim1,dim2,dim3))
myarray

> myarray
, , C1

   b1 b2 b3
a1  1  3  5
a2  2  4  6

, , C2

   b1 b2 b3
a1  7  9 11
a2  8 10 12

, , C3

   b1 b2 b3
a1 13 15 17
a2 14 16 18

, , C4

   b1 b2 b3
a1 19 21 23
a2 20 22 24

选取数组中的元素

myarray[1,2,3]#获取单个元素的值
myarray["a1","b1","C1"]#通过维度的名称来获取元素值
myarray[1,,]#组合元素值，获取第1个维度的第一个水平的所有组合元素值
myarray[2,1,]#获取第1个维度的第2个水平和第2个维度的第1个水平的所有元素值

> myarray[1,2,3]#获取单个元素的值
[1] 15

> myarray["a1","b1","C1"]
[1] 1

> myarray[1,,]
   C1 C2 C3 C4
b1  1  7 13 19
b2  3  9 15 21
b3  5 11 17 23

> myarray[2,1,]#获取第1个维度的第2个水平和第2个维度的第1个水平的所有元素值
C1 C2 C3 C4 
 2  8 14 20

数据框

由于不同的列可以包含不同的模式（数值型、字符型等）的数据，数据框的概念较矩阵来说更为一般。

读取excel/txt等格式数据集的时候，也是以数据框对象输入
数据分析算法函数的输入对象都是数据框对象
数据框可通过==data.frame()==创建

常用的格式

mydata<-data.frame(col1,col2,col3,……)

其中的列向量col1,col2,col3，……可谓任何类型（如字符型、数值型或逻辑型）。每一列的名称可由函数names指定。

创建数据框

site<-c("a","b","c","d","e")
number<-c(1:5)
luoji<-c(T,F,T,F,T)
(DT<-data.frame(site,number,luoji))
names(DT)#读取数据框的列名
names(DT)[1]<-"Aw" #修改第一列列名为Aw
names(DT)

> (DT<-data.frame(site,number,luoji))
  site number luoji
1    a      1  TRUE
2    b      2 FALSE
3    c      3  TRUE
4    d      4 FALSE
5    e      5  TRUE

> names(DT)#读取数据框的列名
[1] "site"   "number" "luoji" 

> names(DT)[1]<-"Aw" #修改第一列列名为Aw
> names(DT)
[1] "Aw"     "number" "luoji"

注意：每一列的数据的模式必须唯一，不过你却可以将多个模式的不同列放到一起组成数据框。

选取数据框的元素

选取数据框中元素的方式有若干种，可以使用前述（如矩阵）下标记号，亦可直接指定列名。

DT[1:2]# 下标的方式
DT[c("Aw","luoji")] # 指定列名
DT$Aw #记号$

第三个例子中的记号$是新出现的，它被用来选取一个给定数据框的某个特定变量。

> DT[1:2]
  Aw number
1  a      1
2  b      2
3  c      3
4  d      4
5  e      5

> DT[c("Aw","luoji")]
  Aw luoji
1  a  TRUE
2  b FALSE
3  c  TRUE
4  d FALSE
5  e  TRUE

> DT$Aw
[1] a b c d e

如果想要生成Aw和luoji两个变量的列联表，以下代码可以实现

> table(DT$Aw,DT$luoji)
   
    FALSE TRUE
  a     0    1
  b     1    0
  c     0    1
  d     1    0
  e     0    1

每个变量名前都键入一次DT很浪费时间，可以采用attach()函数和detach()函数来实现。其中attach()是将数据框绑定到R的搜索路径中，R中遇到一个变量名以后，将检查搜索路径中的数据框，以定位到这个变量。detach()是解除绑定。

attach(DT) 
table(Aw,luoji)
detach(DT) # 解除绑定

因子

变量可归结为名义型、有序型或连续型变量。名义型变量是没有顺序之分的类别变量。糖尿病类型Diabetes（Type1、Type2）是名义型变量的一例。即使在数据中Type1编码为1而Type2编码为2，这也并不意味着二者是有序的。有序型变量表示一种顺序关系，而非数量关系。病情Status（poor, improved, excellent）是顺序型变量的一个上佳示例。我们明白，病情为poor（较差）病人的状态不如improved（病情好转）的病人，但并不知道相差多少。连续型变量可以呈现为某个范围内的任意值，并同时表示了顺序和数量。年龄Age就是一个连续型变量，它能够表示像14.5或22.8这样的值以及其间的其他任意值。很清楚，15岁的人比14岁的人年长一岁。类别（名义型）变量和有序类别（有序型）变量在R中称为因子（factor）

函数factor()以一个整数向量的形式存储类别值，整数的取值范围是[1… k ]（其中k 是名义型变量中唯一值的个数），同时一个由字符串（原始值）组成的内部向量将映射到这些整数上。

名义型变量

diabetes<-c("Type1","Type2","Type3","Type1")

语句diabetes <- factor(diabetes)将此向量存储为(1, 2, 1, 1)，并在内部将其关联为1=Type1和2=Type2（具体赋值根据字母顺序而定）。针对向量diabetes进行的任何分析都会将其作为名义型变量对待，并自动选择适合这一测量尺度的统计方法。

> diabetes<-c("Type1","Type2","Type3","Type1")
> diabetes<-factor(diabetes)
> mode(diabetes)
[1] "numeric"
> diabetes
[1] Type1 Type2 Type3 Type1
Levels: Type1 Type2 Type3

有序型变量

要表示有序型变量，需要为函数factor()指定参数ordered=TRUE。

state<-c("Poor","Imporoved","Excellent","Poor")

> status<-factor(status,ordered = TRUE)
> mode(status)
[1] "numeric"
> status
[1] Poor      Excellent Improved  Poor     
Levels: Excellent < Improved < Poor

语句status <- factor(status, ordered=TRUE)会将向量编码为(3, 2, 1, 3)，并在内部将这些值关联为1=Excellent、2=Improved以及3=Poor。另外，针对此向量进行的任何分析都会将其作为有序型变量对待，并自动选择合适的统计方法。

对于字符型向量，因子的水平默认依字母顺序创建。这对于因子status是有意义的，因为“Excellent”、“Improved”、“Poor”的排序方式恰好与逻辑顺序相一致。如果“Poor”被编码为“Ailing”，会有问题，因为顺序将为“Ailing”、“Excellent”、“Improved”。如果理想中的顺序是“Poor”、“Improved”、“Excellent”，则会出现类似的问题。按默认的字母顺序排序的因子很少能够让人满意。

可以通过指定levels选项来覆盖默认排序

newstatus<-factor(status,ordered = TRUE,levels = c("Poor","Improved","Excellent"))
newstatus

[1] Poor      Excellent Improved  Poor     
Levels: Poor < Improved < Excellent

各水平的赋值将为1=Poor、2=Improved、3=Excellent。请保证指定的水平与数据中的真实值相匹配，因为任何在数据中出现而未在参数中列举的数据都将被设为缺失值。

创建因子

patientid<-c(1:4)
diabetes<-c("Type1","Type2","Type3","Type1")
status<-c("Poor","Excellent","Improved","Poor")
diabetes<-factor(diabetes)
status<-factor(status,ordered = TRUE)
#将数据合并为一个数据框
patientdata<-data.frame(patientid,diabetes,status)
str(patientdata)#输出对象的结构
summary(patientdata)#显示对象的统计概要

> str(patientdata)#输出对象的结构
'data.frame':	4 obs. of  3 variables:
 $ patientid: int  1 2 3 4
 $ diabetes : Factor w/ 3 levels "Type1","Type2",..: 1 2 3 1
 $ status   : Ord.factor w/ 3 levels "Excellent"<"Improved"<..: 3 1 2 3

> summary(patientdata)#显示对象的统计概要
   patientid     diabetes       status 
 Min.   :1.00   Type1:2   Excellent:1  
 1st Qu.:1.75   Type2:1   Improved :1  
 Median :2.50   Type3:1   Poor     :2  
 Mean   :2.50                          
 3rd Qu.:3.25                          
 Max.   :4.00

首先，以向量的形式输入了数据。然后，将diabetes和status分别指定为一个普通因子和一个有序型因子。最后，将数据合并为一个数据框。函数str(object)可提供R中某个对象（本例中为数据框）的信息。它清楚地显示diabetes是一个因子，而status是一个有序型因子，以及此数据框在内部是如何进行编码的。

注意，函summary()会区别对待各个变量。它显示了连续型变量=的最小值、最大值、均值和各四分位数，并显示了类别型变量diabetes和status（各水平）的频数值。

列表

R语言中的列表与R语言中的向量、数组和矩阵不同，它的每个分量的数据类型可以是不同的

列表是对象的集合，可以包含向量、矩阵、数组，数据框，甚至是另外一个列表，且在列表中要求每一个成分都要有一个名称。

列表中的对象又称为它的分量（components）。

在R语言中可以使用==list()==函数来创建列表，其语法格式为：

mylist<-list(name1=object1,name2=object2,……)

创建列表

a<-c("A同学","B同学","c同学")
b<-c("数学","计算机","英语")
e<-c(88,89,99)
mylist<-list(st.name=a,major.course=b,test.grade=e)
mylist

$st.name
[1] "A同学" "B同学" "c同学"

$major.course
[1] "数学"   "计算机" "英语"  

$test.grade
[1] 88 89 99

列表的索引

mylist[1]#访问列表中的第一个成分，返回结果为一个列表

mylist[[1]]#访问列表中的第一个成分的元素值，这次仅是元素值，是向量，不是列表

mylist[[1]][1]#访问列表中的第一个成分的第一个元素值

mylist[[1:2]]#访问列表中的第一个到第二个成分

mylist[c(1,3)]#访问列表中的第一个和第三个成分

mylist$st.name#访问列表中名称为st.name的元素值

mylist$st.name[1]#访问列表中名称为st.name中的第一个元素值

mylist["major.course"]#访问列表中名称为major的成分，其结果为一个列表

mylist[["major.course"]]#访问列表中名称为major的元素值

mylist["major.course"][1]#访问列表中名称为st.name中的第一个元素值

编辑列表

修改某个成分的元素值

mylist[[1]][1] = '李小东'
mylist$st.name[2] = '黄铭'
mylist[["st.name"]][3] = '陆远风'
mylist

$st.name
[1] "李小东" "黄铭"   "陆远风"

$major.course
[1] "数学"   "计算机" "英语"  

$test.grade
[1] 88 89 99

修改某一成分的所有值

mylist$major.course = c("数学分析","计算机思维与结构", "大学英语")
mylist[[3]] = c(88.3,89.2,99.1)
mylist

$st.name
[1] "李小东" "黄铭"   "陆远风"

$major.course
[1] "数学分析"         "计算机思维与结构" "大学英语"        

$test.grade
[1] 88.3 89.2 99.1

添加一个成分

mylist$no<-c(1601,1602,1603)
mylist<-c(mylist,hobby = list(c("篮球","排球","羽毛球")))

删除某一个成分

mylist$st.name = NULL
mylist[1] = NULL
mylist[-1]

数据的读取

读取文本文件

# 数据的导入
# 设置工作路径
setwd("D:/data")
getwd()
# 另外一种路径的设置
#setwd("D:\\data")

#文本文件的导入
importtxt<-read.table("iris.txt",header = TRUE)
#header=TRUE表示数据文件第一行中带有变量名。因为table默认的分隔符是空格，和txt一致，所以不需要进行分隔符的参数设置

importcsv<-read.table("iris.csv",header=T,sep=",")
#默认情况下，R语言会认为第一行的是数据的标题，假如你的数据的第一行并不是标题，可以设置header=F
#对于csv文件，还可以利用read.csv读取
importcsv2<-read.csv("iris.csv",header = T)

#查看前5行，默认是前6行
head(importtxt[c(1:5),])
head(importcsv2)

> head(importtxt[c(1:5),])
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa


> head(importcsv2)
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa

读取非结构化文本文件

使用readLines()函数，按行读入数据

# 读取非结构化文本文件，每行的长度都不一样
unstructuredtxt<-readLines("unstructuredText.txt")

unstructuredtxt

> unstructuredtxt
[1] "R语言是一套开源的数据分析解决方案，几乎可以独立完成数据处理、数据可视化、数据建模及模型评估等工作，而且可以完美配合其他工具进行数据交互。具体来说，R语言具有以下优势："
[2] "1）高效的数据处理能力"                                                                                                                                                 
[3] "2）数据分析"                                                                                                                                                           
[4] "3）数据可视化"                                                                                                                                                         
[5] "4）通过庞大的R程序包库文件进行扩展"

读取网络数据

网址：http://www.justinmrao.com/salary_data.csv

salarydata<-read.csv("http://www.justinmrao.com/salary_data.csv")
head(salarydata[c(1:3),])

> head(salarydata[c(1:3),])
                 team    year       player contract_years_remaining contract_thru position full_name
1      Boston Celtics 2002-03 Bremer, J.R.                        1       2002-03        G    Bremer
2 Cleveland Cavaliers 2003-04 Bremer, J.R.                        1       2003-04        G    Bremer
3   Charlotte Hornets 2001-02  Brown, P.J.                        7       2002-03        F     Brown
  salary_year salary_total year_counter obs mean_salary mean_remaining
1      349458       349458            1   2    456568.5              1
2      563679       563679            2   2    456568.5              1
3     6404800     36000000            1   6   7668267.0              5

R语言的基础绘图

散点图

普通散点图

par(mfrow=c(1,2)) # 绘制一行两列的散点图
plot(x=rnorm(10))
plot(women)

散点图矩阵

plot(iris[,1:4],main="利用plot函数绘制散点图矩阵")
pairs(iris[,1:4],main="利用pairs函数绘制散点图矩阵")

柱状图和条形图

#柱状图和条形图
par(mfrow=c(1,2))
for (i in c(F,T)) {barplot(VADeaths,horiz = i,beside = T,col = rainbow(5))
}#当horiz=T,绘制条形图，F则绘制柱状图

绘制饼图

pie(table(mtcars$cyl))#绘制饼图

绘制Q-Q图

qqnorm(economics$psavert)

箱线图

boxplot(iris$Sepal.Length~iris$Species,col=rainbow(3))

茎叶图

> stem(mtcars$wt)

  The decimal point is at the |

  1 | 5689
  2 | 123
  2 | 56889
  3 | 22224444
  3 | 55667888
  4 | 1
  4 | 
  5 | 334

点图

#点图
dotchart(mtcars$mpg,labels = rownames(mtcars))

R语言描述性统计分析

平均数

> xmean<-mean(x)
> (xmean<-mean(x))
[1] 5.5

中位数

> (xmedian<-median(x))
[1] 5.5

百分位数

描述性统计函数

summary()函数

> vars<-c("mpg","hp","wt")#重点关注每加仑汽油行驶英里数（mpg）、马力（hp）和车重（wt）
> summary(mtcars[vars])
      mpg              hp              wt       
 Min.   :10.40   Min.   : 52.0   Min.   :1.513  
 1st Qu.:15.43   1st Qu.: 96.5   1st Qu.:2.581  
 Median :19.20   Median :123.0   Median :3.325  
 Mean   :20.09   Mean   :146.7   Mean   :3.217  
 3rd Qu.:22.80   3rd Qu.:180.0   3rd Qu.:3.610  
 Max.   :33.90   Max.   :335.0   Max.   :5.424  

> summary(iris[,5])# 对因子变量进行频数统计
    setosa versicolor  virginica 
        50         50         50

Hmisc包中的describe()函数

library(Hmisc)
describe(mtcars[vars])

mtcars[vars] 

 3  Variables      32  Observations
---------------------------------------------------------------------------------------------------------
mpg 
       n  missing distinct     Info     Mean      Gmd      .05      .10      .25      .50      .75 
      32        0       25    0.999    20.09    6.796    12.00    14.34    15.43    19.20    22.80 
     .90      .95 
   30.09    31.30 

lowest : 10.4 13.3 14.3 14.7 15.0, highest: 26.0 27.3 30.4 32.4 33.9
---------------------------------------------------------------------------------------------------------
hp 
       n  missing distinct     Info     Mean      Gmd      .05      .10      .25      .50      .75 
      32        0       22    0.997    146.7    77.04    63.65    66.00    96.50   123.00   180.00 
     .90      .95 
  243.50   253.55 

lowest :  52  62  65  66  91, highest: 215 230 245 264 335
---------------------------------------------------------------------------------------------------------
wt 
       n  missing distinct     Info     Mean      Gmd      .05      .10      .25      .50      .75 
      32        0       29    0.999    3.217    1.089    1.736    1.956    2.581    3.325    3.610 
     .90      .95 
   4.048    5.293 

lowest : 1.513 1.615 1.835 1.935 2.140, highest: 3.845 4.070 5.250 5.345 5.424
---------------------------------------------------------------------------------------------------------

参考资料

Robert Kabacoff. Data Analysis and Graphics with R[M]. The United States of America：Manning Publications.2011.
高涛,肖楠,陈钢. R语言实战[M]. 北京：人民邮电出版社, 2013.
天善智能_R语言快速入门
https://baijiahao.baidu.com/s?id=1609504979912550722&wfr=spider&for=pc
https://baijiahao.baidu.com/s?id=1578027914319223370&wfr=spider&for=pc
https://baijiahao.baidu.com/s?id=1609601023572921783&wfr=spider&for=pc
https://jingyan.baidu.com/article/48a42057ef3ba2a924250429.html
https://www.cnblogs.com/xuancaoyy/p/5309966.html

你可能感兴趣的:(R)

【数据分析】通过个体和遗址层面的遗传相关性网络分析生信学习者1 数据分析数据分析数据挖掘 r语言数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍原理应用场景加载R包数据下载函数个体层面的遗传相关性网络分析导入数据数据预处理构建遗传相关性的个体网络对个体网络Nij进行可视化评估和选择最佳模型评估和选择最佳模型最佳模型进行总结拟合优度检验遗址层面的遗传相关性网络分析导入数据数据预处理构建遗址之间的遗传相关性网络可视化图条件边预测与模型评估总结系统信息介绍个
大模型（含deepseek r1）本地部署利器ollama的API操作指南人工智能llm
ollama介绍：Ollama是一个开源的大型语言模型（LLM）平台，旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。它支持多种预训练的大型语言模型（如LLaMA2、Mistral、Gemma、DeepSeek等），并提供了一个简单高效的方式来加载和使用这些模型。出现Error:somethingwentwrong,pleaseseetheollamaserverlogsfordet
【系统设计】忘记MySQL密码，应该如何重置红烧白开水。 mysql 数据库开发语言数据关系型数据库密码重置
如果在电脑上安装的MySQL数据库忘记了密码，可以通过以下步骤重置密码。具体操作因操作系统和MySQL版本略有不同，但总体流程类似：步骤1：停止MySQL服务首先需要停止正在运行的MySQL服务。Linux/macOSsudosystemctlstopmysql#或sudoservicemysqlstopWindows按Win+R，输入services.msc并回车。找到MySQL服务，右键选择停
《DeepSeek-R1 vs ChatGPT-4：AI大模型“王座争夺战”的终极拆解报告》 Athena-H LLM 人工智能 gpt chatgpt ai
引言：大模型时代的双雄博弈在生成式AI爆发式迭代的今天，DeepSeek-R1与ChatGPT-4分别以“中国智造新锐”与“全球标杆王者”的身份，掀起技术路线与应用生态的激烈碰撞。本文从架构设计、场景适配、性能极限三大维度，揭示两大模型的真实战力图谱。一、核心技术架构：差异化路线对决对比维度DeepSeek-R1ChatGPT-4模型架构多模态混合专家模型（MoE+Transformer）纯Dec
文件与目录操作函数详解归零 dddd c语言 linux 算法
在编程中，文件和目录操作是常见的任务。本文将详细讲解常用的文件操作函数和目录操作函数，包括其功能、参数、使用方法，并通过示例代码展示如何用这些函数实现常见的操作。文件操作函数1.1fopen()函数功能：打开或创建文件。参数：constchar*pathname：文件名。constchar*mode：文件操作模式。常见的模式有："r"：只读模式，文件必须存在。"w"：只写模式，文件不存在则创建，存
idea快捷键 yiqi_perss 日常 intellij-idea java ide
idea快捷键ctrl+`可以切换界面CTRL快捷键介绍Ctrl+`切换界面Ctrl+E打开最近访问的文件Ctrl+shift+e打开你最近编辑的文本Ctrl+R在当前文件进行文本替换（必备）Ctrl+F在当前文件进行文本查找（必备）Ctrl+Z撤销（必备）Ctrl+Y删除光标所在行或删除选中的行（必备）Ctrl+X剪切光标所在行或剪切选择内容Ctrl+C复制光标所在行或复制选择内容Ctrl+D复
1002:方便记忆的电话号码努力的小Qin
1002:方便记忆的电话号总时间限制:2000ms内存限制:65536kB描述英文字母（除Q和Z外）和电话号码存在着对应关系，如下所示：A,B,C->2D,E,F->3G,H,I->4J,K,L->5M,N,O->6P,R,S->7T,U,V->8W,X,Y->9标准的电话号码格式是xxx-xxxx，其中x表示0-9中的一个数字。有时为了方便记忆电话号码，我们会将电话号码的数字转变为英文字母，如把
vue3+vite 自动引入export default的包大橙子- vue.js 前端
importautoImportfrom'unplugin-auto-import/vite';exportdefaultdefineConfig({plugins:[vue(),vueJsx(),autoImport({imports:['vue','vue-router','pinia',{//相当于importuseRouterStackStorefrom'@/store/modules/r
零基础学Python图片处理：用Pillow库轻松玩转修图小彭爱学习 python python pillow python处理图片
零基础学Python图片处理：用Pillow库轻松玩转修图一、初识Pillow：你的第一张数码暗房安装准备（只需要1分钟）打开电脑的命令行（Windows按Win+R输入cmd，Mac打开终端），输入：pipinstallpillow看到「SuccessfullyinstalledPillow-x.x.x」就安装成功啦！图片处理四步走打开图片：像打开文件柜一样找到图片修改图片：裁剪、调色、加特效查
ansible部署ceph 时空无限 ceph ansible ceph linux
前言：ceph的官网有坑。按照官网部署，不会一蹴而就。会遇到各种各样的问题，ceph文档有待改进。环境操作系统cat/etc/redhat-releaseCentOSLinuxrelease8.5.2111uname-r4.18.0-80.el8.x86_64主机名三台主机，其中node-01为部署机器和ceph的其中一个节点。node-01node-02node-03网卡和ip每台主机双网卡en
本地运行 DeepSeek-R1 的成本究竟多高？前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读本地运行DeepSeek-R1的成本究竟多高？DeepSeek让人们对大规模生成式模型的追求更进一步，甚至有人想在本地跑下规模高达671B参数的版本。但要在家里开这种“巨无霸”，可不是闹着玩的：光是推理就对硬件提出了非常高的要求。这篇文章将大致拆解一下，如果真想在个人电脑上运行DeepSeek-R1，可能需
R语言中的函数32：seq_along() zoujiahui_2018 #R语言中的函数 r语言开发语言
介绍seq_along函数在R语言中用于生成一个整数序列，其长度与给定对象的长度相同。这个函数特别有用，当你想要创建一个索引序列来遍历一个向量或列表时。用法seq_along(x)参数x:任何R对象（如向量、列表等）。返回值:返回一个从1到x的长度的整数序列。示例#创建一个向量vec<-c("a","b","c")#使用seq_along生成索引indices<-seq_along(vec)pri
IPoIB 接收数据流程分析 109702008 编程 #C语言网络人工智能 linux 网络
1.引言IPoIB（InfiniBandoverIP）是一种将InfiniBand协议封装在IP网络中的技术，允许通过标准的以太网基础设施传输InfiniBand数据。本文将详细分析IPoIB驱动程序中接收数据的处理流程，重点关注关键函数的实现和数据处理的关键步骤。2.网络设备操作结构体staticconststructnet_device_opsipoib_netdev_default_pf_r
java脚本弹出输入框,使用弹出框编辑(增加)表单内容 jordan.xue java脚本弹出输入框
0、背景使用Amazeui中Prompt模态窗口Modal1、JQuery功能：表单复位获取表单的值，并显示在修改弹出框中(文本框、单选、多选、下拉框)发送Post异步请求给后台自刷新$(function(){//编辑功能$('table.edit').on("click",function(){//表单复位document.getElementById("form-machineRole").r
最少前缀操作问题--感受不到动态规划，怎么办怎么办幼儿园口算大王算法 java 动态规划
题目：标签：动态规划（应该是双指针的，不理解）小U和小R有两个字符串，分别是S和T，现在小U需要通过对S进行若干次操作，使其变成T的一个前缀。操作可以是修改S的某一个字符，或者删除S末尾的字符。现在你需要帮助小U计算出，最少需要多少次操作才能让S变成T的前缀。测试样例样例1：输入：S="aba",T="abb"输出：1样例2：输入：S="abcd",T="efg"输出：4样例3：输入：S="xyz
文件包含lfi.php使用三和三千万网络安全安全
使用这个脚本的前提是有文件包含点，也可以访问到phpinfo页面#!/usr/bin/pythonimportsysimportthreadingimportsocketdefsetup(host,port):TAG="SecurityTest"PAYLOAD="""%s\r')?>\r"""%TAGREQ1_DATA="""-----------------------------7dbff1d
ColD Fusion，分布式多任务微调的协同 “密码” 人工智能
ColDFusion，分布式多任务微调的协同“密码”发布时间：2025-02-19近日热文：1.全网最全的神经网络数学原理（代码和公式）直观解释2.大模型进化史：从Transformer到DeepSeek-R1的AI变革之路3.2W8000字深度剖析25种RAG变体：全网最全~没有之一知乎【柏企】公众号【柏企科技说】【柏企阅文】在预训练模型的基础上进行改进，有望提升所有基于它微调的模型性能。然而，
Day02 Python之文件操作（open、read、write、close）小菜鸟也要努力吖 Python python
一、file对象的属性1、file.name返回文件的名称2、file.mode返回文件的访问模式3、file.closed查看文件是否关闭，是TRUE，否FALSE二、访问模式r:只读模式(默认);文件必须存在w:只写模式;不存在则创建，存在则重写a:追加模式;不存在则创建,存在则只追加内容+：表示可以同时读写某个文件r+:可读写文件，文件不存在抛出异常w+:先写再读三、打开文件1、创建文件，内
Android 第四十四章 Menu 漂泊的蚂蚁 Android android
publicclassMainActivityextendsAppCompatActivity{@OverrideprotectedvoidonCreate(BundlesavedInstanceState){super.onCreate(savedInstanceState);setContentView(R.layout.activity_main);}@Overridepublicboole
火山引擎 DataWind ChatBI 适配 DeepSeek-R1 及 DeepSeek-V3 大数据
2025年2月，火山引擎智能数据洞察DataWind旗下AI助手ChatBI宣布实现对DeepSeek-R1及DeepSeek-V3的适配。通过融合豆包、DeepSeek等主流大模型的先进能力，ChatBI正在为企业用户带来精准、智能的数据分析体验。作为Data+AI领域的先行者，DataWind一直致力于帮助业务达到最好的实践成果，DataWind对主流大模型始终保持高效的开放探索态度，融合前沿
DeepSeek-r1 与 RAG工作流的无缝结合：应对复杂问题的新方式 deepseekllm
ByDeanSacoranskyandDenizAskin原文标题：推理与递归检索：Deepseek-r1、Tavily和LangGraphDeepSeek-r1的影响DeepSeek在不到一个月前公开发布了r1模型。突然间，每个人都可以访问强大的推理模型，用于应用和模型开发。在这篇文章中，我们提出了一种简单的代理工作流，使DeepSeek-r1能够代理性地执行信息检索！该系统能够准确地回答复杂的
芯麦GC1267R单相双极驱动电机预驱动器解析：变速功能与PWM兼容性设计深圳市青牛科技实业有限公司小芋圆芯麦单片机智能马桶摄像机机器人技术电动牙刷
一、芯片概述芯麦GC1267R是一款专为低电压单相双极步进电机或直流有刷电机设计的预驱动芯片，集成了高效的驱动逻辑和保护功能，支持PWM调速和外部信号控制，广泛应用于智能家居、工业设备、医疗仪器等领域。其核心特性包括：单相双极驱动架构：支持全桥驱动，适配低至2.5V的电机电压。PWM兼容性：可通过外部PWM信号实现精准调速（频率范围1kHz~100kHz）。低功耗设计：静态电流低至1μA（休眠模式
国产银河麒麟v10操作系统添加epel源菜菜艾运维FAQ 运维服务器 linux 笔记数据库
国产银河麒麟V10操作系统添加epel源记录一、注意事项二、具体操作三、最后一、注意事项1、操作系内核版本与架构即就是指令集uname-a/uname-r可查看系统内核与指令集，本次我以内核版本4.19.90，系统架构为aarch64为例进行记录2、移除原有的epel源注意记得备份二、具体操作1、进入配置目录并创建文件cd/etc/yum.repos.dvimepel-kylin.repo2、将以
r720换固态硬盘后如何重装系统_联想拯救者 R720 换装三星 960PRO 512G固态硬盘、重做系统与测试... weixin_39583222
联想拯救者R720换装三星960PRO512G固态硬盘、重做系统与测试2017-07-2410:00:0031点赞156收藏86评论R屏、SSD、机械键盘乃近10年以来用过了就再也用不回去的三项败家科技.....用的第一块固态硬盘是英睿达M550120G，当时是换到笔记本里面的，第一次用的时候，爽呆了！感觉整个世界都起飞了！后来给台式机装了850Pro256G，又装了一块英睿达MX200250G，
联想拯救者R720重装Win10系统的正确姿势 chuigankeng6995 操作系统
2017年最火爆的笔记本子当属联想拯救者R720,很多人用它玩吃鸡游戏，这款机型购买时，有的选的是无固态版本,也有的自行加装固态，也有的买来时就是固态+机械双硬盘。问题一：加装固态的话，必须选择M.2接口NVMe协议的SSD，注意不是所有M.2接口的固态都支持，比如M.2接口走SATA协议的不支持。问题二：加装完固态，装系统或是进U盘PE找不到固态(检测不到固态)，这是什么问题？上面说了，如果M2
【算法】快排 Liu_Meihao 算法
题目快排思路如果输入为0或1直接返回；否则取一个基准值，可以取中间位置，如果输入是有序的可以避免时间过长，然后移动指针，先让i指针右移，如果小于基准值就继续右移，j指针左移同理。如果指针都停住，再看iusingnamespacestd;voidquick_sort(intq[],intl,intr){if(l>=r)return;intx=q[(l+r)/2],i=l-1,j=r+1;while(
FreeSwitch的mod_distributor模块介绍【初步规划用来做路由优先级】狂爱代码的码农 VOIP那些事 freeswitch
FreeSWITCH的mod_distributor模块详解及应用场景模块概述mod_distributor是FreeSWITCH中一个用于动态分配呼叫或任务的模块，其核心功能是将传入的请求（如SIP呼叫、消息等）按预设策略分发到多个目标节点或坐席。它通常用于实现负载均衡、高可用性及灵活的呼叫路由。核心功能与工作原理分配策略：轮询（RoundRobin）：依次分配请求，确保各节点均匀负载。随机（R
Ubuntu 下 nginx-1.24.0 源码分析 - ngx_localtime 函数若云止水 nginx 运维
ngx_localtime函数声明在src\os\unix\ngx_time.h中：voidngx_localtime(time_ts,ngx_tm_t*tm);定义在src/os/unix/ngx_time.c中voidngx_localtime(time_ts,ngx_tm_t*tm){#if(NGX_HAVE_LOCALTIME_R)(void)localtime_r(&s,tm);#els
深入理解 Android 混淆规则 nukix android android
在Android开发中，混淆（Obfuscation）是一种保护代码安全的重要手段，通常通过ProGuard或R8工具来实现。本文将详细介绍Android混淆规则的基本原理、配置方法以及最佳实践，帮助开发者更好地保护应用代码。博主博客https://blog.uso6.comhttps://blog.csdn.net/dxk539687357什么是混淆？混淆是一种通过对代码进行重命名、删除无用代码
DeepSeek R1 模型详解与微调 zhangjiaofa DeepSeek R1&AI人工智能大模型 DeepSeek R1 思维链模型微调
目录引言DeepSeekR1模型概述DeepSeekR1模型架构3.1输入层3.2编码器层3.3解码器层3.4输出层DeepSeekR1核心原理
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》