vickyleexy

R语言数据分析、展现与实例（02）

数据输入

> mydata <- data.frame(age=numeric(0),gender=character(0),weight=numeric(0)) #创建空数据框
> mydata <- edit(mydata) 　　　#打开编辑框进行编辑，并将结果赋值给原数据框

　　
输入数据，直接退出即可保存

> mydata
  age gender weight
1   1      g      3
2   2      b      3
3   3      b      3
> mydata <- edit(mydata)    #直接打开编辑框也可进行变量的添加，在var双击即可
> fix(mydata)      #打开编辑框进行编辑，可直接保存到原文件
> mydata
  age gender weight
1   1      G      3
2   2      b      3
3   3      b      3
>

读文本文件数据

> (x=read.table("abc.txt"))
   V1     V2     V3
1 age gender weight
2   1      G      3
3   2      b      3
4   3      b      3

> abc <- read.table("D:/R_workspace/Dataguru/week2/abc.txt",header=T)
> abc
  age gender weight
1   1      G      3
2   2      b      3
3   3      b      3

在Rstudio中读取
在import dataset 中
文本或excel的数据均可通过剪贴板操作

> y<-read.table("clipboard",header = F)   #不读列头
> y
   V1     V2     V3
1 age gender weight
2   1      G      3
3   2      b      3
4   3      b      3
> y<-read.table("clipboard",header = T)  # 读列头
> y
  age gender weight
1   1      G      3
2   2      b      3
3   3      b      3

读excel文件数据
方法1：先把excel另存为空格分隔的prn文本格式再读

> w<- read.table("tt.prn",header = F)
> w
    V1   V2
1 商品 价格
2   12   21

　　方法2：安装RODBC包，再通过ODBC读
　　
　　　　

> library(RODBC)
> Z<- odbcConnectExcel("tt.xls")
> (w<-sqlFetch(Z,"Sheet1"))
  商品 价格
1   12   21
2   22   23
3   NA   NA
4   21   22
>

mistake：

> library(RODBC)
> Z<- odbcConnectExcel("tt.xls")
Error in odbcConnectExcel("tt.xls") : 
  odbcConnectExcel is only usable with 32-bit Windows

换成32bit的R运行即可

导入XML数据
XML包

安装XML包
> library(XML)
>  fileName<-system.file("exampleData","include.xml",package="XML")
> fileName
[1] "D:/R_library/XML/exampleData/include.xml"
> root<-xmlParse(fileName)            #用xmlParse读取文件
> root

<doc xmlns:xi="http://www.w3.org/2001/XInclude">
  <caveat>
    <para>This is a caveat that we repeat often.para>
  caveat>
  <section>
    <title>Atitle>

    <caveat>
      <para>This is a caveat that we repeat often.para>
    caveat>

  section>
  <section>
    <title>Btitle>

    <caveat>
      <para>This is a caveat that we repeat often.para>
    caveat>

  section>
doc>

读取SAS、SPSS、Stata文件
- foreign包
  - spss文件　read.spss()
  - SAS文件　read.xport()
  - Stata文件　read.dta()
- Hmisc包
  - SPSS文件　spss.get()

连接数据库

RODBC包

> library(RODBC)
> conn <- odbcConnectAccess2007(access.file = "D:/R_workspace/Dataguru/week2/Stock.accdb",uid = "test",pwd = "test")
> ZGSH <- sqlQuery(conn,"SELECT Stkcd,Trddt,Opnprc,Hiprc,Loprc,Clsprc,Adjprcwd,Dretwd FROM Stock WHERE Stkcd = 600028")
> View(ZGSH)
> ZGSH
　 ………………
> stk.query <- "SELECT Stock.Stkcd , Stock.Trddt , Stock.Adjprcwd , Stock.Dsmvosd FROM Stock INNER JOIN Company ON Stock.Stkcd = Company.Stkcd WHERE Company.Listdt <= #1/1/2009#"
> data.list.09 <- sqlQuery(conn , stk.query)
> View(data.list.09)
> View(data.list.09)
> close(conn)            #关闭数据库连接

mistake：
　　在RStudio中，若R包安装成功但无法加载，将安装library目录下的与R包同名的文件夹删除，再重新安装R包即可。

写数据文件

write()函数　　#主要保存矩阵和向量
write.table()函数
write. csv()函数

数据整理

了解当前数据状态
- head()与tail() 　　# 查看数据前六行后六行
- length()、dim()、ncol()、nrow()
- str()与ls()
选取数据子集
数据合并
数据的编辑
其他
了解当前

> head(ZGSH)
   Stkcd      Trddt Opnprc Hiprc Loprc Clsprc Adjprcwd    Dretwd
1 600028 2009-01-05   7.10  7.21  7.06   7.19 10.70134  0.024217
2 600028 2009-01-06   7.15  7.44  7.12   7.41 11.02878  0.030598
3 600028 2009-01-07   7.40  7.42  7.25   7.25 10.79064 -0.021592
4 600028 2009-01-08   7.14  7.16  6.96   7.14 10.62692 -0.015172
5 600028 2009-01-09   7.08  7.16  7.06   7.14 10.62692  0.000000
6 600028 2009-01-12   7.09  7.17  7.02   7.09 10.55251 -0.007003
> tail(ZGSH)
      Stkcd      Trddt Opnprc Hiprc Loprc Clsprc Adjprcwd    Dretwd
1199 600028 2013-12-24   4.62  4.64  4.52   4.57 10.43269 -0.008677
1200 600028 2013-12-25   4.57  4.61  4.54   4.58 10.45552  0.002188
1201 600028 2013-12-26   4.59  4.59  4.42   4.48 10.22724 -0.021834
1202 600028 2013-12-27   4.48  4.52  4.41   4.48 10.22724  0.000000
1203 600028 2013-12-30   4.50  4.51  4.42   4.43 10.11309 -0.011161
1204 600028 2013-12-31   4.41  4.50  4.41   4.48 10.22724  0.011287
> head(ZGSH,3)
   Stkcd      Trddt Opnprc Hiprc Loprc Clsprc Adjprcwd    Dretwd
1 600028 2009-01-05   7.10  7.21  7.06   7.19 10.70134  0.024217
2 600028 2009-01-06   7.15  7.44  7.12   7.41 11.02878  0.030598
3 600028 2009-01-07   7.40  7.42  7.25   7.25 10.79064 -0.021592
> length(c(1,2,3,4,5))     #查看数据长度
[1] 5
> dim(ZGSH)  #查看多维数据大小
[1] 1204    8
> nrow(ZGSH)
[1] 1204
> ncol(ZGSH)
[1] 8
> str(ZGSH)           #查看数据类型等
'data.frame':   1204 obs. of  8 variables:
 $ Stkcd   : int  600028 600028 600028 600028 600028 600028 600028 600028 600028 600028 ...
 $ Trddt   : Factor w/ 1204 levels "2009-01-05","2009-01-06",..: 1 2 3 4 5 6 7 8 9 10 ...
 $ Opnprc  : num  7.1 7.15 7.4 7.14 7.08 7.09 7.03 7.05 7.15 7.21 ...
 $ Hiprc   : num  7.21 7.44 7.42 7.16 7.16 7.17 7.11 7.25 7.25 7.59 ...
 $ Loprc   : num  7.06 7.12 7.25 6.96 7.06 7.02 6.97 7.02 7.11 7.21 ...
 $ Clsprc  : num  7.19 7.41 7.25 7.14 7.14 7.09 7.06 7.24 7.17 7.43 ...
 $ Adjprcwd: num  10.7 11 10.8 10.6 10.6 ...
 $ Dretwd  : num  0.0242 0.0306 -0.0216 -0.0152 0 ...
> ls(ZGSH)   #查看变量
[1] "Adjprcwd" "Clsprc"   "Dretwd"   "Hiprc"    "Loprc"    "Opnprc"   "Stkcd"    "Trddt"

选取数据子集

> y <- c(1,8,4,7,6,0,4)
> y[c(1,3)]
[1] 1 4
> y[2:4]
[1] 8 4 7
> x <- subset(y,y>3)     # 选取y中y>3的子集
> x
[1] 8 4 7 6 4
> which(y>3)       #返回y中y>3的元素的位置
[1] 2 3 4 5 7
> y[which(y>3)]
[1] 8 4 7 6 4
> a <- c(1,3,5)
> a[-2]        #去掉a中第二个元素
[1] 1 5
> x <- matrix (1:10, nrow = 2)
> x
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    3    5    7    9
[2,]    2    4    6    8   10
> x[,2]      #选取第二列
[1] 3 4
> x[1,c(4,5)]      #选取第一行第四列和第五列
[1] 7 9

数据框形式的选取
> x <- data.frame(x)    #将x转换成数据框的形式
> x
  X1 X2 X3 X4 X5
1  1  3  5  7  9
2  2  4  6  8 10
> x[,1]
[1] 1 2
> x[1]
  X1
1  1
2  2
> x$X1        #  "$"这个符号相当于“的”
[1] 1 2

# 列表的选取
> g <- "I am happy"
> h <- c(1,2,3,4)
> j <- matrix(1:9,nrow =3)
> k <- c("good","excellent","poor")
> mylist <- list(g,h,j,k)
> mylist
[[1]]
[1] "I am happy"

[[2]]
[1] 1 2 3 4

[[3]]
     [,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9

[[4]]
[1] "good"      "excellent" "poor"     

> mylist[3]           #用一个中括号选取出来还是一个list
[[1]]
     [,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9

> mylist[[3]]      # 用两个中括号选取处理啊就是数据原本的格式
     [,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9

数据的合并

> x <- 1:3
> y <- c(3,4,5)
> c(x,y)               #向量的合并
[1] 1 2 3 3 4 5

#矩阵合并
> cbind(1,1:4)     #按行合并
     [,1] [,2]
[1,]    1    1
[2,]    1    2
[3,]    1    3
[4,]    1    4
> rbind(1:2,1:6)      #按列合并
     [,1] [,2] [,3] [,4] [,5] [,6]
[1,]    1    2    1    2    1    2
[2,]    1    2    3    4    5    6


#数据框的合并
> authors <- data.frame(
+     surname = I(c("Tukey", "Venables", "Tierney", "Ripley", "McNeil")),
+     nationality = c("US", "Australia", "US", "UK", "Australia"),
+     deceased = c("yes", rep("no", 4)) )
> authors
   surname nationality deceased
1    Tukey          US      yes
2 Venables   Australia       no
3  Tierney          US       no
4   Ripley          UK       no
5   McNeil   Australia       no
> books <- data.frame(
+     name = I(c("Tukey", "Venables", "Tierney",
+                "Ripley", "Ripley", "McNeil", "R Core")),
+     title = c("Exploratory Data Analysis",
+               "Modern Applied Statistics ...",
+               "LISP -STAT",
+               "Spatial Statistics", "Stochastic Simulation",
+               "Interactive Data Analysis",
+               "An Introduction to R"),
+     other.author = c(NA, "Ripley", NA, NA, NA, NA,
+                      "Venables & Smith"))
> books
      name                         title     other.author
1    Tukey     Exploratory Data Analysis             <NA>
2 Venables Modern Applied Statistics ...           Ripley
3  Tierney                    LISP -STAT             <NA>
4   Ripley            Spatial Statistics             <NA>
5   Ripley         Stochastic Simulation             <NA>
6   McNeil     Interactive Data Analysis             <NA>
7   R Core          An Introduction to R Venables & Smith
> merge(authors,books,by.x = "surname", by.y ="name",all = TRUE)
   surname nationality deceased                         title
1   McNeil   Australia       no     Interactive Data Analysis
2   R Core        <NA>     <NA>          An Introduction to R
3   Ripley          UK       no            Spatial Statistics
4   Ripley          UK       no         Stochastic Simulation
5  Tierney          US       no                    LISP -STAT
6    Tukey          US      yes     Exploratory Data Analysis
7 Venables   Australia       no Modern Applied Statistics ...
      other.author
1             <NA>
2 Venables & Smith
3             <NA>
4             <NA>
5             <NA>
6             <NA>
7           Ripley
> paste("A",1:6,sep = "")      #连接A和1:6 中间不加字符
[1] "A1" "A2" "A3" "A4" "A5" "A6"
> paste("A",1:6,sep = "@")      #连接A和1:6，中间以@连接
[1] "A@1" "A@2" "A@3" "A@4" "A@5" "A@6"

删除对象列表

> aa <-1:4
> aa
[1] 1 2 3 4
> rm(aa)
> aa
Error: object 'aa' not found

删除缺失值

> omit <- read.csv("D:/R_workspace/Dataguru/week2/omit.csv",header = T)
> omit
  cd   Trddit Opnprc Hipri
1  1     <NA>     12   5.5
2  1 2009/1/3     21    NA
3  1 2009/1/2     12   2.3
4  1 2009/2/3     32   2.3
5  1 2009/2/3     43   2.1
6  1 2009/1/2    543   9.1
> omit1 <- na.omit(omit)        #删除omit文件中的缺失值，并将处理后的文件存入omit1
> omit1
  cd   Trddit Opnprc Hipri
3  1 2009/1/2     12   2.3
4  1 2009/2/3     32   2.3
5  1 2009/2/3     43   2.1
6  1 2009/1/2    543   9.1

tansfrom函数 #用于变换数据中的对象

> stock <- read.csv("D:/R_workspace/Dataguru/week2/price.csv",header = T)
> stock
   No Stkcd     Trddt Opnprc Hiprc Loprc Clsprc
1   1     1  2009/1/5   9.57  9.74  9.51   9.71
2   2     1  2009/1/6   9.80 10.43  9.73  10.30
3   3     1  2009/1/7  10.20 10.40  9.99   9.99
4   4     1  2009/1/8   9.75  9.76  9.50   9.60
5   5     1  2009/1/9   9.60  9.93  9.60   9.85
6   6     1 2009/1/12   9.78 10.08  9.67   9.86
7   7     1 2009/1/13   8.88  9.63  8.88   9.47
8   8     1 2009/1/14   9.30 10.25  9.30  10.20
9   9     1 2009/1/15  10.01 10.60  9.97  10.30
10 10     1 2009/1/16  10.34 10.94 10.34  10.62
11 11     1 2009/1/19  10.65 11.35 10.65  11.11
12 12     1 2009/1/20  11.07 11.40 11.02  11.36
13 13     1 2009/1/21  11.15 12.20 11.00  11.79
14 14     1 2009/1/22  11.80 12.00 11.40  11.79
15 15     1 2009/1/23  11.58 11.93 11.58  11.64
16 16     1  2009/2/2  11.76 11.99 11.51  11.66
17 17     1  2009/2/3  11.66 12.06 11.60  11.95
18 18     1  2009/2/4  12.02 13.15 12.02  13.04
19 19     1  2009/2/5  13.07 13.20 12.63  12.80
20 20     1  2009/2/6  12.82 13.44 12.82  13.19
> transform(stock,Opnprc = -Opnprc,difference =Hiprc - Loprc)
   No Stkcd     Trddt Opnprc Hiprc Loprc Clsprc difference
1   1     1  2009/1/5  -9.57  9.74  9.51   9.71       0.23
2   2     1  2009/1/6  -9.80 10.43  9.73  10.30       0.70
3   3     1  2009/1/7 -10.20 10.40  9.99   9.99       0.41
4   4     1  2009/1/8  -9.75  9.76  9.50   9.60       0.26
5   5     1  2009/1/9  -9.60  9.93  9.60   9.85       0.33
6   6     1 2009/1/12  -9.78 10.08  9.67   9.86       0.41
7   7     1 2009/1/13  -8.88  9.63  8.88   9.47       0.75
8   8     1 2009/1/14  -9.30 10.25  9.30  10.20       0.95
9   9     1 2009/1/15 -10.01 10.60  9.97  10.30       0.63
10 10     1 2009/1/16 -10.34 10.94 10.34  10.62       0.60
11 11     1 2009/1/19 -10.65 11.35 10.65  11.11       0.70
12 12     1 2009/1/20 -11.07 11.40 11.02  11.36       0.38
13 13     1 2009/1/21 -11.15 12.20 11.00  11.79       1.20
14 14     1 2009/1/22 -11.80 12.00 11.40  11.79       0.60
15 15     1 2009/1/23 -11.58 11.93 11.58  11.64       0.35
16 16     1  2009/2/2 -11.76 11.99 11.51  11.66       0.48
17 17     1  2009/2/3 -11.66 12.06 11.60  11.95       0.46
18 18     1  2009/2/4 -12.02 13.15 12.02  13.04       1.13
19 19     1  2009/2/5 -13.07 13.20 12.63  12.80       0.57
20 20     1  2009/2/6 -12.82 13.44 12.82  13.19       0.62

names()函数 #查看或更改数据表中行和列的名字

> names(ZGSH)         #获取ZGSH的名字
[1] "Stkcd"    "Trddt"    "Opnprc"   "Hiprc"    "Loprc"   
[6] "Clsprc"   "Adjprcwd" "Dretwd"  
> data = (ZGSH)
> names(data) <- LETTERS[1:8]        #将字母中第1:8个字母替换原列名
> names(data)
[1] "A" "B" "C" "D" "E" "F" "G" "H"

排序

> x <-c(1,6,2,8,5)
> sort(x)        #正常对原数据进行排序
[1] 1 2 5 6 8
> order(x)    #返回排序后，原数据的位置 eg：第二个3是排在第二位的数据原来的位置是排在第三位
[1] 1 3 5 2 4
> rank(x)     #返回数据排序后的位置
[1] 1 4 2 5 3

#矩阵元素排序
> a <- matrix( c(5, 3, 4, 2, 2, 6, 8, 9, 7, 6, 12, 10, 11, 14, 13), 5)
> a
     [,1] [,2] [,3]
[1,]    5    6   12
[2,]    3    8   10
[3,]    4    9   11
[4,]    2    7   14
[5,]    2    6   13
> a[order(a[,1]),]              #按矩阵第一列进行排序
     [,1] [,2] [,3]
[1,]    2    7   14
[2,]    2    6   13
[3,]    3    8   10
[4,]    4    9   11
[5,]    5    6   12
> a[order(a[,1],a[,2]),]     #按矩阵第一列和第二列进行排序
     [,1] [,2] [,3]
[1,]    2    6   13
[2,]    2    7   14
[3,]    3    8   10
[4,]    4    9   11
[5,]    5    6   12
> a[order(a[,1],-a[,2]),]     # 按矩阵第一列进行排序，不按第二列进行排序
     [,1] [,2] [,3]
[1,]    2    7   14
[2,]    2    6   13
[3,]    3    8   10
[4,]    4    9   11
[5,]    5    6   12

table(）函数 #快速生成列联表

> ff <- factor( c("Male", "Female", "Male", "Female", "Female") )
> table(ff)     #统计ff中两类数据的个数
ff
Female   Male 
     3      2

数学运算

算数运算符
逻辑运算符

> a <-c(1,2,3)
> b <-c(2,1,4)
> x <- a<=b
> x
[1]  TRUE FALSE  TRUE
> y <- a >= b
> y
[1] FALSE  TRUE FALSE
> x&y
[1] FALSE FALSE FALSE
> x&&y
[1] FALSE
> x[1]&&y[1]
[1] FALSE
>

数学函数计算

矩阵计算

> ret <- c(0.05 ,0.09 ,0.12 , -0.10 , -0.09 ,0.01)
> arithmetic.average <- sum(ret)/length(ret)        #算术平均值
> arithmetic.average          
[1] 0.01333333
> geometric.average <- prod(rep(1,length(ret))+ret)^(1/length(ret))-1
> geometric.average
[1] 0.009810423

> x<-matrix(c(1,2,3,4),nrow=2,ncol =2)
> eigen(x)             #求特征值和特征向量
$values
[1]  5.3722813 -0.3722813

$vectors
           [,1]       [,2]
[1,] -0.5657675 -0.9093767
[2,] -0.8245648  0.4159736

> det(x)    #求行列式的值 
[1] -2
> rank(x)   #求矩阵的秩
[1] 1 2 3 4
> rev(x)          #求矩阵的逆
[1] 4 3 2 1

数据可视化的重要性（作图）

延伸第一节最后的综合性例子，以下是第一节例子数据框的生成

> num = seq(1078001,10378100)
> num
   [1] 1078001 1078002 1078003 1078004 1078005 1078006 1078007
   [8] 1078008 1078009 1078010 1078011 1078012 1078013 1078014
  [15] 1078015 1078016 1078017 1078018 1078019 1078020 1078021
  [22] 1078022 1078023 1078024 1078025 1078026 1078027 1078028
  [29] 1078029 1078030 1078031 1078032 1078033 1078034 1078035
  [36] 1078036 1078037 1078038 1078039 1078040 1078041 1078042
  [43] 1078043 1078044 1078045 1078046 1078047 1078048 1078049
  [50] 1078050 1078051 1078052 1078053 1078054 1078055 1078056
  [57] 1078057 1078058 1078059 1078060 1078061 1078062 1078063
  [64] 1078064 1078065 1078066 1078067 1078068 1078069 1078070
  [71] 1078071 1078072 1078073 1078074 1078075 1078076 1078077

   ……………………………………

 [967] 1078967 1078968 1078969 1078970 1078971 1078972 1078973
 [974] 1078974 1078975 1078976 1078977 1078978 1078979 1078980
 [981] 1078981 1078982 1078983 1078984 1078985 1078986 1078987
 [988] 1078988 1078989 1078990 1078991 1078992 1078993 1078994
 [995] 1078995 1078996 1078997 1078998 1078999 1079000
 [ reached getOption("max.print") -- omitted 9299100 entries ]

> x1 = round(runif(100,min=80,max=100))
> x1
  [1]  97  83  90  90  81  92  89  83 100  88  98  95  90  91  92  97  82  81  90  92  85  95  89  80
 [25]  93  99  81  97  99  86  82  92  90  85  98  86  87  93  86  97 100  94  87  93  83  83  99  93
 [49]  92  84  89  90  84 100  88  95  94  82  84  89  85  90  93  94  85  87  87  86  88  95  87 100
 [73]  90  91  87  87  81  86  98  97  98  98  95  88  97  94  95  93  83  95  84  95  85  89  95  88
 [97]  92  88  96  84
> x2 = round(rnorm(100,mean=80,sd=7))
> x2
  [1]  85  86  87  81  84  84  82  75  69  76  82  79  72  79  91  73  77  78  77  93  68  91  91  77
 [25]  87  76  79  73  87  80  71  93  82  84  83  83  79  75  78  87  75  72  85  71  91  69  93  67
 [49]  94  70  91  80  74  77  71  82  83  81  80  80  79  73  70  77  69  69  78  83  77  81  76  90
 [73]  77  77  77  80  80  80  80  75  78  74  89  77  90  90  85  73  74  90  72 104  84  74  97  81
 [97]  71  74  74  88
> x3 = round(rnorm(100,mean = 83,sd=18))
> x3
  [1]  76  69  93  57  69 109  87  96 112  90 117  85  87  70  37  82  75  66 102  52 112  54  92  44
 [25]  94  84  84  77 117  93  87  78  93  93  55 109  52  48  98  81  75  78  92  81  52  73 127  31
 [49] 127  56  65  62  98 101  91  83  98 110  76  95  94  50  69  62  71  40 100  75  81 101  99 109
 [73]  96  93  99  80  76  49  72 103  99  79  82  89 112  93  40  80 103  76 104  50  81  73 100  70
 [97]  66 104 106  64
> x3[which(x3>100)]=100
> x3
  [1]  76  69  93  57  69 100  87  96 100  90 100  85  87  70  37  82  75  66 100  52 100  54  92  44
 [25]  94  84  84  77 100  93  87  78  93  93  55 100  52  48  98  81  75  78  92  81  52  73 100  31
 [49] 100  56  65  62  98 100  91  83  98 100  76  95  94  50  69  62  71  40 100  75  81 100  99 100
 [73]  96  93  99  80  76  49  72 100  99  79  82  89 100  93  40  80 100  76 100  50  81  73 100  70
 [97]  66 100 100  64
> x = data.frame(num,x1,x2,x3)
> x
             num  x1  x2  x3
1        1078001  97  85  76
2        1078002  83  86  69
3        1078003  90  87  93
4        1078004  90  81  57
5        1078005  81  84  69
6        1078006  92  84 100
7        1078007  89  82  87
8        1078008  83  75  96
9        1078009 100  69 100
10       1078010  88  76  90
11       1078011  98  82 100
12       1078012  95  79  85
13       1078013  90  72  87
14       1078014  91  79  70
15       1078015  92  91  37
16       1078016  97  73  82
17       1078017  82  77  75
18       1078018  81  78  66
19       1078019  90  77 100

………………

248      1078248  93  67  31
249      1078249  92  94 100
250      1078250  84  70  56
 [ reached getOption("max.print") -- omitted 9299850 rows ]

绘制直方图函数hist()

> hist(x$x1)          #绘制x中x1列的直方图

散点图绘制函数plot()

> plot(x1,x2)
> plot(x$x1,x$x2)

列联表分析——列联函数table(),柱状图绘制函数barplot()

> table(x$x1)

    80     81     82     83     84     85     86     87     88     89     90     91     92 
 93001 372004 279003 465005 465005 465005 465005 651007 558006 465005 744008 186002 558006 
    93     94     95     96     97     98     99    100 
558006 372004 837009  93001 558006 465005 279003 372004 
> barplot(table(x$x1))

饼图——饼图绘制函数pie()

pie(table(x$x1))

箱尾图

箱子的上下横线为样本的25%和75%分位数
箱子中间横线为样本的中位数
上下延伸的直线称为尾线，尾线的尽头为最高值和最低值
异常值(超出一定阈值)——图中小圆点

> boxplot(x$x1,x$x2,x$x3)

指定箱尾图的颜色和缺口

boxplot(x[1:100,2:4],col=c("red","green","blue"),notch = T)

水平放置的箱尾图

boxplot(x$x1,x$x2,x$x3,horizontal = T)

星相图

每个观测单位的数值表示为一个图形
每个图的每个角表示一个变量，字符串类型会标注在图的下方
角线的长度表达值得大小

> stars(x[c("x1","x2","x3")])

　　
- 雷达图
用full=T/F 表示画整个圆还是半个圆，用draw.segment = T 表示画的是扇形

stars(x[c("x1","x2","x3")],full= T,draw.segment = T)

stars(x[c("x1","x2","x3")],full= F,draw.segment = T)

脸谱图

安装aplpack包

> library("aplpack", lib.loc="D:/R_library")
> faces(x[c("x1","x2","x3")])
effect of variables:
 modified item       Var 
 "height of face   " "x1"
 "width of face    " "x2"
 "structure of face" "x3"
 "height of mouth  " "x1"
 "width of mouth   " "x2"
 "smiling          " "x3"
 "height of eyes   " "x1"
 "width of eyes    " "x2"
 "height of hair   " "x3"
 "width of hair   "  "x1"
 "style of hair   "  "x2"
 "height of nose  "  "x3"
 "width of nose   "  "x1"
 "width of ear    "  "x2"
 "height of ear   "  "x3"
>

用五官的宽带和高度来描述数值
人对脸谱高度敏感和强记忆
适合较少样本的情况

其他脸谱图

安装TeachingDemos包

> library(TeachingDemos)

Attaching package: ‘TeachingDemos’
The following objects are masked from ‘package:aplpack’:
    faces, slider

### 茎叶图

> stem(x$x2)
  The decimal point is 1 digit(s) to the right of the |
  6 | 14
  6 | 99
  7 | 000112222223444
  7 | 555666666777777788999
  8 | 0000111111122222222222333444
  8 | 55555567778999
  9 | 0000002223344
  9 | 55556

mistakes:


> stem(x$x1)

  The decimal point is at the |
   80 | 00000
   82 | 00000000
   84 | 0000000000
   86 | 000000000000
   88 | 00000000000
   90 | 0000000000
   92 | 000000000000
   94 | 0000000000000
   96 | 0000000
   98 | 00000000
  100 | 0000

改为：

> stem(x$x1,scale = 0.5)

  The decimal point is 1 digit(s) to the right of the |
   8 | 011112223333344444
   8 | 5555566666777777788888899999
   9 | 00000000112222223333334444
   9 | 555555555677777788888999
  10 | 0000

QQ图

可用于判断是否是正态分布
直线的斜率是标准差，截距是均值
点的散布越接近直线，则越接近正态分布

> qqnorm(x1)
> qqline(x1)

图中可看出x1不是正态分布

> qqnorm(x2)
> qqline(x2)

图中可看出x2很可能是正态分布

散点图

散点图的进一步设置

> plot(x$x1,x$x2,main="数学分析与线性代数成绩的关系",
+      xlab="数学分析",
+      ylab="线性代数",
+      xlim=c(0,100),
+      ylim=c(0,100),
+      xaxs="i",#Set x axis style as internal  
+      yaxs="i", #Set x axis style as internal 
+      col = "red", #Set the color of plotting symbol to red 
+      pch=19 #Set the plotting symbol to filled dots
+ )

连线图

> a = c(2,3,4,5,6)
> b = c(4,7,8,9,12)
> plot(a,b,type = "l")

多条曲线的效果

> rain <- read.csv("D:/R_workspace/Dataguru/week2/rain.csv")
> rain
   Tokyo NewYork London Berlin
1     64     102     56     87
2     43      76     54     76
3     76      98     75     46
4     44      57     43     35
5     34      54     23     75
6     23      45     76     56
7     89      37     45     33
8     56      56     34     22
9    102      45     98      1
10   132      45    111     23
11    45      17    102    120
12    65      87     48     23
> plot(rain$Tokyo,type = "l",col = "red",ylim=c(0,300),main="Monthly Rainfall in major cities",xlab="Month of Year",ylab = "Rainfall(mm)",lwd=2)              # lwd 设置线宽
> lines(rain$NewYork,type = "l",col="blue",lwd=2)  #lines在原plot图的上面添加折线  lines称为低水平画图函数
> lines(rain$London,type = "l",col="green",lwd=2)
> lines(rain$Berlin,type = "l",col="orange",lwd=2)

关于低水平作图和高水平作图在薛毅书中P137-138

密度图

函数density()

> plot(density(rnorm(1000)))

R内置数据集

函数data()列出内置数据

data()

例如

> mtcars
                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2

热力图

利用内置的mtcars数据集绘制

> heatmap(as.matrix(mtcars),Rowv = NA,Colv = NA,col = heat.colors(256),scale = "column",margins = c(2,8),main = "Car characteristics by Model")         #要先把数据框转化成矩阵

Iris(鸢尾花)数据集

Sepal 花萼
Petal 花瓣
Species 种属

> iris
    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
1            5.1         3.5          1.4         0.2     setosa
2            4.9         3.0          1.4         0.2     setosa
3            4.7         3.2          1.3         0.2     setosa
4            4.6         3.1          1.5         0.2     setosa
5            5.0         3.6          1.4         0.2     setosa
6            5.4         3.9          1.7         0.4     setosa
 ………………
147          6.3         2.5          5.0         1.9  virginica
148          6.5         3.0          5.2         2.0  virginica
149          6.2         3.4          5.4         2.3  virginica
150          5.9         3.0          5.1         1.8  virginica

向日葵散点图

用来克服散点图中数据点重叠问题
在有重叠的地方用一朵“向日葵”的花瓣数目来表示重叠数据的个数

> sunflowerplot(iris[,3:4],col = "gold",seg.col = "gold")   #col指定点的颜色 seg.col指定放射线的颜色

散点图集

遍历样本中全部的变量配对画出二元图
直观地了解所有变量之间的关系

> pairs(iris[,1:4])

用plot也可以实现同样的效果

> plot(iris[,1:4],main="Relationships between characteristics of iris flowers",pch=19,col="blue",cex=0.9)

利用par()在同一个device()中输出多个散点图
Par命令博大精深，用于设置绘图参数，help(par)

> par(mfrow=c(3,1))
> plot(x1,x2);plot(x2,x3);plot(x3,x1)

关于绘图参数

help(par)
有哪些颜色？colors()

> colors()

绘图设备

dev.new()        #新建图形窗
dev.cur()        #显示目前的窗口编号
dev.list()       #窗口的列表
dev.next(which = dev.cur())
dev.prev(which = dev.cur())
dev.off(which = dev.cur())
dev.set(which = dev.next())
graphics.off()

关于绘图参数

三维散点图

安装scatterplot3d包

> library(scatterplot3d)
> scatterplot3d(x[2:4])

三维作图

> x<-y<-seq(-2*pi,2*pi,pi/15)
> f<-function(x,y) sin(x)*sin(y)
> z<-outer(x,y,f)
> contour(x,y,z,col = "blue")
> persp(x,y,z,theta = 30,phi = 30,expand = 0.7,col = "lightblue")

调和曲线图

unison.r的代码
自定义函数
条和曲线用于聚类半段非常方便

> source("D:/R_workspace/Dataguru/week2/unison.R")
> unison(x[2:4])

地图

安装maps包

> library(maps)
> map("state",interior = FALSE)

> map("state",boundary = FALSE,col = "red",add = TRUE)

> map("world",fill = TRUE,col=heat.colors(10))

R实验：社交数据可视化

先下载安装maps包和geosphere包并加载

library(maps)
library(geosphere)

画出美国地图

map("state")

- 画出世界地图

> map("world")

通过设置坐标范围使焦点集中在美国周边，并期望设置一些有关颜色

> xlim <- c(-171.738281,-56.601563)
> ylim <- c(12.039321,71.856229)
> map("world",col = "#f2f2f2",fill = TRUE,bg="white",lwd=0.05,xlim = xlim,ylim = ylim)
>

画一条弧线连线，表示社交关系

> library("geosphere", lib.loc="D:/R_library")
> lat_me <- 45.21300
> lon_me <- -68.906250
> inter <- gcIntermediate(c(lon_ca,lat_ca),c(lon_me,lat_me),n=50,addStartEnd=TRUE)
> lines(inter)

继续画弧线

> lat_tx <- 29.954935
> lon_tx <- -98.701172
> inter2 <- gcIntermediate(c(lon_ca,lat_ca),c(lon_tx,lat_tx),n=50,addStartEnd=TRUE)
> lines(inter2,col="red")

装载数据

> airports <- read.csv("http://datasets.flowingdata.com/tuts/maparcs/airports.csv",header = TRUE)
> flights <- read.csv("http://datasets.flowingdata.com/tuts/maparcs/flights.csv",header = TRUE,as.is = TRUE)

画出多重联系

> map("world",col = "#f2f2f2",fill=TRUE,bg="white",lwd=0.05,xlim=xlim,ylim=ylim)
> fsub <- flights[flights$airline == "AA",]
> for(j in 1:length(fsub$airline)){
+ air1 <- airports[airports$iata == fsub[j,]$airport1,]
+ air2 <- airports[airports$iata == fsub[j,]$airport2,]
+ inter <- gcIntermediate(c(air1[1,]$long,air1[1,]$lat),c(air2[1,]$long,air2[1,]$lat),n=100,addStartEnd=TRUE)
+ lines(inter,col = "black",lwd=0.8)
+ }

画map链接：http://flowingdata.com/2011/05/11/how-to-map-connections-with-great-circles/

你可能感兴趣的:(R语言,r语言)

Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
R语言绘图 | 环状柱状图+散点柱状组合图绘制小杜的生信筆記 R语言精美图形绘制教程 r语言开发语言科研绘图生物信息学
原文：R语言绘图|环状柱状图+散点柱状组合图绘制(点击访问)小杜的生信筆記，主要发表或收录生物信息学教程，以及基于R分析和可视化（包括数据分析，图形绘制等）；分享感兴趣的文献和学习资料!!
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
edger多组差异性分析_R语言统计分析微生物组数据 weixin_39961636 edger多组差异性分析
我在学习这本书记了一些笔记，如果你有学习，欢迎分享你的笔记或者教程。我的已有笔记汇总如下：宏基因组学习笔记宏基因组学习笔记2宏基因组笔记(第二章)R语言宏基因组学统计分析学习笔记(第三章-1)R语言宏基因组学统计分析学习笔记(第三章-2)https://link.springer.com/book/10.1007/978-981-13-1534-3下载方法，sci-hub大法啦。出版日期：2018
23章12节：抽样的蒙特卡洛方法 DAT｜R科学与人工智能用R探索医药数据科学 r-4.2.1 开发语言数据库人工智能 r
蒙特卡洛方法作为一种基于随机抽样的数值计算技术，在工程、金融、统计、物理等众多领域中得到了广泛应用。该方法通过对大量随机数的模拟，来解决那些难以解析求解的问题。在实际问题中，常常需要从一个复杂分布中抽取样本，而传统的直接抽样方法可能难以实现。为了解决这一问题，接受‐拒绝抽样方法应运而生。本文旨在介绍如何利用R语言实现蒙特卡洛方法，特别是如何通过接受‐拒绝抽样从已知分布中抽取样本。文章以参数为(3,
R语言使用table1包绘制（生成）三线表实战：单变量分列构建三线表、编写自定义函数在三线表中添加p值 statistics.insight R语言入门课 r语言数据挖掘机器学习
R语言使用table1包绘制（生成）三线表实战：单变量分列构建三线表、编写自定义函数在三线表中添加p值目录R语言使用table1包绘制（生成）三线表、使用单变量分列构建三线表、编写自定义函数在三线表中添加p值#三线表是什么？#导入包并构建仿真数据#R语言使用table1包绘制（生成）三线表、使用单变量分列构建三线表、编写自定义函数在三线表中添加p值#三线表是什么？三线表本来是微软公司的word编辑
R语言的移动应用开发滕若岚包罗万象 golang 开发语言后端
R语言的移动应用开发在数据科学和统计分析的大潮中，R语言因其强大的数据处理和可视化能力而备受青睐。然而，R语言对移动应用开发的适用性并未得到广泛关注。本文将探讨R语言在移动应用开发中的潜力及其工具，并提供一些实践示例，希望能为读者在这一新兴领域的探索提供帮助。一、R语言概述R语言是一种用于统计计算和图形绘制的编程语言，因其简洁的语法和丰富的包生态系统受到数据科学家的广泛使用。R语言的强大之处在于其
R语言：初始环境配置一头大学牲程序--编程记录 r语言开发语言
文章目录R语言的配置URL和种子R语言的配置在R中安装languageserver包：（直接在R.exe中运行即可）install.packages("languageserver")关于jupyternotebook如何编写R语言：（好像每种jupyternotebook支持的编程语言，解释器都有对应的jupyternotebook）install.packages('IRkernel')IRk
【科研绘图系列】R语言绘制网络相关图（cor network plot）生信学习者1 SCI科研绘图系列 r语言数据分析数据挖掘数据可视化
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍加载R包数据下载导入数据数据预处理画图1画图2组合图形输出图片系统信息介绍【科研绘图系列】R语言绘制网络相关图（cornetworkplot）加载R包library(tidyverse)library(ggraph)library(igraph)library(patchwork)conflicted::
ggplot2设置坐标轴范围_作图技巧018篇第二坐标轴在ggplot2中的实现 weixin_39618597 ggplot2设置坐标轴范围 R语言ggplot2移除图例按键精灵定位坐标循环
“ggplot2中的次级坐标轴”生活科学哥-R语言科学2020-06-128：35在平时作图中，我们有时希望在一个坐标中进行二个坐标轴的设定，也是为了方便数据的显示。这个过程在EXCEL等当中比较容易实现，但是，如何在R中实现呢？今天我们就来讲一讲操作的过程。数据准备先准备如下数据：library(ggplot2)library(scales)library(magrittr)dfdata.fra
23章9节：分层随机抽样及其在R语言中的实现与验证 DAT｜R科学与人工智能用R探索医药数据科学 r语言开发语言 r-4.2.1 机器学习人工智能算法
在统计学和数据科学的实际工作中，抽样方法始终扮演着至关重要的角色。如何从庞大的总体中获取具有代表性的样本，一直是数据分析过程中需要面对的核心问题之一。分层随机抽样作为一种常用的抽样方法，因其能够针对总体中的不同亚群体（层）进行有针对性的抽样，从而提高样本代表性、降低抽样误差，被广泛应用于社会调查、市场研究、医学试验等各个领域。本文旨在系统地阐述分层随机抽样的理论基础、抽样方法及其在R语言中的实现，
R语言高效数据处理-自定义EXCEL数据排版 LEEBELOVED r语言 R语言高效处理数据 excel批处理
注：以下代码均为实际数据处理中的笔记摘录，所以很零散1、自定义excel表数据输出格式、布局在实际数据处理中为了提升效率，将Excel报表交付给需求方时减少手动调整的环节很有必要#1.1设置表头格式header_style=0', style=sheet_style)#数据写入writeData(data_deal_main01,'data_deal_test1',data_de
Java：AI 浪潮中的隐形支柱 —— 探秘 Java 在人工智能领域的独特地位琢磨先生David 人工智能
引言在人工智能技术席卷全球的今天，当人们谈论AI开发时，Python、R语言、C++等工具总是最先被提及。然而在这个充满创新的领域，有一个"老兵"正悄然发挥着不可替代的作用——自1995年诞生至今的Java语言，凭借其独特的工程化基因，正在构建起AI世界的底层基础设施。本文将揭示Java如何在大数据、机器学习、企业级AI系统等领域持续创造价值。一、Java的AI基因解码跨平台优势的现代意义"一次编
R 语言科研绘图第 31 期 --- 韦恩图-基础 TigerZ 生信宝库 r语言贴图程序人生开发语言
在发表科研论文的过程中，科研绘图是必不可少的，一张好看的图形会是文章很大的加分项。为了便于使用，本系列文章介绍的所有绘图都已收录到了sciRplot项目中，获取方式：R语言科研绘图模板---sciRplothttps://mp.weixin.qq.com/s/QA_8LVqjkdg4A16zLonw4w?payreadticket=HElUE5WWmBflodEFw10g0l2NrRotj8kbU
23章11节：自助抽样及其在R语言中的实现与验证 DAT｜R科学与人工智能用R探索医药数据科学 r语言开发语言 r-4.2.1 microsoft 信息可视化
在统计学中，数据分析的核心任务之一是如何在样本数据的基础上推断总体的性质。传统方法往往依赖于已知的概率分布假设和解析推导，但在现实问题中，我们往往无法准确得知总体分布，或者数据样本量较小，难以满足经典统计推断方法的要求。自助抽样作为一种非参数的计算方法，为我们提供了基于样本数据“自我重复”构建抽样分布的途径。1977年，斯坦福大学的B.Efron在著名论文《BootstrapMethods:Ano
R语言将向量数据按照行方式转化为矩阵数据（设置参数byrow为TRUE） sdgfbhgfj R语言初见机器学习数据挖掘人工智能数据分析 r语言
R语言将向量数据按照行方式转化为矩阵数据（设置参数byrow为TRUE）目录R语言将向量数据按照行方式转化为矩阵数据（设置参数byrow为TRUE）R语言是解决什么问题的？R语言将向量数据按照行方式转化为矩阵数据（设置参数byrow为TRUE）安利一个R语言的优秀博主及其CSDN专栏：R语言是解决什么问题的？R是一个有着统计分析功能及强大作图功能的软件系统，是由奥克兰大学统计学系的RossIhak
R语言学习实例：使用R进行数据可视化 PixelCoder 信息可视化 r语言学习 R语言
R语言学习实例：使用R进行数据可视化R语言是一种功能强大且广泛使用的统计分析和数据可视化工具。在本实例中，我们将使用R语言来创建一些常见的数据可视化图表，包括散点图、柱状图和折线图。我们将展示如何使用R的基本绘图功能和一些常用的绘图库来生成这些图表。散点图是一种用于显示两个变量之间关系的图表。我们可以使用R的基本绘图功能来创建散点图。下面是一个示例代码，展示如何使用R创建散点图：#创建示例数据x<
探索R语言：经典案例解析与源代码翠绿探寻 r语言信息可视化开发语言 R语言
探索R语言：经典案例解析与源代码引言：R语言是一种流行的数据分析和统计建模工具，具有丰富的功能和广泛的应用领域。在本文中，我们将通过经典案例来探索R语言的一些重要功能和技术。我们将提供相应的源代码，以便读者能够实际运行并理解这些示例。案例一：数据导入与处理在数据分析中，数据导入和处理是首要任务。R语言提供了丰富的函数和包，用于处理各种数据格式。下面是一个简单的示例，演示了如何导入和处理CSV格式的
R语言dataframe数据索引、访问: 使用attach函数绑定dataframe数据、这样可以直接使用列名称访问dataframe的列数据 omhdxgb R语言123 r语言数据挖掘人工智能机器学习数据分析
R语言dataframe数据索引、访问:使用attach函数绑定dataframe数据、这样可以直接使用列名称访问dataframe的列数据目录R语言dataframe数据索引、访问:使用attach函数绑定dataframe数据、这样可以直接使用列名称访问dataframe的列数据R语言特点R语言dataframe数据索引、访问:使用attach函数绑定dataframe数据、这样可以直接使用列
R语言向量vector数据类型元素索引、访问：使用中括号[]和:符号以及乘法符号获取向量中指定范围内的偶数索引元素 omhdxgb R语言123 r语言机器学习数据挖掘人工智能数据分析
R语言向量vector数据类型元素索引、访问：使用中括号[]和:符号以及乘法符号获取向量中指定范围内的偶数索引元素目录R语言向量vector数据类型元素索引、访问：使用中括号[]和:符号以及乘法符号获取向量中指定范围内的偶数索引元素R语言特点R语言向量vector数据类型元素索引、访问：使用中括号[]和:符号以及乘法符号获取向量中指定范围内的偶数索引元素R可以在CRAN（Comprehensive
R语言安装github包出现的错误，object "XXX" is not exported by "namespace:viridisLite" momo酱豆是沃 anaconda各种问题
自己遇上了类似的问题，当时是把所有导致这个问题出现时安装的所有包我都卸载了，再次重装的。弄了很久，我发现都是在安装各种包让我更新我不更新导致的后果R，告诉我一个道理，一定要听话，让你更新就更新，不然我的bug出到让你崩溃。下图借用以为博主的图（https://blog.csdn.net/yw_vine/article/details/79631042）原连接R语言安装github包出现的错误，ob
R语言 ggplot2 可视化生成高分辨率图片实战 PixelEnigma r语言开发语言 R语言
R语言ggplot2可视化生成高分辨率图片实战在数据分析和可视化领域，R语言一直是研究人员和数据科学家们的首选工具。其中，ggplot2包是R语言中最受欢迎和强大的可视化工具之一。它提供了许多灵活且精美的图形选项，使用户能够轻松创建具有吸引力和信息丰富的图表。本文将介绍如何使用ggplot2包在R语言中生成高分辨率的图片。我们将探索不同的保存选项，以确保我们获得清晰、适应各种输出需求的图像。首先，
Java 中操作 R：深度整合与高效应用 froginwe11 开发语言
Java中操作R：深度整合与高效应用引言随着大数据和机器学习的快速发展，R语言在数据分析和可视化方面扮演着越来越重要的角色。而Java作为一种广泛应用于企业级应用开发的语言，其强大的功能和稳定性使其成为构建高性能应用的首选。本文将探讨Java如何操作R语言，实现高效的数据分析应用。一、Java操作R的背景R语言优势：R语言拥有丰富的统计分析、数据可视化工具和机器学习算法库，是数据分析领域的首选语言
R语言对高频交易订单流进行建模分析 4 oxuzhenyi 实验楼课程机器学习 R
一、实验介绍--订单流模型拟合1.1实验知识点指数核hawkes过程拟合正反馈强度分析订单量影响分析1.2实验环境R3.4.1Rstudio二、订单流模型拟合在上节中我们对订单流数据做了一些统计分析，对交易的一些特征有了一些粗浅的理解，在本节中我们要做的是利用实际数据来拟合hawkes过程，看一看真实数据的订单流动力学中有什么特征。首先我们仍是选出交易时间内的数据：library(tidyvers
R语言对高频交易订单流进行建模分析 3 oxuzhenyi 实验楼课程机器学习 R
一、实验介绍--订单流数据描述分析1.1实验知识点订单流数据表示订单间隔分析订单信息率平稳性研究订单流动性研究限价单相对价格分析1.2实验环境R3.4.1Rstudio二、订单流数据描述分析2.1订单流数据表示当我们在金融市场上做交易时，可以看到一个委托单簿，上面陈列着买价和卖价以及它们对应的量，举个例子，比特币市场的订单簿：可以看到红色代表的是卖价，或者说是ask,而绿色代表的是买价，或者说是b
【自学笔记】R语言基础知识点总览-持续更新 Long_poem 笔记 r语言开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录R语言基础知识点总览1.R语言简介2.R语言安装与环境配置3.R语言基础语法3.1数据类型3.2向量与矩阵3.3数据框与列表4.控制结构4.1条件语句4.2循环结构5.函数6.数据可视化总结R语言基础知识点总览1.R语言简介R是一种用于统计计算和图形的编程语言和软件环境。R语言由RossIhaka和RobertGentlema
R语言决策树、svm支持向量机、随机森林别叫我名字20 R语言决策树支持向量机 r语言
本人正在学习R语言，想利用这个平台记录自己一些自己的学习情况，方便以后查找，也想分享出来提供一些资料给同样学习R语言的同学们。（如果内容有错误，欢迎大家批评指正）1.决策树我们使用的还是RStudio自带的数据集iris。#######################决策树模型install.packages("rpart")#安装库library("rpart")dt<-function(dat
决策树、朴素贝叶斯、随机森林、支持向量机、XGBoost 和 LightGBM算法的R语言实现生信与基因组学生信分析项目进阶技能合集算法机器学习 r语言
基本逻辑（1）使用rnorm函数生成5个特征变量x1到x5，并根据这些特征变量的线性组合生成一个二分类的响应变量y；（2）将生成的数据存储在数据框中，处理缺失值，并将响应变量转换为因子类型；（3）使用决策树、朴素贝叶斯、随机森林、支持向量机、XGBoost和LightGBM六种机器学习模型算法对数据进行训练和评估；（4）将各个模型的准确率和AUC值存储在结果数据框中，并通过柱状图展示结果。1.R包
R语言2——数据类型和基本运算朝荣 #R语言 R语言运算 R数据类型
R语言2——数据类型和基本运算目录R语言2——数据类型和基本运算1.R的数据类型1.R的数据类型（1）Logical（逻辑型）：只有两个值TRUE,FALSE（2）Numeric（数字）：整数、小数等（3）Complex（复合型）：带有虚数i的数，如1+2i（4）Character（字符）：包含在“”之中，如“hello！”（5）Vectors向量：c()函数，将元素组合成一个向量。c(1,2,3
R语言获取数据——手工输入数据蜗牛数据分析 R语言从入门到实战 r语言开发语言
在R语言中获取数据集的方法有多种，例如读取Excel文件、数据库中的文件，而当我们没有这些渠道能够获取到数据集时，也可以手工输入数据，即通过键盘输入数据，它是获取数据集的最简单方法。另外，还可以在代码中直接输入数据，下面分别进行介绍。数据编辑器R提供了内置的数据编辑器，通过edit()函数调用该编辑器就可以实现手工输入数据。举例1：通过数据编辑器创建学生成绩表下面实现“学生成绩表”，具体步骤如下：
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj