huangleijay

R的常用函数全面总结

前言：关于R

在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system for data analysis and visualization which is built based on S language.)。

R的源起

R是S语言的一种实现。S语言是由 AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件，它基于S语言，并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的Robert Gentleman 和 Ross Ihaka 及其他志愿人员开发了一个R系统。R的使用与S-PLUS有很多类似之处，两个软件有一定的兼容性。

R is free

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件，它是一个用于统计计算和统计制图的优秀工具。
R是一套完整的数据处理、计算和制图软件系统。其功能包括：数据存储和处理系统；数组运算工具（其向量、矩阵运算方面功能尤其强大）；完整连贯的统计分析工具；优秀的统计制图功能；简便而强大的编程语言：可操纵数据的输入和输入，可实现分支、循环，用户可自定义功能。
R是一个免费的自由软件，它有UNIX、LINUX、MacOS和WINDOWS版本，都是可以免费下载和使用的,在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块，其他外在模块可以通过CRAN获得。
R的特点

(1) 有效的数据处理和保存机制。
(2) 拥有一整套数组和矩阵的操作运算符。
(3) 一系列连贯而又完整的数据分析中间工具。
(4) 图形统计可以对数据直接进行分析和显示，可用于多种图形设备。
(5) 一种相当完善、简洁和高效的程序设计语言。它包括条件语句、循环语句、用户自定义的递归函数以及输入输出接口。
(6) R语言是彻底面向对象的统计编程语言。
(7) R语言和其它编程语言、数据库之间有很好的接口。
(8) R语言是自由软件，可以放心大胆地使用，但其功能却不比任何其它同类软件差。
(9) R语言具有丰富的网上资源

一入门训练

1. 获取帮助
    > help.start() 开启帮助文档
    >help(solve) 显示某命令的帮助信息，或者
    >?solve
    对于由特殊字符指定的功能，这些参数必须用单引号或双引号括起来，使之成为一个“字符串”,如
    > help("[[")
    与某个主题相关的例子通常可以用下面的命令得到
    > example(topic)

2. 命令简介
    R对大小写是敏感的；名称不能以数字开始；
    基本的命令由表达式或者赋值语句组成。如果一个表达式被作为一条命令给出，它将被求值、打印而表达式的值并不被保存。一个赋值语句同样对表达式求值之后把表达式的值传给一个变量，不过并不会自动的被打印出来；
    命令由分号(;)来分隔，或者另起新行；
    基本命令可以由花括号(f和g)合并为一组复合表达式；
    注释几乎可以被放在任何地方，只要是以井号( # )开始，到行末结束；
    如果一个命令在行莫仍没有结束，R将会给出一个不同的提示符，默认的是‘+’。

3. 命令文件的执行和输出转向到文件

如果命令存储于一个外部文件中，比如工作目录work中的commands.R，他们可以随时在R的任务中被执行
> source("commands.R")在Windows中Source也可以由File菜单执行。
函数sink，
> sink("record.lis")
将把所有后续的输出由终端转向一个外部文件，record.lis。命令
> sink() 将把信息重新恢复到终端上。

4. 数据的保持与对象的清除

R所创建、操作的实体是对象。对象可以是变量、数组、字符串、函数以及由这些元素组成的其它结构；
> objects() 用来显示目前存储在R中的对象的名字。而当前存储的所有对象的组合被称为workspace；
清除对象可以使用rm命令：
> rm(x, y, z, ink, junk, temp, foo, bar)
所有在一个R任务中被创建的对象都可以在文件中被永久保存，并在其它的R任务中被使用。在每个R任务结束时用户都有机会保存当前有效的所有对象。如果用户这样做的话，对象将被写入当前目录一个名为.RData。当R被再次启动时R会从这个文件中再载入workspace。同时相关的命令记录也被载入。
所以，推荐大家在用R进行不同的分析时分别使用不同的工作目录。

5. 基本数据结构

数值型(numeric）	1,1.2,3.1415926
复数型(complex)	1+2i
字符型(character)	‘A’/ “hello world!”
逻辑型(logical)	TRUE / FALSE

6. 基本数据对象

向量(vector), 见下节
矩阵(matrix)：
更一般的说数组是向量在多维情况下的一般形式。事实上它们是可以被两个或更多的指标索引的向量，并且以特定的方式被打印出来。
因子(factors) 提供了一种处理分类数据的更简介的方式。
列表(list)：
是向量的一种一般形式，并不需要保证其中的元素都是相同的类型，而且其中的元素经常是向量和列表本身。
数据框(data frame)：
是一种与矩阵相似的结构，其中的列可以是不同的数据类型。可以把数据框看作一种数据"矩阵"，它的每行是一个观测单位，而且(可能)同时包含数值型和分类的变量。
函数( function)：
能够在R的workspace中存储的对象。我们可以通过函数来扩展R的功能。

二简单操作，数值与向量

2.1 向量与赋值

R对命名了的数据结构进行操作。最简单的数据结构是数字向量；如，
> x <- c(10.4, 5.6, 3.1, 6.4, 21.7) c()是创建函数，赋值运算符是'<-'，与函数assign()等价
> assign("x", c(10.4, 5.6, 3.1, 6.4, 21.7)) 也可以写成：
> c(10.4, 5.6, 3.1, 6.4, 21.7) -> x
如果一个表达式被当作一个完整的命令，它的值将被打印到终端但不被储存。
单独输入x则会将值打印出来。也可以打印倒数：
> 1/x
> y <- c(x, 0, x) 也可以将向量作为元素。

2.2 向量运算

操作是按照向量中的元素一个一个进行的。同一个表达式中的向量并不需要具有相同的长度。如果它们的长度不同,表达式的结果是一个与表达式中最长向量有相同长度的向量。表达式中较短的向量会根据它的长度被重复使用若干次(不一定是整数次)，直到与长度最长的向量相匹配。而常数很明显的将被不断重复。如，
> v <- 2*x + y + 1
常用运算有：
+，-，*，/，^（次方）；
log, exp, sin, cos, tan,sqrt等；
max和min的作用是选出所给向量中最大的或最小的元素；
range函数的值是一个长度为2的向量，即c(min(x),max(x))
length(x)返回了向量x中元素的个数，也就是x的长度。
sum(x)给出了x中所有元素的总和；
prod(x)给出x中所有元素的乘积；
mean(x)和var(x)，分别计算样本均值和样本方差，这两个函数分别相当于sum(x)/length(x)，sum((x-mean(x)) \^2)/(length(x) -1)。如果var()的参数是一个n*p的矩阵，那么函数的值是一个p*p的样本协方差矩阵，认为每行是一个p变量的样本向量。
sort(x)返回一个与x具有相同长度的向量，其中的元素按招升序排列。还有其他更灵活的排序功能(参见order()和sort.list())。
pmax和pmin将返回一个与最长的向量长度相等的向量，向量中的元素由参数中所有向量在相应位置的最大值(最小值)组成；
如果要使用复数，需要直接给出一个复数部分。因此sqrt(-17)将会返回NaN(无效数值)和一个警告，而sqrt(-17+0i)将按照复数进行运算。

2.3 生成序列

最简单的方法是用冒号‘：’，冒号具有最高运算优先级。例如1:30就是向量c(1,2,. . .,29,30)。30:1构造一个递减序列。
利用seq()函数构造序列：有五个参数，from, to, by, length, along
                                       from, to可以不写参数名，seq(2,10)就相当于2:10。
                                       by指定步长，默认为1，如seq(-5, 5, by=.2)即为c(-5.0, -4.8, -4.6, ..., 4.6, 4.8, 5.0)
                                       length指定序列长度，如seq(length=51, from=-5, by=.2)，等同于seq(-5, 5, by=.2)
                                       along=vector只能单独使用，产生一个“1:length(vector)”序列。类似的函数是rep(),这个函数可以用多种复杂的方法来
                                           复制一个对象。最简单的形式是> s5 <- rep(x, times=5)

2.4 逻辑向量

TRUE, FALSE, 和NA(not available), 前两个可以简写为T和F，但T/F并不是系统保留字，可以被用户覆盖，所以最好还是不要简写。
逻辑向量是由条件给出的，如下列语句令temp成为一个与x长度相同，相应位置根据是否与条件相符而由TRUE或FALSE组成的向量：
> temp <- x > 13
逻辑操作符包括<, <=, >, >=,完全相等==和不等于!=，与或非分别为&, |, !。
在普通运算中，FALSE当做0而TRUE当做1。

2.5 缺失值

NA(not available): 一般来讲一个NA的任何操作都将返回NA。
     is.na(x)返回一个与x等长的逻辑向量，并且由相应位置的元素是否是NA来决定这个逻辑向量相应位置的元素是TRUE还是FALSE。
     x==NA是一个与x具有相同长度而其所有元素都是NA的向量。
NaN(Not a Number): 由数值运算产生，如0/0, Inf-Inf.
     is.na(x)对于NA和NaN值都返回TRUE，
     is.nan(x)只对NaN值返回TRUE。

2.6 字符向量

字符串在输入时可以使用单引号(')或双以号("); 在打印时用双引号(有时不用引号)。
R使用与C语言风格基本相同的转义符, 所以输入\\打印的也是\\, 输入\" 打印引号", \n: 换行, \t: tab, \b: 回格。
字符向量可以通过函数c()连接；
paste()可以接受任意个参数，并从它们中逐个取出字符并连成字符串，形成的字符串的个数与参数中最长字符串的长度相同。如果参数中包含数字的话，数字将被强制转化为字符串。在默认情况下，参数中的各字符串是被一个空格分隔的，不过通过参数sep=string 用户可以把它更改为其他字符串，包括空字符串。例如：
> labs <- paste(c("X","Y"), 1:10, sep="") 使变量labs成为字符变量c("X1", "Y2", "X3", "Y4", "X5", "Y6", "X7", "Y8", "X9", "Y10")

2.7 index vector---数据集子集的选择与修改

任何结果为一个向量的表达式都可以通过追加索引向量(index vector)来选择其中的子集。
1 逻辑的向量。
> y <- x[!is.na(x)]    表示将向量x中的非NA元素赋给y；
> (x+1)[(!is.na(x)) & x>0] -> z     表示创建一个对象z，其中的元素由向量x+1中与x中的非缺失值和正数对应的向量组成。
2. 正整数的向量
> x[6]    是x的第六个元素
> x[1:10]       选取了x的前10个元素(假设x的长度不小于10)。
> c("x","y")[rep(c(1,2,2,1), times=4)]     产生了一个字符向量，长度为16，由"x", "y", "y", "x"重复4次而组成。
3. 负整数的向量
> y <- x[-(1:5)]       表示向量y取向量x前5个元素以外的元素。
4. 字符串的向量
只存在于拥有names属性并由它来区分向量中元素的向量。这种情况下一个由名称组成的子向量起到了和正整数的索引向量相同的效果。
> fruit <- c(5, 10, 1, 20)
> names(fruit) <- c("orange", "banana", "apple", "peach")
> lunch <- fruit[c("apple","orange")]
子集的修改
> x[is.na(x)] <- 0    表示将向量x中所以NA元素用0来代替
> y[y < 0] <- -y[y < 0]      表示将向量(-y)中与向量y的负元素对应位置的元素赋值给向量y中与向量y负元素对应的元素。作用相当于：
> y <- abs(y)

三对象，模式和属性

3.1 固有属性：模式和长度

对象是R所进行操作的实体，对象可以是向量、列表等，详见1.6.
对象的模式包括numeri，ccomplex，character，logical，list，function，expression等。可以用mode(object)查看。
对象的长度是对象的另一固有属性。可以用length(object)查看。
attribute(object)可以查看更深入的属性。

模式的转换
在允许的情况下(大多数情况都是允许的)，R可以完成各种模式的转换。例如：d<-as.character(z)，将数值向量z<-(0:9)转化为字符向量c("0", "1", "2", ..., "9")。as.integer(d)将d转化为数值向量。
R中很多形式为as.something()的函数，可以完成从一个模式向另一个模式的转化，或者是令对象取得它当前模式不具有的某些属性。

3.2 改变对象的长度

> e <- numeric() 产生一个numeric型的空向量e。character()等类似。此时长度为对象0。
此时新添加一个元素会使e的长度自动调整。
> e[3] <- 17 令e为一个长度为3的向量（此时，该向量的前两个元素都是NA）
缩短（截断）一个对象的长度，只需要一个赋值命令。因此，若alpha是一个长度为10的对象，下面的命令
> alpha <- alpha[2 * 1:5]

3.3 属性的获取和设置

函数attributes(object)将给出当前对象所具有的所有非基本属性（长度和模式属于基本属性）的一个列表。
函数attr(object,name)可以被用来选取一个指定的属性。除了为某些特殊的目的创建新属性这样特殊的环境下，这些函数很少被用到。
当函数attr()用在赋值语句左侧时，既可以是将对象与一种新的属性关联，也可以是对原有属性的更改。例如
> attr(z,"dim") <- c(10,10) 另R将z作为一个10X10的矩阵看待。

3.4 对象的类别

对象的一个特别属性，类别，被用来指定对象在R编程中的风格。比如：如果对象类别"data.frame"则会以特定方式处理。
unclass()可以去除对象的类别。
summary()可以查看对象的基本信息（min, max, mean, etc.）

四有序因子和无序因子

因子是一种向量对象，它给自己的组件指定了一个离散的分类（分组），它的组件由其他等长的向量组成。R提供了有序因子和无序因子。
通俗点说，因子就是将对象的值分成不同的组（levels）。
用函数factor()创建一个因子，levels按序排列(字母序或数值序)。

例如province<-c("四川","湖南","江苏","四川","四川","四川","湖南","江苏","湖南","江苏")，为province创建因子：
> pf<-factor(province) 创建province的因子pf
> pf 打印出来
[1] 四川湖南江苏四川四川四川湖南江苏湖南江苏
Levels: 湖南江苏四川
函数levels()可以用来观察因子中有多少不同的levels。

假如我们拥有这些省份考生的分数：
> score<-c(95,86,84,92,84,79,86,99,85,90)
函数tappley()可以用来计算各省的平均分数，函数tapply()的作用是对它第一个参数的组件中所包含的每个组应用一个参数三指定的函数。
> smeans<-tapply(score,pf,mean)
> smeans
湖南江苏四川
85.66667 91.00000 87.50000
再例如，下面命令会给出各组的length
> tapply(score,pf,length)
湖南江苏四川
3 3 4

函数ordered()可以创建有序因子
> ordered(province)
[1] 四川湖南江苏四川四川四川湖南江苏湖南江苏
Levels: 湖南 < 江苏 < 四川

五数组和矩阵

5.1 数组

数组可以看成一个由递增下标表示的数据项的集合，例如数值。
数组的生成
如果一个向量需要在R中以数组的方式被处理，则必须含有一个维数向量作为它的dim属性。
维度向量由dim()指定，例如，z是一个由1500个元素组成的向量。下面的赋值语句
> dim(z) <- c(3,5,100) 使它具有dim属性，并且将被当作一个3X5X100的数组进行处理。 c(3,5,100) 就是他的维度向量。
还可以用到像matrix()和array()这样的函数来赋值。比如
> array(1:20, dim=c(4,5))
> matrix(1:24, 3,4)
数据向量中的值被赋给数组中的值时，将遵循与FORTRAN相同的原则"主列顺序"，即第一个下标变化的最快，最后的下标变化最慢。
数组的运算
数组可以在算数表达式中使用，结果也是一个数组，这个数组由数据向量逐个元素的运算后组成，通常参与运算的对象应当具有相同的dim属性。

5.2 数组的索引和数组的子块

数组中的单个元素可以通过下标来指定，下标由逗号分隔，写在括号内。
我们可以通过在下标的位置给出一个索引向量来指定一个数组的子块，不过如果在任何一个索引位置上给出空的索引向量，则相当于选取了这个下标的全部范围。
如a[2,,]，a[,3,]等

5.3 索引数组

除了索引向量，还可以使用索引数组来指定数组的某些元素。
例如：有4X5的数组a，若要得到a中的a[1,3], a[2,2] 和a[3,1]这三个元素，可以生成索引向量i，然后用a[i]得到它们。
> a <- array(1:20,dim=c(4,5)) # Generate a 4 by 5 array.
> i <- array(c(1:3,3:1),dim=c(3,2))
> i
[,1] [,2]
[1,] 1 3
[2,] 2 2
[3,] 3 1
> a[i]
[1] 9 6 3
> a[i] <- 0 # 将这三个元素用0替换。

5.4 向量，数组的混合运算

表达式从左到右被扫描；
参与运算的任意对象如果大小不足，都将被重复使用直到与其他参与运算的对象等长；
当较短的向量和数组在运算中相遇时，所有的数组必须具有相同的dim属性，否则返回一个错误；
如果有任意参与运算的向量比参与运算的矩阵或数组长，将会产生错误；
如果数组结构正常声称，并且没有错误或者强制转换被应用于向量上，那么得到的结果与参与运算的数组具有相同的dim属性。

5.5 矩阵的运算

构建分区矩阵：cbind()和rbind()，cbind()按照水平方向，或者说按列的方式将矩阵连接到一起。rbind()按照垂直的方向，或者说按行的方式将矩阵连接到一起。

外积：操作符是%o%:
> ab <- a %o% b 或者
> ab <- outer(a, b, "*")
其中的乘法操作可以由任意一个双变量的函数替代。

广义转置：函数t(A)，或aperm(A, c(2,1))；

获取行数/列数：nrow(A)和ncol(A)分别返回矩阵A的行数和列数。

矩阵乘法：操作符为%*%；

交叉乘积（cross product）：crossprod(X，Y)等同于t(X) %*% y，crossprod(X)等价于crossprod(X, X)；

diag(v)：如果v是向量，diag(v)返回一个由v的元素为对角元素的对角矩阵。
如果v为矩阵，diag(v)返回一个由v主对角元素组成的向量。
如果v只是一个数值，那么diag(v)是一个vXv的单位矩阵。

特征值和特征向量：eigen(Sm)。这个函数的结果是由名为values和vectors的两部分组成的列表。如果只是需要特征值：eigen(Sm)$values

最小二乘拟合即QR分解：lsfit(), qr()。

强制转换为向量：as.vector()，或者直接c().

解线性方程和求矩阵的逆，奇异值分解与行列式见；

六列表和数据帧

6.1 列表

列表是由称作组件的有序对象集合构成的对象。组件的模式或类型不一定相同。
形如Lst <- list(name_1=object_1, . . ., name_m=object_m)的赋值将创建一个包含m个组件的列表，并根据参数中指定的名称为其命名。（其名称可以自由选取）。如果它们的名称被省略，组件将只是被编号。例如：
> Lst <- list(name="Fred", wife="Mary", no.children=3,child.ages=c(4,7,9))

所使用的组件是被复制到新的列表中的，对原始对象没有影响。
组件总是被编号的，并且可以通过编号指定。
Lst[[1]] 即为"Fred"，也可以用 Lst$name，Lst[["name"]]指定。如果Lst[[4]]是一个有下标的数组，Lst[[4]][1]就是它的第一项。
区分Lst[[1]]和Lst[1]，'[[...]]'是选择单个元素时使用的操作符，而'[...]'是一个一般的下标操作符。因此，前者代表列表Lst中的第一个对象；后者是列表Lst的子列表，仅包含列表的第一项。
组件的名称可以缩写，可缩写的程度是只要能令组件被唯一的识别就可以了。如：Lst$na等价于Lst$name， Lst$w等价于Lst$wife。

扩展列表
可以通过指定额外组件的方式。例如
> Lst[5] <- list(matrix=Mat)

连接列表
当连接函数c()的参数为列表时，其结果也是一个模式为列表的对象。由参数中的列表作为组件依次连接而成。
> list.ABC <- c(list.A, list.B, list.C)

6.2 数据帧

数据帧是类别为"data.frame"的列表；
数据帧会被当作各列具有不同模式和属性的矩阵。
数据帧按照矩阵的方式显示，选取的行或列也按照矩阵的方式来索引。

创建数据帧

直接创建：那些满足对数据帧的列（组件）限制的对象可以通过函数data.frame来构建成为一个数据帧
> t <- data.frame(home=statef, loot=income, shot=incomef)
强制转换：如果一个列表的组件与数据帧的限制一致，这个列表就可以通过函数as.data.frame()强制转化为一个数据帧。
外部文件：创建数据帧最简单的方法应当是使用read.table()函数从外部文件中读取整个数据帧。

数据帧和列表的限制

1 组件必须是向量（数值型，字符形，逻辑型），因子，数值矩阵，列表，或其他数据帧；
2 矩阵，列表，数据帧向新数据帧提供的变量数分别等于它们的列数，元素数和变量数；
3 数值向量，逻辑值和因子在数据帧中保持不变，字符向量将被强制转化为因子，其水平是字符向量中所出现的值；
4 数据帧中作为变量的向量结构必须具有相同的长度，而矩阵结构应当具有相同的行大小。

挂接和卸载数据帧

当觉得使用'$'引用数据帧元素(如't$home')麻烦时，可以进行数据帧挂接
> attach(t) 这样可以直接引用数据帧内的元素，而无需'$'，前提是数据帧外没有同名的变量(如name)。
挂接后若要对数据帧元素进行赋值操作，仍需用'$'，否则视为赋值给数据帧外的元素。
赋值后必须要先卸载(detach)再重新挂接后，新值才可见。
> detach(t)

attach()是具有一般性的函数，即它不仅能够将目录和数据帧挂接在搜索路径上，还能挂接其他类别的对象。特别是模式为"list"的对象可以通过相同的方式挂接：
> attach(any.old.list)
任何被挂接的对象都可以用detach来卸载，通过指定位置编号或者指定名称这样的方式.

搜索路径
函数search()将显示目前的搜索路径，可以用来查看数据帧/列表的挂接状态。
ls()（或objects()）命令可以用来检查搜索路径任意位置上的内容。如：ls(), ls(2), ls(t)
R可以在搜索路径中包含至多20个项目,列表和数据帧只能在位置2或更靠后的位置上挂接。

数据帧使用惯例

1 将每个独立的，适当定义的问题所包含的所有变量收入同一个数据帧中，并赋予合适的、易理解、易辨识的名称；
2 处理问题时，当相应的数据帧挂接于位置2，同时在第1层工作目录下存放操作的数值和临时变量；
3 在结束一次工作之前，将你认为对将来有参考价值的变量通过$标记的形式添加到数据帧里面，然后detach()；
4 最后，将工作目录下所有不需要的变量剔除，并且尽量将剩下多余的临时变量都清除干净。
这样我们可以很简单的在同一个目录下处理多个问题，而且对每个问题都可以使用x,y,z这样的变量名。

七从文件中读取数据

7.1 函数read.table()

该函数可以直接将文件中完整的数据帧读入。此时文件要符合特定的格式：
1 第一行应当提供数据帧中每个变量的名称；
2 每一行(除变量名称行)应包含一个行标号和各变量的值。
3 若没有表头(变量名称行)，也没有行标号，只有变量值，则默认变量名称为"v1","v2"...
4 若有表头，但没有行标号，则可以指定参数header=TRUE.

7.2 函数scan()

该函数从键盘或文件中读取数据，并存入向量或列表中。
> inp <- scan(file, what)
第一个参数是文件名,如“test.txt”，若为“”或空，则从键盘读入数据；
第二个参数用于确定读入数据的模式。如：list("",0,0) 指定读入到列表中，列表有三项，且列表第一项是字符型，第二三项是数值型。若为0，则指定读入到一个数值向量中，若为“”则指定读入到字符向量中。

7.3 内置数据集的读取

R本身提供超过50个数据集，同时在功能包（包括标准功能包）中附带更多的数据集。与S-Plus不同，这些数据即必须通过data函数载入。
> data() #获得基本系统提供的数据集列表，然后通过形如
> data(infert) #来载入名为infert的数据集

从其他package中载入数据集
data(package="nls")      #查看nls中数据集
data(Puromycin, package="nls")     #读取nls中Puromycin数据集。
用library()挂接package后，它的数据集也自动包含到搜索路径中了。
library(nls)    #载入package nls
data()      #查看数据集
date(Puromycin)    #载入Puromycin数据集

7.4 编辑数据

在使用一个数据帧或矩阵时，edit提供一个独立的工作表式编辑环境。
> xnew <- edit(xold) #对数据集xold进行编辑。并在完成时将改动后的对象赋值给xnew
> xnew <- edit(data.frame()) #可以通过工作表界面录入新数据。

fix()函数用于直接修改已有的对象，等价于 x<-edit(x).

八概率分布

8.1 R是一个统计表集合(略读)

R提供了一套完整的统计表集合。函数可以对累积分布函数P(X<=x)，概率密度函数，分位函数（对给定的q，求满足P(X<=x) > q的最小x）求值，并根据分布进行模拟。

对于所给的名称，加前缀'd'代表密度(density)，'p'代表CDF，'q'代表分位函数，'r'代表模拟（随即散布）。这几类函数的第一个参数是有规律的，形为dxxx的函数为x，pxxx的函数为q，qxxx的函数为p，rxxx的函数为n（rhyper和rwilcox是特例，他们的第一个参数为nn）。目前为止，非中心参数(non-centrality parameter)仅对CDF和少数几个其他函数有效，细节请参考在线帮助。
所有pxxx和qxxx的函数都具有逻辑参数lower.tail和log.p，而所有的dxxx函数都有参数log，这个是我们可以直接通过
- pxxx(t, ..., lower.tail = FALSE, log.p = TRUE)
获取，比如说，累积失效函数（cumulative/integrated hazard function），H(t) =-log(1-F(t))，以及更精确的对数似然（通过dxxx(..., log = TRUE)）。
此外，对于来自正态分布，具有学生化样本区间的分布还有ptukey和qtukey这样的函数。下面是一些例子
> ## 2-tailed p-value for t distribution
> 2*pt(-2.43, df = 13)
> ## upper 1% point for an F(2, 7) distribution
> qf(0.99, 2, 7)

8.2 检测数据集的分布

函数summary和fivenum这两个函数可以给出摘要，后者只给出数值；
函数stem可以将数值统计结果以类似直方图的方式显示出来；
函数hist()可以绘制直方图；
函数density和line可以获得更漂亮的密度图；
功能包fun中的ecdf函数能绘制经验累积分布函数；
还可以进行拟合正态分布，覆盖拟合CDF；
还可以绘制Quantile-quantile (Q-Q)图有助于我们更细致的检测其分布形态；

8.3 单样本和两样本检验（略读）

九语句组、循环和条件操作

R是一种表达式语言，也就是说其命令类型只有函数或表达式，并由它们返回一个结果。
语句组由花括号‘{ }’确定，此时结果是该组中最后一个能返回值的语句的结果。

条件语句

> if (expr_1) expr_2 else expr_3
其中条件表达式expr1必须返回一个逻辑值，操作符&&和||经常被用于条件部分。
&和|与&&，||的区别在于，&和|按照逐个元素的方式进行计算，&&和||对向量的第一个元素进行运算，只有在必需的时候才对第二个参数求值。
if/else结构的向量版本是函数ifelse，其形式为ifelse (condition,a,b)，产生函数结果的规则是：如果condition[i]为真，对应a[i]元素；反之对应的是b[i]元素。根据这个原则函数返回一个由a,b中相应元素组成的向量，向量长度与其最长的参数等长。

循环语句

> for (name in expr_1) expr_2
其中name是循环变量，expr1是一个向量表达式（通常是1:20这样的序列），而expr2经常是一个表达式语句组，expr2随着name依次取expr1结果向量的值而被多次重复运行。

> repeat(expr)

> while(condition) expr

break语句可以用来中断任何循环，可能是非正常的中断。而且这是中止repeat循环的唯一方式。

next语句可以中止一个特定的循环，跳至下一个.

十编写自己的函数

10.1 函数的定义

> name <- function(arg_1, arg_2, ...) expression
expression是一个R表达式（通常是表达式语句组），并使用参数arg_i来计算出一个数值，表达式的值就是函数的返回值。
函数调用的形式通常都是name(expr1,expr2,...)

10.2 定义新的二元操作符

可以将函数定义为新的二元操作符：
> "%!%" <- function(X, y) { ... }
正如矩阵乘法运算符，%*%，和矩阵外积运算符%o%

10.3 指定参数和默认值

如果被调用函数的参数按照"name = obj"的形式给出，那么参数的次序可以是任意的。
而且，参数序列可以在开始依次序给出，而将指定名称的参数置于后面。
因此，如果由一个函数fun1被定义为
> fun1 <- function(data, data.frame, graph, limit) {
[function body omitted]
}
那么函数可以有多种等价的使用方法，例如
> ans <- fun1(d, df, TRUE, 20)
> ans <- fun1(d, df, graph=TRUE, limit=20)
> ans <- fun1(data=d, limit=20, graph=TRUE, data.frame=df)
默认值：在很多情况下，参数都会被赋予一个普遍适用的默认值。
> fun1 <- function(data, data.frame, graph=TRUE, limit=20) { ... }
则函数可以这样被调用
> ans <- fun1(d, df)
此时与上面三种情况等价，也可以这样调用
> ans <- fun1(d, df, limit=10)
此时改变了一个默认值。
NOTE：参数可以是任意表达式，甚至可以是包含其他参数的表达式；

10.4 额外参数“...”

当需要将一个函数的参数传递给另一个函数时，可以通过包含一个额外的参数"..."实现。
fun1 <- function(data, data.frame, graph=TRUE, limit=20, ...) {
[omitted statements]
if (graph)
par(pch="*", ...)
[more omissions]
}

10.5 全局变量和局部变量

函数内的赋值都是局部变量，退出函数就丢失了。
如果要在函数内进行永久赋值（定义全局变量），需要用到“超赋值”操作符, <<-或者函数assign()。

10.6 一些高级示例

区组设计的效率因子 (E±ciency factors)
删除打印数组中的所有名称
递归的数值积分

10.7 范畴（Scope）

函数主体内出现的标识(symbol)可以被分为3类；正式参数、局部变量和自由变量。
正式参数就是出现在函数参数列表中的参数，他们的值由实际的函数参数与正式参数的绑定（binding）过程决定。
局部变量是在参数主体中，由表达式求值过程决定的变量。
自由变量为既不是正式参数又不是局部变量的变量。赋值之后自由变量成为局部变量。

在R中，自由变量的值由函数被创建的环境中与其同名的第一个变量值决定（我理解为最近的同名变量），这种方式被称为词汇式范畴(lexical scope)。
而在S中，该值由同名的全局变量决定。
例如下面的函数cube，在R中cube（2）=8，在S中报错为sq()找不到n。
cube <- function(n) {
sq <- function() n*n
n*sq()
}

一个银行账户的例子，详见《R语言笔记》。

10.8 定制环境

详见《R语言笔记》。

10.9 类别，通用函数和对象定位

一个对象的类别(class)决定了他会如何被通用函数(generic function)处理。
如果参数本身没有任何类别属性，或者其类别在特定问题中并不满足通用函数的要求，通常会有一个默认的动作被执行。
类别机制使用户可以为特定的目的设计和编写通用函数。
使用> methods(class="data.frame")可以查看数据帧的通用函数。
使用> methods(plot)可以查看plot函数能处理的类别。

十一 R的统计模型

待阅。

十二图形过程

在Windows下用window()命令可以打开图形窗口。

12.1 高级绘图命令

高级绘图函数，由函数参数提供数据生成一幅完整的图形。其中适当的坐标轴，标签和标题都自动生成了（除非你另外指定了）。高级绘图命令每次都生成一幅新的图形，清除当前的图形（如果需要的话）。

1 plot()函数

这是一个通用函数：生成图形的类型取决于第一个参数的类型或类别(class)。
plot(x,y) plot(xy)：
如果x，y是向量，plot(x,y)生成一幅y对x的散点图。用包含两个元素x，y的一个列表或一个两列的矩阵作为一个参数（第二种形式那样的）也能达成相同的效果。
plot(x)：
如果x是一个时间序列，这个命令生成一个时间序列图，如果x是一个数值型向量，则生成一个向量值对它们向量索引的土，而如果x是一个复向量，则生成一个向量中元素的虚部对实部的图。
plot(f) plot(f,y)：
f是一个因子对象，y是一个数值型向量。第一种形式生成一个f的条形图；第二种形式生成y对应于f各个水平的箱线图。
plot(df) plot( expr) plot(y expr)：
df是一个数据帧，y是任意对象，expr是由对象名称组成的列表，分隔符'+'(例如，a + b + c)。前两种形式生成分布式的图形，第一种是数据帧中的变量，第二种是一系列被命名的对象。第三种形式生成y对expr中每个对象的图。

2 显示多元数据

如果X是一个数值矩阵或数据帧，下面的命令
> pairs(X)
生成一个配对的散点图矩阵，矩阵由X中的每列的列变量对其他各列列变量的散点图组成，得到的矩阵中每个散点图行、列长度都是固定的。

当问题涉及到三、四个变量时，使用coplot更好些。如果a和b是数值向量，c是数值向量或因子对象（全都是相同长度的），下面的命令
> coplot(a ~ b | c)
对应c的某些给定值生成数个a对b的散点图。当c是一个因子时，这个命令也就是对c的每个水平生成a对b的散点图。当c是数值向量的时候，这个数值向量被分为一系列的条件区间（conditioning intervals），对应c的每个区间生成一个a对b的散点图。区间的数量和位置可以通过coplot()的参数given.values来控制，函数co.intervals()也可以用来选择区间。我们也可以使用两个给定变量通过命令
>coplot(a ~ b | c+d)
对c和d的每个联合条件区间生成a对b的散点图。

函数coplot()和pairs()都可以使用参数panel=，这个参数可以用来定制我们得到的图形类型。默认的是points()函数，生成一个散点图，不过通过在参数panel=中提供某些其它的低级图形函数，我们可以生成需要的各种图形。一个很有用的函数例子是panel.smooth()。

3 显示图形

qqnorm(x) qqline(x) qqplot(x,y)
分布比较图。第一种形式生成向量x对期望正态分数（一个正态记分图），第二个在上面的图上添加一条穿过分布分位点和数据分位点的直线。第三个命令生成x的分位点对y分位点图，用于分别比较它们的分布。

hist(x) hist(x,nclass=n) hist(x,breaks=b, . . . )
生成数值变量x的直方图。通常会自动选定一个合理的类别数，不过可以通过nclass=参数来指定一个推荐值。或者通过参数breaks=来指定分界点。如果给定了probability=TRUE参数，那么条形图代表相对频数而不是累计数。

dotchart(x, . . . )
创建一个x中数据的点图(dotchart)。点图中y轴给出x中数据的标签，x轴给出它们的值。它允许对落入某一特定区间的所有数据项方便的进行可视化选择。

image(x,y,z, . . . ) contour(x,y,z, . . . ) persp(x,y,z, . . . )
生成三个变量的图。函数image是用不同的颜色绘制一些矩形方格来展示z的值，函数contour通过绘制等高线来展示z的值，函数persp绘制一个3D面。

4 参数配置

add=TRUE      强制函数按照低级图形函数的方式操作，将图形置于当前图形上（仅对某些函数有效）。
axes=FALSE       暂时禁止坐标轴的生成|以便使用axis()函数添加你自己定制的坐标轴。默认情况是axes=TRUE，即包含坐标轴。
log="x"   log="y"   log="xy"      令x,y或者两者全都对数化。这个参数对许多函数都有效，不过不是全部。
type=          参数type=控制所生成图形的类型：
        type="p" 绘制单独的点（默认值）
        type="l" 绘制线
        type="b" 绘制由线连接的点（both）
        type="o" 将点绘在线上
        type="h" 绘制从点到零轴的垂线（high-density）
        type="s" 阶梯式图。第一种形式中，点由垂线的顶部定义；第二种形式里用底部定义。
        type="n" 不绘制。不过坐标轴是绘出的（默认情况）而且要根据数据绘出坐标系统。用来给后续的低级图形函数创建图形作基础。
xlab=string    ylab=string          x轴或y轴的标签。使用这些参数来改变默认的标签，通常的默认值是调用高级绘图函数时所使用对象的名称。
main=string          图表标题，位于图形的顶部，大字体显示。
sub=string         子标题，位于x轴下面，用较小的字体显示。

12.2 低级绘图命令

有些时候高级绘图函数并不能很精确的生成我们想要的图形。这种情况下，我们可以通过低级绘图命令在当前图形上添加信息（例如，点、线或文本）。

points(x,y) lines(x,y)
在当前图形上添加点或线。函数plot()的参数type=也可以用于这些函数（默认的是"p"代表points()和"l"代表lines()）。

text(x,y,labels, . . . )
给定点坐标x,y，在该点添加文本。通常labels是一个整数或字符向量，其中labels[i]出现在点(x[i],y[i])。默认值是1:length(x)。
Note：这个函数通常用于这样的序列中
> plot(x, y, type="n"); text(x, y, names)
图形参数type="n"阻止了点的生成，但是建立了坐标轴，由函数text()提供字符向量names所指定的特定字符。

abline(a, b) abline(h=y) abline(v=x) abline(lm.obj)
在当前图上添加一条斜率为b，截距为a的直线。h=y在图形指定的高度上绘制一条贯穿图形的水平线，同样的，v=x在x轴的指定位置绘制一条贯穿的垂线。而lm.obj是一个包含coefficients组件的列表，该组件的长度为2，分别当作截距和斜率。

polygon(x, y, . . . )
绘制一个多边形，其顶点由(x,y)指定。同时还（可选的）可以加上阴影线，如果图形设备允许的话还可以将多边形填充。

legend(x, y, legend, . . . )
这当前图形的指定位置添加图例。绘制的字符，线条类型，颜色等等由字符向量legend指定。除此之外至少还要给出一个参数v，与绘图单元的相应值，分别有：
legend( , fill=v)填充方框的颜色
legend( , col=v)绘制点线的颜色
legend( , lty=v)线条类型
legend( , lwd=v)线条宽度
legend( , pch=v)绘制字符(字符向量)

title(main,sub)
在当前图形的顶部用大字题添加一个标题main，在底部用较小的字体添加子标题sub。

axis(side, . . . )
在当前图形的指定边上添加坐标，在哪个边上由第一个参数指定（1到4，从底部按照顺时针顺序）。其他参数控制坐标的位置|在图形内或图形外，以及标记的位置和标签。适合在调用参数为axes=FALSE的函数plot()后添加定制的坐标轴。

低级绘图函数通常都需要一些位置信息（例如，x,y坐标）来决定在哪里添加新的元素。坐标以用户坐标(user coordinates)的形式给出，这个坐标系是根据所提供的数据由之前的高级绘图语句定义的。需要x,y参数的地方还可以选用一个单独的参数，即一个由名为x,y的元素组成的列表。相似的，一个两列的矩阵也可以。像locator()（后面会提到）这样的函数也可以按照这种方式交互的指定图形中的位置。

添加数学注释
某些情况下需要在图形中加入数学符号或公式。在R中可以通过在text, mtext,axis或title中指定一个表达式来实现。例如，下面的代码绘制了二项概率函数的公式：
> text(x, y, expression_r(paste(bgroup("(", atop(n, x), ")"),p^x, q^{n-x})))
更多的信息，包括其特性的一个完整列表可以在R中通过下面的命令得到：
> help(plotmath)
> example(plotmath)

添加Hershey矢量字体
> help(Hershey)
> example(Hershey)

12.3 图形的交互

R提供了函数，使用户可以通过鼠标从图形中释放信息或添加信息。

locator(n,type)
等待用户使用鼠标左键在当前图形上选择位置。直到n(默认是512)个点都选完或者点击了鼠标另一个键（Unix,Windows)，在Mac下用鼠标点击图形窗口外的部分也可以结束。参数type的效果和在高级绘图函数中使用时是一样的，即在选择的点绘制指定的图形。默认情况是不绘制图形。函数locator()将所选点的坐标返回到一个列表中，列表包含x,y两个组件。
通常locator()在调用的时候并不带参数。这个功能在为图例或标签这样的图形元素选择位置时比较有用，尤其是这些位置不好通过计算得到的时候。举个例子，如果要在一个野点附近添加一些信息，可以使用下面的命令
> text(locator(1), "Outlier", adj=0)

identify(x, y, labels)
允许用户在x,y（使用鼠标左键）定义的点附近绘制相应的labels的组件（如果没有给出labels就给出该点的序号），突显该点。当鼠标的另一个键被点击时（Unix,Windows）返回被选点的序号，在Mac下通过点击图形窗口外来实现这个效果。
有时我们更想确定图形中的点，而非它们的位置。例如，我们可能希望从图示中选出某些感兴趣的观测点，然后进行某些操作。通过两个数值向量x,y给定一系列坐标(x; y)，我们可以使用identify()函数：
> plot(x,y) > identify(x,y)
函数identify()本身不绘图，但是允许用户移动鼠标，在某点附近点击左键。离鼠标指针最近的点将被突显，并标出其序号（也就是它在向量x/y中的位置）。或者使用identify()的labels参数，把某些信息（例如案例名称）作为突显的标志；或者通过plot=FALSE参数取消所有突显标志。当选点的过程结束后，identify()返回所选点的序号；用户可以使用这些序号从x和y中释放所选的点。

12.4 使用图形参数

通过图形参数可以定制图形显示的几乎所有方面。R包含大量的图形参数，可以控制的包括线条类型，颜色，图标排列，文本对齐等等。

1 持续性变更 (Permanent changes): par()函数

通过par()函数设定图形参数的值会持续性的更改参数的值，也就是说这之后（在当前设备上）所有对图形函数的调用都受到新值的影响。
函数par()用于存取和修改当前图形设备的图形参数列表。
par()不带任何参数，返回当前设备所有图形参数和它们的值的列表。
par(c("col","lty"))
参数为一个字符向量，仅返回参数中指定的图形参数（也是作为一个列表）。
par(col=4, lty=2)
带指定参数（或一个列表型参数），设定指定图形参数的值，并将参数的原始值作为一个列表返回。
所以如果想设定参数绘制一些图形后再恢复成原来的设定，可以这么做：
> oldpar <- par(col=4, lty=2)
. . . plotting commands . . .
> par(oldpar)

2 临时性变更：图形函数的参数

图形参数也可以作为（几乎）所有图形函数的命名参数。这种方式的效果和用于par()函数的效果是一样的，只不过这种改变只在函数调用的区间内有效。比如：
> plot(x, y, pch="+")
生成一个以加号作为绘图符号的散点图，而不改变后续图形的默认的绘图符号。

3 图形参数列表

A 图形元素
R图表由点、线、文本和多边形（填充区）组成。下面的图形参数控制了图形元素的绘制：
pch="+" 用来绘点的字符。这个默认值随不同的图形驱动是不同的，不过通常都是'±'。除非使用"."作为绘图字符，否则绘制的点都会比适当的位置高一点或者低一点，而不是恰好在指定位置。
pch=4当给定一个0到18的整数时，会生成一个特殊的绘图符号。通过下面的命令可以看这些符号都有什么。
> legend(locator(1), as.character(0:18), pch=0:18)
lty=2 线条类型。并不是所有图形设备都支持多种线条类型（在那些支持的设
备上也不全一样），不过线条类型1始终是实线，2及以上的是点、划线或者它们的组合。
lwd=2 线条宽度。所需的线条宽度，是"标准"线条宽度的倍数。对line()等函数绘制的线条和坐标轴都有效果。
col=2 点、线、文本、填充区和图像使用的颜色。每种图形元素都有其可用的颜色列表，这个参数的值就是颜色在列表中的序号。显然，这个参数值对有限的一类设备有效。
font=2 指定文本所使用字体的一个整数。如果可能的话，设备驱动会把1对应普通文本，2对应粗体，3对应斜体，4对应粗斜体。
font.axis font.lab font.main font.sub 这几个参数分别指定坐标轴注释，x,y轴的标签，主、副标题所用的字体。
adj=-0.1 文本对齐和绘图位置有关。0代表左对齐，1代表右对齐，0.5代表水平的中间位置。当前的值使会图位置到左端距离的比例，所以-0.1在文本和绘图位置之间留10%的空白。
cex=1.5 字符缩放。这个值是所需文本字符（包括绘图字符）的大小，与默认文本大小相关。

B 坐标轴和标记
很多R的高级图形都有坐标轴，你可以使用低级图形函数axis()自己创建坐标轴。坐标轴包含三个主要组件：轴线axis line（线条类型由参数lty控制），标记tick mark（沿着轴线划分单元），标号tick label（用来标出这些单元）。这些组件可以用下面这些参数定制。
lab=c(5,7,12)前两个数字分别是x和y轴上所要划分的区间数。第三个数字是坐标轴标签的长度，用字符数来衡量（包括小数点）。参数的值如果选得太小可能导致所有标号都聚在一起。
las=1 坐标轴标签的方向。0代表总是和坐标轴平行，1代表总是水平的，2代表总是垂直于坐标轴。
mgp=c(3,1,0)坐标轴组件的位置。第一个组件是坐标轴标签到坐标轴的距离，单位是文本行(text lines)。第二个组件是到标号的距离，最后一个是轴的巍直到轴线的距离（一般都是0）。正数代表绘图区域外，负数代表区域内。
tck=0.01 标号的长度，绘图区域大小的一个分数作单位。当tck比较小时（小于0.5），就强制x和y轴上的标记为相同大小。tck=1就是生成网格线。取负值时标记画向绘图区域外。内部标记可以使用tck=0.01和mgp=c(1,-1.5,0)。
xaxs="s" yaxs="d" 分别是x、y轴的类型。如果是s(standard)或e(extended)类型，那最大和最小的标记都始终在数据区域之外。如果有某个点离边界非常近，那么扩展型(extended)的轴会稍稍扩展一下。这种类型的轴有时会在边界附近留出大片空白。而i(internal)或r(默认值)类型的轴，标记始终在数据区域内，不过r类型会在边界留出少量空白。
如果这个参数设为d，就锁定当前轴，对之后绘制的所有图形都用这个轴（直到参数被重新设定为其他的那几个值）。这个参数适用于生成一系列固定尺度的图。

C 图边缘（Figure margins）
在R中一个单独图形，图（figure），包含一个绘图区(plot region)，以及环绕着这个区域的边缘（其中可能含有坐标轴标签、标题等等），（通常）这两部分以轴为边界。
一个典型的图是

控制图的样式的图形参数包括：
mai=c(1,0.5,0.5,0)分别是底部，左侧，顶部，右侧的宽度，单位是英寸。
mar=c(4,2,2,1)与mai相似，只是单位是文本行(text lines)。
由于更改一个就会改变另一个的值，所以在这个意义上，mai和mar是等价的。这个参数的默认值通常都太大了；右侧边缘很少用到，如果没标题，顶部边缘也不需要，左侧和底部的边缘应当足够大，以容纳坐标轴和标号。此外，默认值并没有考虑到设备表面的大小：比如，使用postscript()驱动，height=4参数时，除非用mar，mai另外设定，否则图的边缘就要占上大约50%。使用多图环境时（后面会提到）。边缘会减少一半，不过这在多图共用一页的时候可能还不够。

D 多图环境
R允许在一页上创建一个n£m的图的阵列。每个图由自己的边缘，图的阵列还有一个可选的外部边缘，如下图所示。

与多图环境相关的图形参数有：
mfcol=c(3, 2)    mfrow=c(2, 4)
   设定多图阵列的大小。第一个值是行数，第二个值是列数。这两个参数唯一的区别是mfcol把图按列排入，mfrow把图按行排入。上图所示的版式可用mfrow=c(3,2)创建；上图显示的是绘制四幅图后的情况。
mfg=c(2, 2, 3, 2)
    当前图在多图环境下的位置。前两个数字是当前图的行、列数；后两个是其在多图阵列中的行列数。这个参数用来在多图阵列中跳转。你甚至可以在后两个数中使用和真值(true value)不同的值，在同一页上得到大小不同的图。
fig=c(4, 9, 1, 4)/10
    当前图在页面的位置，取值分别是左下角到左边界，右边界，下、上边界的距离与对应边的百分比数。给出的例子是一个页面右下角的图。这个参数可以设定图在页面的绝对位置。
oma=c(2, 0, 3, 0)   omi=(0, 0, 0.8, 0)
       外部边缘的大小。与mar和mai相似，第一个用文本行作单位，第二个以英寸作单位，从下方开始按照顺时针顺序指定。
外部边缘对页标题这类东西很有用。文本可以通过带outer=TRUE参数的mtext()函数加入外部边缘。默认情况下是没有外部边缘的因此必须通过oma或omi指定。
函数split.screen()和layout()可以对多个图形作更复杂的排列。

12.6 设备驱动

R几乎可以在任何一种类型的显示器和打印设备上生成（不同质量的）图形。不过，在这之前，需要告诉R要处理的是哪一种设备。这通过启动一个设备驱动来完成。
设备驱动通过调用设备驱动函数来启动。
某些常用的设备驱动有：
X11()[Unix] 使用X11视窗系统
windows()[Windows] 使用 Windows 视窗系统
postscript()在PostScript打印机上打印或者创建PostScript图形文件
pictex()生成一个LATEX文件
当一个设备使用完之后，可以通过下面的命令终止设备驱动
> dev.off()
这个命令可以确保设备已经结束；例如，在某些硬拷贝的设备中，这个命令可以保证每页都已经完成，并且都被传送到打印机了。

PostScript文档
通过给postscript()函数带上file参数，我们可以把图形以PostScript格式存储到文件中。如果没有给出horizontal=FALSE参数，图形是横向的，你可以通过width和height参数控制图形的大小（图形会自动适应）。例如，命令
> postscript("file.ps", horizontal=FALSE, height=5, pointsize=10)
为一个五英寸的图生成一个包含PostScript代码的文件，可以放在文当中。如果命令中的指定的文件名已经存在，将会被覆盖。

多重图形设备
每个对设备驱动的新调用都会打开一个新的图形设备，在设备列表中加入新的一项。这个设备就成为当前设备，图形输出就传送到这个设备。
dev.list()      返回所有活动中设备的序号和名称。在列表位置1的设备始终是空设备(null device)，这个设备不接收任何图形命令。
dev.next()    dev.prev()     分别返回当前设备的后一个和前一个设备的序号和名称。
dev.set(which=k)     用来把当前设备更改为设备列表中位置k的那个。返回设备的序号和标签。
dev.off(k)    终止图形列表位置k的那个图形设备。对于某些设备，比如postscript，这个命令会立刻打印文件或者正常结束文件，具体怎样处理取决于设备是怎样初始化的。
dev.copy(device,. . . ,which=k)      dev.print(device,. . . ,which=k)
建立一个设备k的拷贝。其中device是一个设备函数，例如postscript，如果需要的话可以在'. . . '中指定其它的参数，dev.print效果相似，不过复制的设备会立刻关闭，所以打印硬拷贝这样的终止操作也会被立即执行。
graphics.off()      终止列表中的所有图形设备，空设备除外。

你可能感兴趣的:(数据挖掘)

机器学习:支持向量机小源学AI 人工智能支持向量机机器学习算法
基本概念1.什么是支持向量机支持向量机是一种二分类模型,在机器学习、计算机视觉、数据挖掘中广泛应用,主要用于解决数据分类问题,它的目的是寻找一个超平面对样本进行分割,分割的原则是间隔最大化(也就是数据集的边缘点到分界点的距离d最大)最终转化成一个凸二次规划问题来求解。通常的SVM用于二元分类问题,对于多元分类问题可将其分解为多个二元分类问题,在进行分类。2.最优分类边界什么才是最优分类边界?什么条
Py的Pandas：Python pandas库的详细介绍、安装和使用方法追逐程序梦想者 pandas python 数据分析
Py的Pandas：Pythonpandas库的详细介绍、安装和使用方法Pandas是一个Python的数据处理库，它提供了快速、灵活、易用且高效的数据结构来进行数据操作。在数据挖掘、数据分析等领域中，Pandas被广泛应用。本文主要介绍Pandas的安装、基本数据结构、数据读写、数据统计以及数据可视化等方面。安装在命令行中使用pip工具安装Pandas：pipinstallpandas基本数据结
调用DeepSeek API接口：实现智能数据挖掘与分析 IT·小灰灰数据挖掘人工智能 python java javascript
在当今数据驱动的时代，企业和开发者越来越依赖高效的数据挖掘与分析工具来获取有价值的洞察。DeepSeek作为一款先进的智能数据挖掘平台，提供了强大的API接口，帮助用户轻松集成其功能到自己的应用中。本文将详细介绍如何调用DeepSeekAPI接口，并探讨其在数据挖掘与分析中的应用。目录一、DeepSeekAPI接口概述二、调用DeepSeekAPI的基本步骤2.1获取API密钥2.2构建HTTP请
大数据专业毕业设计选题118例：数据挖掘数据分析可视化 HaiLang_IT 毕设选题教程毕业设计大数据数据挖掘
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了大数据专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇总
Python：第三方库衍生星球 python 第三方库
1.第三方Python库库名用途pip安装指令NumPy矩阵运算pipinstallnumpyMatplotlib产品级2D图形绘制pipinstallmatplotlibPIL图像处理pipinstallpillowsklearn机器学习和数据挖掘pipinstallsklearnRequestsHTTP协议访问pipinstallrequestsJieba中文分词pipinstalljieba
AI驱动的知识发现：程序员的新机遇 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
AI驱动的知识发现：程序员的新机遇关键词：知识发现,AI驱动,数据挖掘,数据分析,算法优化,数据可视化,机器学习1.背景介绍1.1问题由来在当今信息化时代，数据量呈爆炸性增长，各行各业都面临着海量数据挖掘和知识发现的巨大挑战。传统的统计分析方法已难以满足需求，而人工智能（AI）技术的兴起为这一问题提供了新的解决方案。AI驱动的知识发现，即利用机器学习、深度学习等技术手段，从海量数据中自动提取有用信
机器学习里的逻辑回归Logistic Regression基本原理与应用硅基创想家 AI-人工智能与大模型机器学习逻辑回归人工智能
LogisticRegression即逻辑回归，是一种广泛应用于机器学习和数据挖掘领域的有监督学习算法，以下从原理、应用、算法优缺点等方面进行介绍：基本原理线性回归基础：逻辑回归基于线性回归模型，其基本形式为：z=w1x1+w2x2+⋯+wnxn+bz=w_1x_1+w_2x_2+\cdots+w_nx_n+bz=w1x1+w2x2+⋯+wnxn+b其中xix_ixi是特征变量，wiw_iwi是对
python电商数据挖掘_Python 爬取淘宝商品数据挖掘分析实战 weixin_39946996 python电商数据挖掘
作者孙方辉本文为CDA志愿者投稿作品，转载需授权项目内容本案例选择>>商品类目：沙发；数量：共100页4400个商品；筛选条件：天猫、销量从高到低、价格500元以上。项目目的1.对商品标题进行文本分析词云可视化2.不同关键词word对应的sales的统计分析3.商品的价格分布情况分析4.商品的销量分布情况分析5.不同价格区间的商品的平均销量分布6.商品价格对销量的影响分析7.商品价格对销售额的影响
数据仓库与数据挖掘记录二匆匆整棹还数据仓库数据挖掘人工智能
1.数据仓库的产生从20世纪80年代初起直到90年代初,联机事务处理一直是关系数据库应用的主流。然而,应用需求在不断地变化,当联机事务处理系统应用到一定阶段时,企业家们便发现单靠拥有联机事务处理系统已经不足以获得市场竞争的优势,他们需要对其自身业务的运作以及整个市场相关行业的态势进行分析,进而做出有利的决策。这种决策需要对大量的业务数据包括历史业务数据进行分析才能得到。把这种基于业务数据的决策分析
数据仓库与数据挖掘记录三匆匆整棹还数据挖掘
数据仓库的数据存储和处理数据的ETL过程数据ETL是用来实现异构数据源的数据集成,即完成数据的抓取/抽取、清洗、转换.加载与索引等数据调和工作,如图2.2所示。1）数据提取（Extract）从多个数据源中获取原始数据（如数据库、日志文件、API、云存储等）。数据源可能是结构化（如MySQL）、半结构化（如JSON）、非结构化（如文本）。关键技术：SQL查询、Web爬虫、日志采集工具（如Flume）
DeepSeek与核货宝订货系统的协同进化：智能商业范式重构多用户商城系统订货系统源码 deepseek 人工智能核货宝订货系统
数据处理与分析方面深度数据洞察：利用Deepseek强大的智能数据挖掘与分析能力，处理核货宝订货系统中的海量订单数据、客户数据、商品数据等。比如分析不同地区、不同时间、不同客户群体的订货偏好和趋势，为批发订货企业制定精准的采购、库存和销售策略提供依据。建立行业知识图谱：Deepseek可基于核货宝系统的数据及行业信息，构建批发行业知识图谱，清晰呈现企业、产品、客户、供应商等之间的关系和关联信息，帮
探索Python爬虫：获取淘宝商品详情与订单API接口的深度解析不爱搞技术的技术猿 Python 淘宝API python 爬虫开发语言
引言在数字化时代，电子商务平台的数据挖掘和分析已成为企业获取市场洞察的重要手段。淘宝，作为中国最大的电商平台之一，拥有海量的商品数据和订单信息。对于商家和市场分析师来说，如何高效、合规地获取这些数据，成为了一个迫切需要解决的问题。本文将深入探讨如何利用Python爬虫技术，通过淘宝提供的API接口，合法合规地获取商品详情和订单数据。淘宝API接口概览淘宝开放平台提供了丰富的API接口，允许开发者在
Python爬虫框架Scrapy入门指南健胃消食片片片片 python 爬虫 scrapy
Scrapy是一个高效、灵活、开放的Python爬虫框架，它可以帮助开发者快速地开发出高质量的网络爬虫，而不需要太多的编码工作。以下是对Scrapy的入门指南：一、Scrapy简介Scrapy是一个用于抓取网站和提取结构化数据的应用程序框架，可用于各种有用的应用程序，如数据挖掘、信息处理或历史存档。尽管Scrapy最初是为网络抓取而设计的，但它也可用于使用API提取数据或用作通用网络爬虫。Scra
MINITAB中文教程：统计分析与质量管理聚合收藏
本文还有配套的精品资源，点击获取简介：MINITAB作为一款强大的统计分析工具，在质量控制、数据挖掘和实验设计等领域广受欢迎。该教程旨在为初学者提供一个友好的起点，通过详细的界面介绍、数据管理、基本统计分析、图形制作、质量控制、回归分析、过程能力分析、假设检验、多元统计和质量改进工具等内容的学习，使用户能够通过实例和练习，提高数据分析和质量管理的实际操作技能。教程采用PPT格式，以直观高效的方式呈
DataSet：数据挖掘与机器学习应用 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
DataSet：数据挖掘与机器学习应用作者：禅与计算机程序设计艺术1.背景介绍1.1.数据挖掘与机器学习的兴起近年来，随着互联网、物联网、云计算等技术的快速发展，全球数据量呈现爆炸式增长，数据的积累为数据挖掘和机器学习提供了丰富的素材。数据挖掘和机器学习作为从数据中提取有用信息和知识的关键技术，正在各个领域发挥着越来越重要的作用，例如商业智能、金融分析、医疗诊断、网络安全等等。1.2.DataSe
企业智能分析BI：洞察数据，驱动未来用友协同与数据服务大数据
在数据驱动的今天，企业运营不再仅仅依赖于直觉和经验，而是越来越多地依赖于深入的数据分析和精准的商业洞察。企业智能分析BI（BusinessIntelligence）系统，作为企业数据管理的得力助手，正在以其卓越的数据分析能力，帮助企业解锁数据潜能，驱动业务增长。企业智能分析BI系统，是一种运用数据仓库、在线分析和数据挖掘技术来处理和分析数据的崭新技术，目的是帮助企业决策者做出更好的决策。它像一把钥
使用MATLAB实现SMOTE算法 PixelLancer matlab 算法人工智能 Matlab
在数据挖掘和机器学习中，合成少数类过采样技术（SyntheticMinorityOver-samplingTechnique，简称SMOTE）是一种常用的处理类别不平衡问题的方法。本文将介绍如何使用MATLAB实现SMOTE算法，并提供相应的源代码。SMOTE算法通过合成新的少数类样本来平衡类别不平衡的数据集。它通过在少数类样本之间插入合成样本，以增加少数类样本的数量。这些合成样本是通过在少数类样
PDFMiner，一款超级强大的 Python 库快乐星球没有乐 python 人工智能开发语言 windows
介绍PDFMiner是一个用于从PDF文档中提取信息的工具，它可以解析PDF文件并提供不同层次的数据抽取。PDFMiner可以解析文本、注释、表单数据等，是一个广受欢迎的Python库，特别适用于需要处理PDF内容的数据挖掘和分析任务。安装方式安装PDFMiner非常简单，可以使用Python的包管理器pip进行安装。在终端或命令提示符中输入以下命令即可：pipinstallpdfminer.si
想做 Python 聊天机器人，有什么好用的中文分词、数据挖掘、AI方面的 Python 库或者开源项目推荐 xiamu_CDA 人工智能 python 机器人
想做Python聊天机器人，有什么好用的中文分词、数据挖掘、AI方面的Python库或者开源项目推荐？在当今数字化时代，聊天机器人已经成为了连接人与机器的重要桥梁。从客户服务到娱乐互动，从智能家居到医疗咨询，聊天机器人的应用场景越来越广泛。而作为一门强大的编程语言，Python在构建聊天机器人方面拥有得天独厚的优势。如果你正打算开发一个Python聊天机器人，尤其是涉及到中文分词、数据挖掘和AI技
高效利用爬虫开发获取淘宝分类详情：电商数据挖掘新路径 Jason-河山爬虫数据挖掘人工智能
在电商领域，淘宝作为中国最大的电商平台之一，其分类详情数据对于市场分析、竞争策略制定以及电商运营优化具有极高的价值。通过爬虫技术，我们可以高效地获取这些数据，为电商从业者提供强大的数据支持。本文将详细介绍如何利用爬虫技术获取淘宝分类详情，并提供具体的实现方法和注意事项。一、淘宝分类详情数据的价值淘宝的分类详情数据不仅包括商品的分类名称、分类层级，还可能包含每个分类下的热门商品、价格区间等信息。这些
Python 数据挖掘与机器学习岁月如歌，青春不败人工智能 python 数据挖掘机器学习编程决策树随机森林神经网络
模块一：Python编程Python编程入门1、Python环境搭建2、如何选择Python编辑器？3、Python基础4、常见的错误与程序调试5、第三方模块的安装与使用6、文件读写（I/O）Python进阶与提高1、Numpy模块库2、Pandas模块库3、Matplotlib基本图形绘制4、图形样式的美化5、图形的布局6、高级图形绘制7、坐标轴高阶应用模块二：特征工程数据清洗1、描述性统计分析
机器学习与数据挖掘：决策树（知识点总结） KE.WINE 机器学习机器学习数据挖掘决策树
决策树叶节点对应于决策结果，内部节点表示一个特征或属性。基本流程决策树算法递归返回的三个条件：当前结点包含的样本全属于同一类别，无需划分;当前属性集为空,或是所有样本在所有属性上取值相同，无法划分;*将当前节点标记为叶节点，将其类别设定为该节点所含样本最多的类别；当前结点包含的样本集合为空，不能划分；*将当前节点标记为叶节点，将其类别设定其父节点所含样本最多的类别；划分选择决策树学习算法包括3部分
错误信息：Traceback (most recent call last): L_cl 常见算法与知识积累 python
错误信息Traceback(mostrecentcalllast):File"E:\python.learning\pythonDateExcavateTreat\数据挖掘课程设计\2_京东用户意向购买数据探索.py",line74,indf_ui=df_ui.to_frame().reset_index()File"E:\python.learning\lib\site-packages\pan
Python-玩转数据-凸优化人猿宇宙 python 数据挖掘人工智能
一、说明最优化问题目前在机器学习，数据挖掘等领域应用非常广泛，因为机器学习简单来说，主要做的就是优化问题，先初始化一下权重参数，然后利用优化方法来优化这个权重，直到准确率不再是上升，迭代停止，那到底什么是最优化问题呢？比如你要从上海去北京，你可以选择搭飞机，或者火车，动车，但只给你500块钱，要求你以最快的时间到达，其中到达的时间就是优化的目标，500块钱是限制条件，选择动车，火车，或者什么火车都
python必读书单 Vin0sen python 开发语言
文章目录{编程入门}{编程进阶}{算法基础}{Web开发}{网络编程}{爬虫}{安全}{数据分析}{数据科学}{数据挖掘}{机器学习}{深度学习}{其他方向}{编程入门}父与子的编程之旅：与小卡特一起学Python[HOT]Python2.7和孩子一起玩编程Python2.7零压力学PythonPython3.0，但也指出了如何修改示例，以支持Python2.0Python编程：从入门到实践[HO
利用python下载股票交易数据 weixin_30725315 python
前段时间玩Python时无意看到了获取股票交易数据的tushare模块，由于自己对股票交易挺有兴趣，加上现在又在做数据挖掘工作，故想先将股票数据下载到数据库中，以便日后分析：#导入需要用到的模块fromqueueimportQueueimportthreadingimportosimportdatetimeimporttushareastsfromsqlalchemyimportcreate_en
大数据相关职位介绍之三（数据挖掘，数据安全，数据合规师，首席数据官，数据科学家）小Tomkk 大数据大数据数据挖掘首席数据官数据合规师数据安全数据科学家
大数据相关职位介绍之三（数据挖掘，数据安全，数据合规师，首席数据官，数据科学家）文章目录大数据相关职位介绍之三（数据挖掘，数据安全，数据合规师，首席数据官，数据科学家）1.数据挖掘工程师（DataMiningEngineer）2.数据安全工程师（DataSecurityEngineer）3.数据合规师（DataComplianceOfficer）4.首席数据官（CDO-ChiefDataOffic
[利用Python加载和处理网址内容：从Unstructured到Selenium和Playwright] bhawfgrcbtwny python selenium 开发语言
引言在现代网页数据分析中，加载和处理来自多种网址的内容是一个常见需求。无论是数据挖掘还是网页内容分析，我们常常需要从多个网页中提取HTML文档。本篇文章将介绍如何利用Python中的Unstructured、Selenium和Playwright库来加载这些网页内容，并将其转换为适合后续处理的文档格式。主要内容UnstructuredURLLoaderUnstructuredURLLoader可以
数据挖掘常用算法优缺点分析天波烟客00 数据挖掘数据挖掘机器学习
领取机器学习视频教程：http://www.admin444.com/P-c8129a48常用的机器学习、数据挖掘方法有分类，回归，聚类，推荐，图像识别等。在实际应用中，一般都是采用启发式学习方式来实验。偏差&方差偏差：描述的是预测值（估计值）的期望与真实值之间的差距，偏差越大，越偏离真实数据。偏差bias其实是模型太简单而带来的估计不准确的部分---欠拟合方差：描述的是预测值的变化范围、离散程度
【机器学习与数据挖掘实战】案例11：基于灰色预测和SVR的企业所得税预测分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘灰色预测 SVR 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C