a_achengsong

支持向量机SVM算法原理及应用（R）

只要接触到数据挖掘/机器学习，相比都会听过“支持向量机”的大名。在机器学习领域，支持向量机SVM(Support Vector Machine)是一个有监督的学习模型，通常用来进行模式识别、分类、以及回归分析。SVM涉及的知识面非常广，目标函数、优化过程、并行方法、算法收敛性、样本复杂度等。学习SVM可以看《统计学习方法》、Andrew Ng支持向量机等，这里推荐一个博客，讲的非常详细，我就不搬过来了，大家可以直接去看那篇博客，最好能静下心来直接拿起笔跟着博主推理一边，这样更能加深印象。

http://blog.csdn.net/v_july_v/article/details/7624837

学习完原理，接下来就该应用了，应用后更能加深对SVM的理解。

从事渔业生产有经验的从业者可通过观察水色变化调控水质，以维持养殖水体生态系统中浮游植物、微生物类、浮游动物等合理的动态平衡。由于这些多是通过经验和肉眼观察进行判断，存在主观性引起的观察性偏倚，使观察结果的可比性、可重复性降低，不易推广应用。当前，数字图像处理技术为计算机监控技术在水产养殖业的应用提供更大的空间。在水质在线监测方面，数字图像处理技术是基于计算机视觉，以专家经验为基础，对池塘水色进行优劣分级，达到对池塘水色的准确快速判别。

水色分类

水色

浅绿色（清水或浊水）

灰蓝色

黄褐色

茶褐色

（姜黄、茶褐、红褐、褐中带绿等）

绿色（黄绿、油绿、蓝绿、墨绿、绿中带褐等）

水质类别

标准条件下拍摄的水样图像

每个水质图片命名规则为“类别-编号.jpg”，如“1_1.jpg”说明当前图片属于第1类的样本。

接下来进行特征提取

采用颜色矩来提取水样图像的特征

水色图像特征与相应的水色类别的部分数据

水质类别	序号	R通道一阶矩	G通道一阶矩	B通道一阶矩	R通道二阶矩	G通道二阶矩	B通道二阶矩	R通道三阶矩	G通道三阶矩	B通道三阶矩
1	1	0.582823	0.543774	0.252829	0.014192	0.016144	0.041075	-0.01264	-0.01609	-0.04154
2	1	0.495169	0.539358	0.416124	0.011314	0.009811	0.014751	0.015367	0.01601	0.019748
3	1	0.510911	0.489695	0.186255	0.012417	0.010816	0.011644	-0.00747	-0.00768	-0.00509
4	1	0.420351	0.436173	0.167221	0.01122	0.007195	0.010565	-0.00628	0.003173	-0.00729
5	1	0.211567	0.335537	0.111969	0.012056	0.013296	0.00838	0.007305	0.007503	0.00365
1	2	0.563773	0.534851	0.271672	0.009723	0.007856	0.011873	-0.00513	0.003032	-0.00547
2	2	0.465186	0.508643	0.361016	0.013753	0.012709	0.019557	0.022785	0.022329	0.031616
3	2	0.533052	0.506734	0.185972	0.011104	0.007902	0.01265	0.004797	-0.0029	0.004214
4	2	0.398801	0.42556	0.191341	0.014424	0.010462	0.01547	0.009207	0.006471	0.006764
5	2	0.298194	0.427725	0.097936	0.014778	0.012456	0.008322	0.00851	0.006117	0.00347
1	3	0.630328	0.594269	0.298577	0.007731	0.005877	0.010148	0.003447	-0.00345	-0.00653
2	3	0.491916	0.546367	0.425871	0.010344	0.008293	0.01226	0.009285	0.009663	0.011549
3	3	0.559437	0.522702	0.194201	0.012478	0.007927	0.012183	0.004477	-0.00341	-0.00529
4	3	0.402068	0.431443	0.177364	0.010554	0.007287	0.010748	0.006261	-0.00341	0.006419
5	3	0.408963	0.486953	0.178113	0.012662	0.009752	0.014497	-0.00672	0.002168	0.009992
1	4	0.638606	0.61926	0.319711	0.008125	0.006045	0.009746	-0.00487	0.003083	-0.0045

SVM预测模型输入变量

序号	变量名称	变量描述	取值范围
1	R通道一阶矩	水样图像在R颜色通道的一阶矩	0～1
2	G通道一阶矩	水样图像在G颜色通道的一阶矩	0～1
3	B通道一阶矩	水样图像在B颜色通道的一阶矩	0～1
4	R通道二阶矩	水样图像在R颜色通道的二阶矩	0～1
5	G通道二阶矩	水样图像在G颜色通道的二阶矩	0～1
6	B通道二阶矩	水样图像在B颜色通道的二阶矩	0～1
7	R通道三阶矩	水样图像在R颜色通道的三阶矩	-1～1
8	G通道三阶矩	水样图像在G颜色通道的三阶矩	-1～1
9	B通道三阶矩	水样图像在B颜色通道的三阶矩	-1～1
10	水质类别	不同类别能表征水中浮游植物的种类和多少	1，2，3，4，5

图形转换为数据后，R语言建模

建模之前，我来介绍下R语言的SVM用法。使用SVM需安装e1071包

第一种简单方式建模：

svm(formula, data= NULL, subset, na.action = na.omit , scale= TRUE)

formula：函数模型的形式

data：模型中包含的有变量的一组可选格式数据。

参数na.action用于指定当样本数据中存在无效的空数据时系统应该进行的处理。默认值na.omit表明程序会忽略那些数据缺失的样本。另外一个可选的赋值是na.fail，它指示系统在遇到空数据时给出一条错误信息。

参数scale为一个逻辑向量，指定特征数据是否需要标准化（默认标准化为均值0，方差1）。索引向量subset用于指定那些将被来训练模型的采样数据。

第二种根据所给的数据建模：

svm(x, y = NULL, scale = TRUE, type = NULL, kernel = "radial",degree = 3, gamma = if (is.vector(x)) 1 else 1 / ncol(x),coef0 = 0, cost = 1, nu = 0.5, subset, na.action = na.omit)

此处，x可以是一个数据矩阵，也可以是一个数据向量，同时也可以是一个稀疏矩阵。y是对于x数据的结果标签，它既可以是字符向量也可以为数值向量。x和y共同指定了将要用来建模的训练数据以及模型的基本形式。
参数type用于指定建立模型的类别。支持向量机模型通常可以用作分类模型、回归模型或者异常检测模型。根据用途的差异，在svm()函数中的type可取的值有C-classification、nu-classification、one-classification、eps-regression和nu-regression这五种类型中。其中，前三种是针对于字符型结果变量的分类方式，其中第三种方式是逻辑判别，即判别结果输出所需判别的样本是否属于该类别；而后两种则是针对数值型结果变量的分类方式。
此外，kernel是指在模型建立过程中使用的核函数。针对线性不可分的问题，为了提高模型预测精度，通常会使用核函数对原始特征进行变换，提高原始特征维度，解决支持向量机模型线性不可分问题。svm()函数中的kernel参数有四个可选核函数，分别为线性核函数、多项式核函数、高斯核函数及神经网络核函数。其中，高斯核函数与多项式核函数被认为是性能最好、也最常用的核函数。
核函数有两种主要类型：局部性核函数和全局性核函数，高斯核函数是一个典型的局部性核函数，而多项式核函数则是一个典型的全局性核函数。局部性核函数仅仅在测试点附近小领域内对数据点有影响，其学习能力强、泛化性能较弱；而全局性核函数则相对来说泛化性能较强、学习能力较弱。
对于选定的核函数，degree参数是指核函数多项式内积函数中的参数，其默认值为3。gamma参数给出了核函数中除线性内积函数以外的所有函数的参数，默认值为l。coef0参数是指核函数中多项式内积函数与sigmoid内积函数中的参数，默认值为0。
另外，参数cost就是软间隔模型中的离群点权重。最后，参数nu是用于nu-regression、nu-classification和one-classification类型中的参数。
一个经验性的结论是，在利用svm()函数建立支持向量机模型时，使用标准化后的数据建立的模型效果更好。

colnames(Data)<-c("class","id","R1","G1","B1","R2","G2","B2","R3","G3","B3")
head(Data)

##   class id        R1        G1        B1          R2          G2
## 1     1  1 0.5828229 0.5437737 0.2528287 0.014192030 0.016143875
## 2     1 10 0.6416595 0.5706572 0.2137280 0.015438840 0.011177918
## 3     1 11 0.6036844 0.5767189 0.2822538 0.008658572 0.007074807
## 4     1 12 0.5897057 0.5937430 0.2522425 0.007908293 0.005940868
## 5     1 13 0.5910962 0.5920930 0.2535949 0.007448469 0.006494667
## 6     1 14 0.5886801 0.5696339 0.3189053 0.007527690 0.005046087
##            B2           R3           G3           B3
## 1 0.041075252 -0.012643137 -0.016090364 -0.041536239
## 2 0.013707795  0.009727136 -0.003723814 -0.003779448
## 3 0.012203640 -0.004694985 -0.002570890 -0.009450531
## 4 0.010568364  0.003303400 -0.003416659 -0.005273416
## 5 0.012151602  0.000496116 -0.002235644 -0.005095575
## 6 0.008386259 -0.003529253  0.001746734 -0.005790924

#数据分割
set.seed(1234)#设置随机种子
#定义序列ind，随机抽取1和2,1的个数占80%，2的个数占20%
ind <- sample(2, nrow(Data), replace=TRUE, prob=c(0.8, 0.2))
traindata <-Data[ind==1,]#训练数据
testdata <- Data[ind==2,]#测试数据
#将class列转换为factor类型
traindata<-transform(traindata,class=as.factor(class))
testdata<-transform(testdata,class=as.factor(class))
##支持向量机分类模型构建
library(e1071)#加载e1071包
#利用svm建立支持向量机分类模型
svm.model<-svm(class~., traindata[,-2])
summary(svm.model)

## 
## Call:
## svm(formula = class ~ ., data = traindata[, -2])
## 
## 
## Parameters:
##    SVM-Type:  C-classification 
##  SVM-Kernel:  radial 
##        cost:  1 
##       gamma:  0.1111111 
## 
## Number of Support Vectors:  119
## 
##  ( 31 26 41 16 5 )
## 
## 
## Number of Classes:  5 
## 
## Levels: 
##  1 2 3 4 5

#通过summary函数可以得到关于模型的相关信息。其中，SVM-Type项目说明本模型的类别为C分类器模型；SVM-Kernel项目说明本模型所使用的核函数为高斯内积函数且核函数中参数gamma的取值为0.11；cost项目说明本模型确定的约束违反成本为l。而且我们还可以看到，模型找到了119个支持向量：第一类包含有31个支持向量，第二类包含有26个支持向量，第三类包含41个支持向量，第四类包含有16个支持向量，第三类包含5个支持向量。最后一行说明模型中的三个类别分别为1、2、3、4、5.

#建立混淆矩阵
#训练集
confusion.train.svm=table(traindata$class,predict(svm.model,traindata,type="class"))
accuracy.train.svm=sum(diag(confusion.train.svm))/sum(confusion.train.svm)
confusion.train.svm

##    
##      1  2  3  4  5
##   1 41  0  2  0  0
##   2  0 37  0  0  0
##   3  1  0 61  0  0
##   4  0  0  2 15  0
##   5  1  0  0  0  4

accuracy.train.svm

## [1] 0.9634146

#测试集
confusion.test.svm=table(testdata$class,predict(svm.model,testdata,type="class"))
accuracy.test.svm=sum(diag(confusion.test.svm))/sum(confusion.test.svm)
confusion.test.svm

##    
##      1  2  3  4  5
##   1  8  0  0  0  0
##   2  0  7  0  0  0
##   3  0  0 16  0  0
##   4  0  1  2  4  0
##   5  0  0  0  0  1

accuracy.test.svm

## [1] 0.9230769

#随机森林
library(randomForest)

## randomForest 4.6-12

## Type rfNews() to see new features/changes/bug fixes.

randomForest.model<-randomForest(class~., traindata[,-2])
summary(randomForest.model)

##                 Length Class  Mode     
## call               3   -none- call     
## type               1   -none- character
## predicted        164   factor numeric  
## err.rate        3000   -none- numeric  
## confusion         30   -none- numeric  
## votes            820   matrix numeric  
## oob.times        164   -none- numeric  
## classes            5   -none- character
## importance         9   -none- numeric  
## importanceSD       0   -none- NULL     
## localImportance    0   -none- NULL     
## proximity          0   -none- NULL     
## ntree              1   -none- numeric  
## mtry               1   -none- numeric  
## forest            14   -none- list     
## y                164   factor numeric  
## test               0   -none- NULL     
## inbag              0   -none- NULL     
## terms              3   terms  call

randomForest.model

## 
## Call:
##  randomForest(formula = class ~ ., data = traindata[, -2]) 
##                Type of random forest: classification
##                      Number of trees: 500
## No. of variables tried at each split: 3
## 
##         OOB estimate of  error rate: 9.15%
## Confusion matrix:
##    1  2  3  4 5 class.error
## 1 36  3  4  0 0  0.16279070
## 2  1 35  1  0 0  0.05405405
## 3  2  0 60  0 0  0.03225806
## 4  0  0  1 16 0  0.05882353
## 5  1  0  0  2 2  0.60000000

#训练集
confusion.train.randomForest=table(traindata$class,predict(randomForest.model,traindata,type="class"))
accuracy.train.randomForest=sum(diag(confusion.train.randomForest))/sum(confusion.train.randomForest)
confusion.train.randomForest

##    
##      1  2  3  4  5
##   1 43  0  0  0  0
##   2  0 37  0  0  0
##   3  0  0 62  0  0
##   4  0  0  0 17  0
##   5  0  0  0  0  5

accuracy.train.randomForest

## [1] 1

#测试集
confusion.test.randomForest=table(testdata$class,predict(randomForest.model,testdata,type="class"))
accuracy.test.randomForest=sum(diag(confusion.test.randomForest))/sum(confusion.test.randomForest)
confusion.test.randomForest

##    
##      1  2  3  4  5
##   1  7  0  1  0  0
##   2  0  7  0  0  0
##   3  1  0 15  0  0
##   4  0  0  2  5  0
##   5  0  0  0  0  1

accuracy.test.randomForest

## [1] 0.8974359

#神经网络
library(nnet)
nnet.model<-nnet(class~., traindata[,-2],size=30,decay=.001)

## # weights:  455
## initial  value 318.920319 
## iter  10 value 176.714302
## iter  20 value 57.798855
## iter  30 value 42.657486
## iter  40 value 27.296733
## iter  50 value 20.803959
## iter  60 value 18.519644
## iter  70 value 16.706718
## iter  80 value 15.700517
## iter  90 value 15.200025
## iter 100 value 14.797823
## final  value 14.797823 
## stopped after 100 iterations

summary(nnet.model)

## a 9-30-5 network with 455 weights
## options were - softmax modelling  decay=0.001
##  b->h1 i1->h1 i2->h1 i3->h1 i4->h1 i5->h1 i6->h1 i7->h1 i8->h1 i9->h1 
##  -2.75  -1.05  -1.31  -0.04   0.00   0.00  -0.03   0.06   0.00   0.11 
##  b->h2 i1->h2 i2->h2 i3->h2 i4->h2 i5->h2 i6->h2 i7->h2 i8->h2 i9->h2 
##   1.55  -2.29  -0.37  -0.76   1.02   1.46   1.91  -1.90  -2.21  -2.26 
##  b->h3 i1->h3 i2->h3 i3->h3 i4->h3 i5->h3 i6->h3 i7->h3 i8->h3 i9->h3 
##   3.06   2.93   2.01 -17.11   1.57   0.56   0.62  -0.89   0.67   3.71 
##  b->h4 i1->h4 i2->h4 i3->h4 i4->h4 i5->h4 i6->h4 i7->h4 i8->h4 i9->h4 
##  13.76 -20.60  -2.70 -13.91   0.05   0.26   1.69  -0.41  -0.87  -1.86 
##  b->h5 i1->h5 i2->h5 i3->h5 i4->h5 i5->h5 i6->h5 i7->h5 i8->h5 i9->h5 
##   8.63  -7.74  -8.29  -0.52  -5.14  -4.83  -5.11   6.94   2.07   0.17 
##  b->h6 i1->h6 i2->h6 i3->h6 i4->h6 i5->h6 i6->h6 i7->h6 i8->h6 i9->h6 
##   2.16  -7.64   0.96   4.96   1.28   2.07   2.49  -2.65  -1.87  -3.63 
##  b->h7 i1->h7 i2->h7 i3->h7 i4->h7 i5->h7 i6->h7 i7->h7 i8->h7 i9->h7 
##   7.74  -7.29  -6.89  -4.14  -1.00  -0.61   0.63   1.61  -1.54  -5.57 
##  b->h8 i1->h8 i2->h8 i3->h8 i4->h8 i5->h8 i6->h8 i7->h8 i8->h8 i9->h8 
##  -6.20   6.18   5.23  -0.35   4.25   3.92   4.70  -5.18  -2.24  -3.47 
##  b->h9 i1->h9 i2->h9 i3->h9 i4->h9 i5->h9 i6->h9 i7->h9 i8->h9 i9->h9 
##   7.43  -6.77 -11.18   7.93  -5.95  -5.05  -4.73   7.39   1.18  -4.61 
##  b->h10 i1->h10 i2->h10 i3->h10 i4->h10 i5->h10 i6->h10 i7->h10 i8->h10 
##    2.12    0.33    0.54   -0.99    0.11    0.04    0.11   -0.03   -0.09 
## i9->h10 
##    0.06 
##  b->h11 i1->h11 i2->h11 i3->h11 i4->h11 i5->h11 i6->h11 i7->h11 i8->h11 
##   -2.55    0.01   -0.82   -0.21   -0.22   -0.18   -0.32    0.06    0.12 
## i9->h11 
##    0.54 
##  b->h12 i1->h12 i2->h12 i3->h12 i4->h12 i5->h12 i6->h12 i7->h12 i8->h12 
##  -18.76   15.10    9.42   20.70    1.89    0.88    2.24    1.13    3.40 
## i9->h12 
##  -11.18 
##  b->h13 i1->h13 i2->h13 i3->h13 i4->h13 i5->h13 i6->h13 i7->h13 i8->h13 
##    2.17  -11.66    0.77   13.47   -2.00   -0.48   -1.18   -0.16   -0.14 
## i9->h13 
##   -0.44 
##  b->h14 i1->h14 i2->h14 i3->h14 i4->h14 i5->h14 i6->h14 i7->h14 i8->h14 
##    4.90  -14.11    4.32   -7.64    1.13    1.22    1.62   -2.77   -0.60 
## i9->h14 
##    1.82 
##  b->h15 i1->h15 i2->h15 i3->h15 i4->h15 i5->h15 i6->h15 i7->h15 i8->h15 
##   -2.00   -0.21   -1.04   -0.65   -0.22   -0.17   -0.26    0.19    0.06 
## i9->h15 
##    0.34 
##  b->h16 i1->h16 i2->h16 i3->h16 i4->h16 i5->h16 i6->h16 i7->h16 i8->h16 
##    0.55   -0.72    1.13    1.70    0.21    0.33    0.16   -0.40   -0.18 
## i9->h16 
##    0.23 
##  b->h17 i1->h17 i2->h17 i3->h17 i4->h17 i5->h17 i6->h17 i7->h17 i8->h17 
##    1.95   -1.02    0.93   -0.71    0.08    0.13    0.02   -0.18   -0.07 
## i9->h17 
##   -0.02 
##  b->h18 i1->h18 i2->h18 i3->h18 i4->h18 i5->h18 i6->h18 i7->h18 i8->h18 
##   -1.94    0.39   -0.65   -0.33   -0.43   -0.58   -0.58    0.56    0.36 
## i9->h18 
##    0.89 
##  b->h19 i1->h19 i2->h19 i3->h19 i4->h19 i5->h19 i6->h19 i7->h19 i8->h19 
##   -2.89   -0.62   -1.17   -0.62   -0.03   -0.05   -0.15    0.05    0.05 
## i9->h19 
##    0.25 
##  b->h20 i1->h20 i2->h20 i3->h20 i4->h20 i5->h20 i6->h20 i7->h20 i8->h20 
##    2.69    0.93    1.39    0.74    0.30    0.32    0.45   -0.33   -0.34 
## i9->h20 
##   -0.31 
##  b->h21 i1->h21 i2->h21 i3->h21 i4->h21 i5->h21 i6->h21 i7->h21 i8->h21 
##   -2.97   -0.45   -1.26    0.46   -0.13   -0.19   -0.35    0.24    0.15 
## i9->h21 
##    0.53 
##  b->h22 i1->h22 i2->h22 i3->h22 i4->h22 i5->h22 i6->h22 i7->h22 i8->h22 
##   -2.02   -0.48   -1.09   -0.70   -0.07   -0.14   -0.26    0.21    0.04 
## i9->h22 
##    0.34 
##  b->h23 i1->h23 i2->h23 i3->h23 i4->h23 i5->h23 i6->h23 i7->h23 i8->h23 
##   11.00   -9.85   -5.03   -7.26   -5.00   -5.03   -6.66    6.29    3.49 
## i9->h23 
##    9.93 
##  b->h24 i1->h24 i2->h24 i3->h24 i4->h24 i5->h24 i6->h24 i7->h24 i8->h24 
##    0.09    0.10    1.19    0.87    0.15    0.18    0.02   -0.27   -0.03 
## i9->h24 
##    0.35 
##  b->h25 i1->h25 i2->h25 i3->h25 i4->h25 i5->h25 i6->h25 i7->h25 i8->h25 
##   -1.65    4.19   -0.24   -1.84   -1.58   -2.09   -3.09    2.29    2.50 
## i9->h25 
##    6.02 
##  b->h26 i1->h26 i2->h26 i3->h26 i4->h26 i5->h26 i6->h26 i7->h26 i8->h26 
##    1.60    2.12    0.63   -9.24    3.25    3.09    3.24   -3.76   -2.22 
## i9->h26 
##   -0.40 
##  b->h27 i1->h27 i2->h27 i3->h27 i4->h27 i5->h27 i6->h27 i7->h27 i8->h27 
##   -1.77    1.13   -1.39   -1.13   -0.43   -0.47   -0.68    0.41    0.18 
## i9->h27 
##    1.08 
##  b->h28 i1->h28 i2->h28 i3->h28 i4->h28 i5->h28 i6->h28 i7->h28 i8->h28 
##   -0.24    4.65    0.83   -9.53    2.28    2.06    2.00   -2.98   -2.04 
## i9->h28 
##    1.40 
##  b->h29 i1->h29 i2->h29 i3->h29 i4->h29 i5->h29 i6->h29 i7->h29 i8->h29 
##   -2.92   -0.57   -1.21    0.07   -0.18   -0.08   -0.14    0.13    0.06 
## i9->h29 
##    0.25 
##  b->h30 i1->h30 i2->h30 i3->h30 i4->h30 i5->h30 i6->h30 i7->h30 i8->h30 
##   -2.17    2.89    2.08   -0.17   -0.80   -1.19   -2.03    1.25    2.02 
## i9->h30 
##    5.09 
##   b->o1  h1->o1  h2->o1  h3->o1  h4->o1  h5->o1  h6->o1  h7->o1  h8->o1 
##   -1.61   -0.73   -1.36   11.20   -5.48   -8.67   -3.12   -5.21    5.32 
##  h9->o1 h10->o1 h11->o1 h12->o1 h13->o1 h14->o1 h15->o1 h16->o1 h17->o1 
##  -12.47   -0.23   -0.50   15.65  -11.70   -3.57   -1.02   -1.60   -0.80 
## h18->o1 h19->o1 h20->o1 h21->o1 h22->o1 h23->o1 h24->o1 h25->o1 h26->o1 
##    0.30   -0.47    1.03   -2.01   -0.76   -4.20   -0.88    3.70    3.09 
## h27->o1 h28->o1 h29->o1 h30->o1 
##   -0.48    3.23   -0.84    2.52 
##   b->o2  h1->o2  h2->o2  h3->o2  h4->o2  h5->o2  h6->o2  h7->o2  h8->o2 
##    4.22   -0.06   -2.83  -10.27   -4.22    5.12    1.71   -2.68   -4.57 
##  h9->o2 h10->o2 h11->o2 h12->o2 h13->o2 h14->o2 h15->o2 h16->o2 h17->o2 
##    8.36   -1.34   -0.73    5.57   13.82   -2.43   -0.22    1.78    0.33 
## h18->o2 h19->o2 h20->o2 h21->o2 h22->o2 h23->o2 h24->o2 h25->o2 h26->o2 
##   -0.10   -0.19   -0.19    0.28   -0.18    6.00    1.17    1.99  -10.20 
## h27->o2 h28->o2 h29->o2 h30->o2 
##   -0.72   -9.77   -0.24    0.65 
##   b->o3  h1->o3  h2->o3  h3->o3  h4->o3  h5->o3  h6->o3  h7->o3  h8->o3 
##   -1.54    4.15   -0.36    5.06  -15.39   -0.59   -4.92   -3.20    0.79 
##  h9->o3 h10->o3 h11->o3 h12->o3 h13->o3 h14->o3 h15->o3 h16->o3 h17->o3 
##   -6.78    2.10    2.95  -16.51   -4.10   -4.52    2.53    0.26    0.79 
## h18->o3 h19->o3 h20->o3 h21->o3 h22->o3 h23->o3 h24->o3 h25->o3 h26->o3 
##    1.46    3.31   -1.69    5.18    2.72    7.33    1.37    3.03    5.39 
## h27->o3 h28->o3 h29->o3 h30->o3 
##    1.82    8.05    5.08    3.49 
##   b->o4  h1->o4  h2->o4  h3->o4  h4->o4  h5->o4  h6->o4  h7->o4  h8->o4 
##   -0.22    0.95   -0.08   -2.06    5.33   11.89   -2.25    8.77   -5.54 
##  h9->o4 h10->o4 h11->o4 h12->o4 h13->o4 h14->o4 h15->o4 h16->o4 h17->o4 
##   13.74   -2.61    0.54   -9.44   -4.01   -4.70    1.03   -2.56   -1.48 
## h18->o4 h19->o4 h20->o4 h21->o4 h22->o4 h23->o4 h24->o4 h25->o4 h26->o4 
##    0.51    0.74   -2.16    1.63    1.09    5.32   -2.31   -0.28   -0.19 
## h27->o4 h28->o4 h29->o4 h30->o4 
##    1.54   -0.34    1.04   -2.99 
##   b->o5  h1->o5  h2->o5  h3->o5  h4->o5  h5->o5  h6->o5  h7->o5  h8->o5 
##   -0.96   -4.20    4.76   -4.01   19.82   -7.68    8.59    2.49    3.97 
##  h9->o5 h10->o5 h11->o5 h12->o5 h13->o5 h14->o5 h15->o5 h16->o5 h17->o5 
##   -2.97    2.07   -2.33    4.71    6.04   15.20   -2.48    2.17    1.26 
## h18->o5 h19->o5 h20->o5 h21->o5 h22->o5 h23->o5 h24->o5 h25->o5 h26->o5 
##   -1.96   -3.36    2.99   -5.00   -2.73  -14.51    0.60   -8.41    1.90 
## h27->o5 h28->o5 h29->o5 h30->o5 
##   -2.11   -1.15   -5.09   -3.74

nnet.model

## a 9-30-5 network with 455 weights
## inputs: R1 G1 B1 R2 G2 B2 R3 G3 B3 
## output(s): class 
## options were - softmax modelling  decay=0.001

#训练集
confusion.train.nnet=table(traindata$class,predict(nnet.model,traindata,type="class"))
accuracy.train.nnet=sum(diag(confusion.train.nnet))/sum(confusion.train.nnet)
confusion.train.nnet

##    
##      1  2  3  4  5
##   1 43  0  0  0  0
##   2  0 37  0  0  0
##   3  0  0 62  0  0
##   4  0  0  0 17  0
##   5  0  0  0  0  5

accuracy.train.nnet

## [1] 1

#测试集
confusion.test.nnet=table(testdata$class,predict(nnet.model,testdata,type="class"))
accuracy.test.nnet=sum(diag(confusion.test.nnet))/sum(confusion.test.nnet)
confusion.test.nnet

##    
##      1  2  3  4  5
##   1  8  0  0  0  0
##   2  0  7  0  0  0
##   3  0  0 16  0  0
##   4  0  0  1  6  0
##   5  0  0  0  0  1

accuracy.test.nnet

## [1] 0.974359

#对比支持向量机、随机森林、人工神经网络算法的准确率
accuracy.svm <-c(accuracy.train.svm,accuracy.test.svm)
accuracy.randomForest<-c(accuracy.train.randomForest,accuracy.test.randomForest)
accuracy.nnet <-c(accuracy.train.nnet,accuracy.test.nnet)
accuracy.data <-data.frame(accuracy.svm,accuracy.randomForest,accuracy.nnet)
accuracy.data

##   accuracy.svm accuracy.randomForest accuracy.nnet
## 1    0.9634146             1.0000000      1.000000
## 2    0.9230769             0.8974359      0.974359

第一行是训练集准确率，第二行是测试集准确率。

1.支持向量机虽然在训练集拟合度不如随机森林和神经网络，但是测试集准确率较高；

2.随机森林明显过拟合；

3.对比发现神经网络不管训练集还是测试集效果都最好。

该对比只是简单的对比，不能直接说明哪种算法最好。

原因：

1.数据样本过少；

2.实际使用算法中还要考虑到算法运行的时间，当面对海量数据时，准确复杂的算法往往运行过慢。

3.算法得出的模型“好坏”，不仅仅只看准确率，还要看其他指标比如：recall、percision、F1-score等。比如地震预测更看重recall指标

4.实际中还是要结合具体情况，选择合适的算法。

以后有时间再将各种算法进行复杂的对比。

你可能感兴趣的:(数据挖掘(R语言))

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
系统架构师软考历年论文题目（2009-2024年）及分析 pccai-vip 系统架构师系统架构
时间题目20091.论基于DSSA的软件架构设计与应用；2.论信息系统建模方法；3.论基于REST服务的Web应用系统设计；4.论软件可靠性设计与应用20101.论软件的静态演化和动态演化及其应用；2.论数据挖掘技术的应用；3.论大规模分布式系统缓存设计策略；4.论软件可靠性评价20111.论模型驱动架构在系统开发中的应用；2.论企业集成平台的架构设计；3.论企业架构管理与应用；4.论软件需求获取
大数据新视界 --大数据大厂之数据挖掘入门：用 R 语言开启数据宝藏的探索之旅青云交大数据新视界数据库大数据数据挖掘 R 语言算法案例未来趋势应用场景学习建议大数据新视界
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
R语言标准普尔500指数Garch(1,1)模型 ronghuilin
一、例3.3标准普尔500指数的月超额收益率，从1926年开始，共792个观察值，如图所示。记rt为超额收益率，rt的样本ACF和rt2的样本PACF。在间隔为1，3时有少许序列相关性，但主要特征是平方序列显示的强烈线性相关性。例题建立garch(1,1)模型的过程：（1）应用arma(p,q)模型消除数据的线性依赖（2）在arma(p,q)模型基础上，建立garch(1,1)模型（3）改进g
大数据之flink与hive 星辰_mya 大数据 flink hive
其实吧我不太想写flink，因为线上经验确实不多，这也是我需要补的地方，没有条件创造条件，先来一篇吧flink：高性能低延迟流批一体的分布式计算框架基于事件时间对实时数据精准处理快速响应支持批处理，高效离线分析和数据挖掘数据仓库的引擎丰富数据源/接收器，集成多种数据存储格式和源，比较常见就是咱们今天的主题hive了checkpoint恢复机制，故障恢复快速恢复计算任务分布式弹性扩展，据业务灵活增加
R 地图绘制-比例尺与指北针 jamesjin63
ggplot绘制mapR语言可以进行数据分析，也可以进行地图绘制，而且非常简洁，快速。虽然Arcgis基于桌面可视化操作，能够进行空间分析，但是唯一不足的就是操作步骤繁琐而且一不小心，就要从头再来，可重复性较低。这篇文章主要讲述如何利用R语言中的ggplot与sf绘制带有指北针、图列与标尺的地图屏幕快照2020-06-28下午9.27.59.png数据我们下载非洲地区54个国家的图层Afirca.
纯生信很难发表？只是你没有及时抓住研究热点 SCI狂人团队
当你还做meta分析的时候，你会发现meta分析很难发或者单位已经不承认了，而聪明的人已经开始做常规的生信GEO、TCGA数据挖掘这些（这个时候生信比较好发）。当你开始做常规的生信GEO、TCGA数据挖掘的时候，你会发现这些一样也是比较难发了，而聪明的人已经开始抓免疫评分这个热点进行生信数据挖掘（这个时候免疫评分比较好发）。当你开始对免疫评分这个热点进行生信数据挖掘的时候，你会发现自己的研究方向差
学习小组Day4笔记--王英芳一万万万万
R语言基础准备工作电脑用户名需要是英文R基础，Rstudio人性化界面资源Rfordatasciencechapter1下载RandRstudio给自己一个全新的R语言环境R是什么一种变成语言，统计计算和绘图的环境，汇集了许多函数，强大分析功能。图形界面Rstudio开源集成开发环境IDE4个板块，脚本编辑器，控制台（脚本运行，结果显示），environment（对象/变量列表）history，文
R语言基础笔记 waterHBO r语言笔记开发语言
起因:今天不知道要写什么。把之前的笔记复制一下。代码开头，导入:#清除系统变量rm(list=ls())#隐藏警告信息:options(warn=-1)#把当前目录，设置为工作目录。library(rstudioapi)current_folder_path0.0&ideology<10.0)分组聚合，类似groupby()df2<-aggregate(df1KaTeXparseerror:Exp
R语言包AMORE安装报错问题以及RStudio与Rtools环境配置卡卡_R-Python R语言数据分析与可视化 r语言开发语言
在使用R语言进行AMORE安装时会遇到报错，这时候需要采用解决办法：'''AMORE包安装，需要离线官网下载安装包：Indexof/src/contrib/Archive/AMORE(r-project.org)https://cran.r-project.org/src/contrib/Archive/AMORE/一、出现的问题最近开始学习R语言，安装了最新版的R4.4.1和RStudio，但安
K-means 算法的介绍与应用小魏冬琅 matlab 算法 kmeans 机器学习
目录引言K-means算法的基本原理表格总结：K-means算法的主要步骤K-means算法的MATLAB实现优化方法与改进K-means算法的应用领域表格总结：K-means算法的主要应用领域结论引言K-means算法是一种经典的基于距离的聚类算法，在数据挖掘、模式识别、图像处理等多个领域中得到了广泛应用。其核心思想是将相似的数据对象聚类到同一个簇中，而使得簇内对象的相似度最大、簇间的相似度最小
Matlab,Python,Java,C++的比较 Codefengfeng python java c++
Matlabmatlab是一个大型计算机，擅长矩阵计算与科学计算，适合构建模型；然而，编译软件的运行效率低，不适合大型软件开发。Pythonpython的优势是简单，入门快。适合做数据挖掘、数据分析、机器学习、人工智能、自然语言处理、爬虫、批量文件处理等，此外，Python开源免费，有很多的库，开发环境开发社区都比较友好；不过，Python是动态型的语言，需要更多的测试，并且错误仅仅是在运行的时候
生态位宽度计算&可视化展示（R语言）光疏介质 r语言
生态位宽度是指物种（或其它生物单位）在群落中所利用的各种不同资源的总和。物种的生态位越宽，该物种的特化程度就越小，倾向于泛化种（generalistspecies）；物种的生态位越窄，倾向于是一个特化种（specialistsspecies）。本篇所使用为生态位宽度指数即**Levins的生态位宽度指数。**（除此之外也有用shannon指数）#安装并加载必要的包if(!requireNamesp
如何搞定数据挖掘？这篇文章告诉你！ isNotNullX 数据挖掘人工智能
在数字化的时代，数据是我们日常生活中不可或缺的一部分。数据所蕴含的信息具有重要价值，而数据挖掘和数据分析就是解读这些信息的重要工具。本文从明晰数据概念入手，再探讨数据挖掘。一·什么是数据？数据定义：数据（Data）是指对客观事物的属性、数量、位置、关系等进行记录和描述的原始材料或信息。数据可以是数字、文字、图像、声音等多种形式，它们是信息的载体，用于表示、传递和存储信息。简单来说，数据就是观测值。
一些机器学习不错的书籍 jimmyleeee 机器学习人工智能
最近，在学习一些机器学习的相关知识，在Github上居然找到了一个可以下载一些不错的介绍机器学习和大数据挖掘和分析的书籍。具体的书籍的信息可以参考一下链接：Books/DataSciencefromScratch.pdfatmaster·varunkashyapks/Books·GitHub
R语言多项逻辑回归-因变量是无序多分类医学和生信笔记医学统计学 r语言医学统计学
因变量是无序多分类资料（＞2）时，可使用多分类逻辑回归（multinomiallogisticregression）。使用课本例16-5的数据，课本电子版及数据已上传到QQ群，自行下载即可。某研究人员欲了解不同社区和性别之间居民获取健康知识的途径是否相同，对2个社区的314名成人进行了调查，其中X1是社区，社区1用0表示，社区2用1表示；X2是性别，0是男，1是女，Y是获取健康知识途径，1是传统大
Protocol Buffer编译器安装雪域迷影
本文翻译自ProtocolBufferCompilerInstallationProtocolBufferCompilerInstallation如何安装protocolbuffer编译器尽管不是强制性的，但gRPC应用程序通常利用ProtocolBuufer来进行服务定义和数据序列化。该站点上的大多数示例代码都使用protocolbuffer语言（proto3）的版本3。protocolbuff
R语言自学笔记-2内置数据集实验室长工
#b站视频——R语言入门与数据分析#内置数据集#固定格式的数据（矩阵、数据框或一个时间序列等）#统计建模、回归分析等试验需要找合适的数据集#R内置数据集，存储在，通过help(package="datasets")#通过data函数访问这些数据集data()#得到新窗口前面：数据集名字后面：内容#包含R所有用到的数据类型，包括：向量、矩阵、列表、因子、数据框以及时间序列等#直接输入数据集的名字就可
使用SparkSql进行表的分析与统计 xingyuan8 大数据 java
背景我们的数据挖掘平台对数据统计有比较迫切的需求，而Spark本身对数据统计已经做了一些工作，希望梳理一下Spark已经支持的数据统计功能，后期再进行扩展。准备数据在参考文献6中下载鸢尾花数据，此处格式为iris.data格式，先将data后缀改为csv后缀（不影响使用，只是为了保证后续操作不需要修改）。数据格式如下：SepalLengthSepalWidthPetalLengthPetalWid
从零开始学python数据分析-从零开始学Python数据分析与挖掘 PDF 扫描版 weixin_37988176
给大家带来的一篇关于数据挖掘相关的电子书资源，介绍了关于Python、数据分析、数据挖掘方面的内容，本书是由清华大学出版社出版，格式为PDF，资源大小67.8MB，刘顺祥编写，目前豆瓣、亚马逊、当当、京东等电子书综合评分为：7.5。内容介绍从零开始学Python数据分析与挖掘本书以Python3版本作为数据分析与挖掘实战的应用工具，从Pyhton的基础语法开始，陆续介绍有关数值计算的Numpy、数
在TCGA上下载数据并且进行处理 Red Red 生信小技巧 r语言数据库
浏览器搜索TCGAGDC进入网站在TCGA数据库主页选择“Repository”模式根据所需要的选项在侧边栏选择数据清空购物车！！第一次登陆可忽略将刚刚选择好的数据加入购物车，并且在购物车里下载Metadata和Cart数据，下载到同一个文件夹下。使用R语言脚本对数据进行处理，将其提取为genesymbol和样本的数据，推荐看一下该博主处理数据！！真的非常详细！他R语言脚本在这个链接里
废字承晔儿
u额堵不堵不断进步数据挖掘额v也得分发的大跳脱衣舞一个月肚饿肚饿金额见到你的就不会预计不不会吧菊花怪下班v触宝电话代表大会素冠荷鼎厚度还是v四川饭馆有电梯的但丁地狱冬天的多点多发发动态鼎泰丰饭地方放多放房东鹅二房方圆大厦？而他得让让热厄尔热水器…
大数据分析与安全分析 Zh&&Li 网络安全运维数据分析安全数据挖掘运维数据库
大数据分析一、大数据安全威胁与需求分析1.1大数据相关概念发展大数据：是指非传统的数据处理工具的数据集大数据特征：海量的数据规模、快速的数据流转、多样的数据类型和价值密度低等大数据的种类和来源非常多，包括结构化、半结构化和非结构化数据有关大数据的新兴网络信息技术应用不断出现，主要包括大规模数据分析处理、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和存储系统1.2大数据安全威胁分析“数
R语言-非结构化数据-文本数据读入 pdc31czy R r语言数据分析
#2.2.2非结构化数据-文本数据读入rm(list=ls())#清空工作空间##1.读入简单文本数据###假如数据包含大量经过结构化的文本数据#只需按照读入csv等标准式数据的方法读入#例：novel=read.csv("novel.csv",fileEncoding="UTF-8")head(novel)##2.用readtable读入文本###文本数据普通读法test=read.table(
千万级规模高性能、高并发的网络架构经验分享搬砖养女人网络架构经验分享
主题：INTO100沙龙时间：2015年11月21日下午地点：梦想加联合办公空间分享人：卫向军（毕业于北京邮电大学，现任微博平台架构师，先后在微软、金山云、新浪微博从事技术研发工作，专注于系统架构设计、音视频通讯系统、分布式文件系统和数据挖掘等领域。）架构以及我理解中架构的本质在开始谈我对架构本质的理解之前，先谈谈对今天技术沙龙主题的个人见解，千万级规模的网站感觉数量级是非常大的，对这个数量级我们
Coding and Paper Letter（十四） G小调的Qing歌
资源整理。1Coding:1.R语言包ungeviz，ggplot2的拓展包，专门用来作不确定性的可视化。ungeviz2.计算机图形学相关开源项目。计算机图形学光线追踪开源项目C++源码。computergraphicsraytracing计算机图形学格网开源项目C++源码。computergraphicsmeshes计算机图形学介绍开源项目。computergraphics3.R语言包GLMM
r语言做绘制精美pcoa图_R语言高级绘图 — ggplot2 weixin_39560002 r语言做绘制精美pcoa图
2)PCA的作图PCA主成分分析，可以将高维数据进行降维处理。我们的OTU表格就是典型的高维数据，可以对其进行降维处理得到主成分PC1和PC2，然后将所有样品都分解到这两个成分方向，进行散点绘图，可以直观的看出样品间的差异。首先需要一系列的统计处理，然后用ggplot2进行绘图，过程如下：#加载需要的三个包(需要先下载，再加载)>library(ade4)>library(ggplot2)>lib
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod