桓峰基因

MachineLearning 5. 癌症诊断和分子分型方法之支持向量机（SVM）

点击关注，桓峰基因

桓峰基因

生物信息分析，SCI文章撰写及生物信息基础知识学习：R语言学习，perl基础编程，linux系统命令，Python遇见更好的你

92篇原创内容

公众号

桓峰基因的教程不但教您怎么使用，还会定期分析一些相关的文章，学会教程只是基础，但是如果把分析结果整合到文章里面才是目的，觉得我们这些教程还不错，并且您按照我们的教程分析出来不错的结果发了文章记得告知我们，并在文章中感谢一下我们哦！

公司英文名称：Kyoho Gene Technology (Beijing) Co.,Ltd.

如果您觉得这些确实没基础，需要专业的生信人员帮助分析，直接扫码加微信，我们24小时在线！！微信号：nihaooo123

****支持向量机（SVM）在癌症诊断和分子分型中表现强健，一般文章都使用Lasso回归等进行预后分析，当作到机器学习分子分型等可能文章就上了更高的一个台阶，这就是为什么现在AI精准医疗为什么这么火热，人工智能完全可以降低误诊和滥用药物的可能，抽管血就能准确的知道得了什么病，需要使用哪种药，还是蛮NB的！

前言

支持向量机(SVM)方法是一种数据驱动的分类任务求解方法。研究表明，与基于其他方法(如人工神经网络)的分类器相比，该方法产生更低的预测误差，特别是在考虑样本描述的大量特征时。本文概述了支持向量机方法的原理和主要原理，并介绍了支持向量机方法在传统生物信息学研究领域的成功应用。本文综述了支持向量机相关技术的最新进展，这些进展可能会对未来的功能基因组学和化学基因组学项目产生影响。

基本原理

支持向量机（Support Vector Machine, SVM）是一类按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），其决策边界是对学习样本求解的最大边距超平面（maximum-margin hyperplane）。

支持向量机还代表了一种强大的技术，用于一般(非线性)分类、回归和异常点检测的监督学习方法，具有直观的模型表示。SVM使用铰链损失函数（hinge loss）计算经验风险（empirical risk）并在求解系统中加入了正则化项以优化结构风险（structural risk），是一个具有稀疏性和稳健性的分类器。SVM可以通过核方法（kernel method）进行非线性分类，是常见的核学习（kernel learning）方法之一。支持向量机的优点是:在高维空间有效。在维数大于样本数的情况下仍然有效。在决策函数中使用训练点的子集(称为支持向量)，因此它也是有效的内存。通用性:可以指定不同的核函数作为决策函数。提供了通用内核，但也可以指定自定义内核。支持向量机的缺点包括:如果特征的数量远远大于样本的数量，在选择核函数时避免过拟合，正则项是至关重要的。支持向量机不直接提供概率估计，这些估计是使用昂贵的五次交叉验证计算出来的。

实例解析

1. 软件安装

这里我们主要使用e1071和class两个软件包，其他都为数据处理过程中需要使用软件包，如下：

if (!require(class)) install.packages("class")
if (!require(e1071)) install.packages("e1071")
if (!require(caret)) install.packages("caret")

library(class)
library(e1071)
library(caret)
library(reshape2)
library(ggplot2)

2. 数据读取

数据来源《机器学习与R语言》书中，具体来自UCI机器学习仓库。地址：http://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/ 下载wbdc.data和wbdc.names这两个数据集，数据经过整理，成为面板数据。查看数据结构，其中第一列为id列，无特征意义，需要删除。第二列diagnosis为响应变量，字符型，一般在R语言中分类任务都要求响应变量为因子类型，因此需要做数据类型转换。剩余的为预测变量，数值类型。查看数据维度，568个样本，32个特征（包括响应特征）。

BreastCancer <- read.csv("wisc_bc_data.csv", stringsAsFactors = FALSE)
str(BreastCancer)
## 'data.frame':	568 obs. of  32 variables:
##  $ id                     : int  842517 84300903 84348301 84358402 843786 844359 84458202 844981 84501001 845636 ...
##  $ diagnosis              : chr  "M" "M" "M" "M" ...
##  $ radius_mean            : num  20.6 19.7 11.4 20.3 12.4 ...
##  $ texture_mean           : num  17.8 21.2 20.4 14.3 15.7 ...
##  $ perimeter_mean         : num  132.9 130 77.6 135.1 82.6 ...
##  $ area_mean              : num  1326 1203 386 1297 477 ...
##  $ smoothness_mean        : num  0.0847 0.1096 0.1425 0.1003 0.1278 ...
##  $ compactne_mean         : num  0.0786 0.1599 0.2839 0.1328 0.17 ...
##  $ concavity_mean         : num  0.0869 0.1974 0.2414 0.198 0.1578 ...
##  $ concave_points_mean    : num  0.0702 0.1279 0.1052 0.1043 0.0809 ...
##  $ symmetry_mean          : num  0.181 0.207 0.26 0.181 0.209 ...
##  $ fractal_dimension_mean : num  0.0567 0.06 0.0974 0.0588 0.0761 ...
##  $ radius_se              : num  0.543 0.746 0.496 0.757 0.335 ...
##  $ texture_se             : num  0.734 0.787 1.156 0.781 0.89 ...
##  $ perimeter_se           : num  3.4 4.58 3.44 5.44 2.22 ...
##  $ area_se                : num  74.1 94 27.2 94.4 27.2 ...
##  $ smoothness_se          : num  0.00522 0.00615 0.00911 0.01149 0.00751 ...
##  $ compactne_se           : num  0.0131 0.0401 0.0746 0.0246 0.0335 ...
##  $ concavity_se           : num  0.0186 0.0383 0.0566 0.0569 0.0367 ...
##  $ concave_points_se      : num  0.0134 0.0206 0.0187 0.0188 0.0114 ...
##  $ symmetry_se            : num  0.0139 0.0225 0.0596 0.0176 0.0216 ...
##  $ fractal_dimension_se   : num  0.00353 0.00457 0.00921 0.00511 0.00508 ...
##  $ radius_worst           : num  25 23.6 14.9 22.5 15.5 ...
##  $ texture_worst          : num  23.4 25.5 26.5 16.7 23.8 ...
##  $ perimeter_worst        : num  158.8 152.5 98.9 152.2 103.4 ...
##  $ area_worst             : num  1956 1709 568 1575 742 ...
##  $ smoothness_worst       : num  0.124 0.144 0.21 0.137 0.179 ...
##  $ compactne_worst        : num  0.187 0.424 0.866 0.205 0.525 ...
##  $ concavity_worst        : num  0.242 0.45 0.687 0.4 0.535 ...
##  $ concave_points_worst   : num  0.186 0.243 0.258 0.163 0.174 ...
##  $ symmetry_worst         : num  0.275 0.361 0.664 0.236 0.399 ...
##  $ fractal_dimension_worst: num  0.089 0.0876 0.173 0.0768 0.1244 ...
BreastCancer[1:5, 1:5]
##         id diagnosis radius_mean texture_mean perimeter_mean
## 1   842517         M       20.57        17.77         132.90
## 2 84300903         M       19.69        21.25         130.00
## 3 84348301         M       11.42        20.38          77.58
## 4 84358402         M       20.29        14.34         135.10
## 5   843786         M       12.45        15.70          82.57
dim(BreastCancer)
## [1] 568  32
table(BreastCancer$diagnosis)
## 
##   B   M 
## 357 211
sum(is.na(data))  # 检测数据是否有缺失
## [1] 0

数据分布比较恶性和良性之间的差距，如下：

bc <- BreastCancer[, -1]
bc.melt <- melt(bc, id.var = "diagnosis")
head(bc.melt)
##   diagnosis    variable value
## 1         M radius_mean 20.57
## 2         M radius_mean 19.69
## 3         M radius_mean 11.42
## 4         M radius_mean 20.29
## 5         M radius_mean 12.45
## 6         M radius_mean 18.25
ggplot(data = bc.melt, aes(x = diagnosis, y = log(value + 1), fill = diagnosis)) +
    geom_boxplot() + theme_bw() + facet_wrap(~variable, ncol = 8)

数据变量之间的相关性，如下：

library(tidyverse)
data <- select(BreastCancer, -1) %>%
    mutate_at("diagnosis", as.factor)
corrplot::corrplot(cor(data[, -1]))

数据分割将原始数据分割成训练数据和测试数据，测试数据不参与训练建模，将根据模型在测试数据中的表现来选择最优模型参数。

一般做数据分割会留70%的训练数据和30%的测试数据，当然这个比例可以更改，但是一般是训练数据要大于测试数据，用来保证模型学习的充分性。

此外，在做分类任务时，有一个需要额外考虑的问题就是需要尽可能保证训练数据和测试数据中正负样本的比例相近。这里采用「分层抽样」来完成这个任务。

library(sampling)
set.seed(123)
# 每层抽取70%的数据
train_id <- strata(data, "diagnosis", size = rev(round(table(data$diagnosis) * 0.7)))$ID_unit
# 训练数据
train_data <- data[train_id, ]
# 测试数据
test_data <- data[-train_id, ]

# 查看训练、测试数据中正负样本比例
prop.table(table(train_data$diagnosis))
## 
##         B         M 
## 0.6281407 0.3718593

prop.table(table(test_data$diagnosis))
## 
##         B         M 
## 0.6294118 0.3705882

3. 实例操作

一个简单的向后选择，也就是递归特征消除(RFE)算法。这里面涉及到四种核函数的计算方法，我们每种方法都做一遍，最后汇总比较哪种方法的准确性最高，敏感度更好！

1. linear

set.seed(123)
linear.tune <- tune.svm(diagnosis ~ ., data = train_data, kernel = "linear", cost = c(0.001,
    0.01, 0.1, 1, 5, 10))
summary(linear.tune)
## 
## Parameter tuning of 'svm':
## 
## - sampling method: 10-fold cross validation 
## 
## - best parameters:
##  cost
##   0.1
## 
## - best performance: 0.03012821 
## 
## - Detailed performance results:
##    cost      error dispersion
## 1 1e-03 0.05782051 0.05163412
## 2 1e-02 0.04019231 0.03397375
## 3 1e-01 0.03012821 0.03504404
## 4 1e+00 0.03012821 0.03082705
## 5 5e+00 0.03519231 0.02964077
## 6 1e+01 0.04512821 0.03293816
best.linear <- linear.tune$best.model
tune.test <- predict(best.linear, newdata = test_data)
table(tune.test, test_data$diagnosis)
##          
## tune.test   B   M
##         B 106   3
##         M   1  60
confusionMatrix(tune.test, test_data$diagnosis, positive = "B")
## Confusion Matrix and Statistics
## 
##           Reference
## Prediction   B   M
##          B 106   3
##          M   1  60
##                                           
##                Accuracy : 0.9765          
##                  95% CI : (0.9409, 0.9936)
##     No Information Rate : 0.6294          
##     P-Value [Acc > NIR] : <2e-16          
##                                           
##                   Kappa : 0.9492          
##                                           
##  Mcnemar's Test P-Value : 0.6171          
##                                           
##             Sensitivity : 0.9907          
##             Specificity : 0.9524          
##          Pos Pred Value : 0.9725          
##          Neg Pred Value : 0.9836          
##              Prevalence : 0.6294          
##          Detection Rate : 0.6235          
##    Detection Prevalence : 0.6412          
##       Balanced Accuracy : 0.9715          
##                                           
##        'Positive' Class : B               
## 
# Accuracy : 0.9765 svmLinear
set.seed(123)
rfeCNTL <- rfeControl(functions = lrFuncs, method = "cv", number = 10)
svmLinear <- rfe(train_data[, -1], train_data[, 1], sizes = c(7, 6, 5, 4), rfeControl = rfeCNTL,
    method = "svmLinear")
svmLinear
## 
## Recursive feature selection
## 
## Outer resampling method: Cross-Validated (10 fold) 
## 
## Resampling performance over subset size:
## 
##  Variables Accuracy  Kappa AccuracySD KappaSD Selected
##          4   0.8941 0.7653    0.07515 0.17331         
##          5   0.9068 0.7983    0.05515 0.12066         
##          6   0.9244 0.8375    0.05201 0.11170         
##          7   0.9471 0.8852    0.03660 0.07977        *
##         30   0.9396 0.8721    0.04036 0.08635         
## 
## The top 5 variables (out of 7):
##    fractal_dimension_se, fractal_dimension_worst, smoothness_mean, concave_points_mean, texture_mean
vec <- names(coefficients(svmLinear$fit))[-1]
var <- paste(vec, collapse = "+")
fun <- as.formula(paste("diagnosis", "~", var))
svm <- svm(fun, data = train_data, kernel = "linear")
Linear.predict = predict(svm, newdata = test_data[, vec])
table(Linear.predict, test_data$diagnosis)
##               
## Linear.predict   B   M
##              B 105   8
##              M   2  55
confusionMatrix(Linear.predict, test_data$diagnosis, positive = "B")
## Confusion Matrix and Statistics
## 
##           Reference
## Prediction   B   M
##          B 105   8
##          M   2  55
##                                           
##                Accuracy : 0.9412          
##                  95% CI : (0.8945, 0.9714)
##     No Information Rate : 0.6294          
##     P-Value [Acc > NIR] : <2e-16          
##                                           
##                   Kappa : 0.8714          
##                                           
##  Mcnemar's Test P-Value : 0.1138          
##                                           
##             Sensitivity : 0.9813          
##             Specificity : 0.8730          
##          Pos Pred Value : 0.9292          
##          Neg Pred Value : 0.9649          
##              Prevalence : 0.6294          
##          Detection Rate : 0.6176          
##    Detection Prevalence : 0.6647          
##       Balanced Accuracy : 0.9272          
##                                           
##        'Positive' Class : B               
## 
# Accuracy : 0.9412

2. poly

################## tune the poly only
set.seed(123)
poly.tune <- tune.svm(diagnosis ~ ., data = train_data, kernel = "polynomial", degree = c(3,
    4, 5), coef0 = c(0.1, 0.5, 1, 2, 3, 4))
summary(poly.tune)
## 
## Parameter tuning of 'svm':
## 
## - sampling method: 10-fold cross validation 
## 
## - best parameters:
##  degree coef0
##       3     1
## 
## - best performance: 0.02769231 
## 
## - Detailed performance results:
##    degree coef0      error dispersion
## 1       3   0.1 0.07038462 0.04063291
## 2       4   0.1 0.11557692 0.05439623
## 3       5   0.1 0.14583333 0.05660357
## 4       3   0.5 0.04269231 0.04274060
## 5       4   0.5 0.04019231 0.03784169
## 6       5   0.5 0.04269231 0.03755119
## 7       3   1.0 0.02769231 0.04183104
## 8       4   1.0 0.03269231 0.04113567
## 9       5   1.0 0.03769231 0.03794742
## 10      3   2.0 0.03019231 0.03523951
## 11      4   2.0 0.03769231 0.04144616
## 12      5   2.0 0.04269231 0.03151865
## 13      3   3.0 0.03019231 0.03321045
## 14      4   3.0 0.03762821 0.03390515
## 15      5   3.0 0.04262821 0.03132839
## 16      3   4.0 0.03519231 0.03598947
## 17      4   4.0 0.04512821 0.03691477
## 18      5   4.0 0.04012821 0.03379204
best.poly <- poly.tune$best.model
poly.test <- predict(best.poly, newdata = test_data)
table(poly.test, test_data$diagnosis)
##          
## poly.test   B   M
##         B 107   2
##         M   0  61
confusionMatrix(poly.test, test_data$diagnosis, positive = "B")
## Confusion Matrix and Statistics
## 
##           Reference
## Prediction   B   M
##          B 107   2
##          M   0  61
##                                           
##                Accuracy : 0.9882          
##                  95% CI : (0.9581, 0.9986)
##     No Information Rate : 0.6294          
##     P-Value [Acc > NIR] : <2e-16          
##                                           
##                   Kappa : 0.9746          
##                                           
##  Mcnemar's Test P-Value : 0.4795          
##                                           
##             Sensitivity : 1.0000          
##             Specificity : 0.9683          
##          Pos Pred Value : 0.9817          
##          Neg Pred Value : 1.0000          
##              Prevalence : 0.6294          
##          Detection Rate : 0.6294          
##    Detection Prevalence : 0.6412          
##       Balanced Accuracy : 0.9841          
##                                           
##        'Positive' Class : B               
## 
# Accuracy : 0.9882 svmPoly
set.seed(123)
svmPoly <- rfe(train_data[, -1], train_data[, 1], sizes = c(7, 6, 5, 4), rfeControl = rfeCNTL,
    method = "svmPoly")
svmPoly
## 
## Recursive feature selection
## 
## Outer resampling method: Cross-Validated (10 fold) 
## 
## Resampling performance over subset size:
## 
##  Variables Accuracy  Kappa AccuracySD KappaSD Selected
##          4   0.8941 0.7653    0.07515 0.17331         
##          5   0.9068 0.7983    0.05515 0.12066         
##          6   0.9244 0.8375    0.05201 0.11170         
##          7   0.9471 0.8852    0.03660 0.07977        *
##         30   0.9396 0.8721    0.04036 0.08635         
## 
## The top 5 variables (out of 7):
##    fractal_dimension_se, fractal_dimension_worst, smoothness_mean, concave_points_mean, texture_mean
vec <- names(coefficients(svmPoly$fit))[-1]
var <- paste(vec, collapse = "+")
fun <- as.formula(paste("diagnosis", "~", var))
svm <- svm(fun, data = train_data, kernel = "poly")
Poly.predict = predict(svm, newdata = test_data[, vec])
table(Poly.predict, test_data$diagnosis)
##             
## Poly.predict   B   M
##            B 105  24
##            M   2  39
confusionMatrix(Poly.predict, test_data$diagnosis, positive = "B")
## Confusion Matrix and Statistics
## 
##           Reference
## Prediction   B   M
##          B 105  24
##          M   2  39
##                                          
##                Accuracy : 0.8471         
##                  95% CI : (0.784, 0.8976)
##     No Information Rate : 0.6294         
##     P-Value [Acc > NIR] : 3.183e-10      
##                                          
##                   Kappa : 0.6468         
##                                          
##  Mcnemar's Test P-Value : 3.814e-05      
##                                          
##             Sensitivity : 0.9813         
##             Specificity : 0.6190         
##          Pos Pred Value : 0.8140         
##          Neg Pred Value : 0.9512         
##              Prevalence : 0.6294         
##          Detection Rate : 0.6176         
##    Detection Prevalence : 0.7588         
##       Balanced Accuracy : 0.8002         
##                                          
##        'Positive' Class : B              
## 
# Accuracy : 0.8471

3. radial

########################## tune the radial
set.seed(123)
rbf.tune <- tune.svm(diagnosis ~ ., data = train_data, kernel = "radial", gamma = c(0.1,
    0.5, 1, 2, 3, 4))
summary(rbf.tune)
## 
## Parameter tuning of 'svm':
## 
## - sampling method: 10-fold cross validation 
## 
## - best parameters:
##  gamma
##    0.1
## 
## - best performance: 0.05012821 
## 
## - Detailed performance results:
##   gamma      error dispersion
## 1   0.1 0.05012821 0.05773645
## 2   0.5 0.22833333 0.10924627
## 3   1.0 0.37185897 0.07966989
## 4   2.0 0.37185897 0.07966989
## 5   3.0 0.37185897 0.07966989
## 6   4.0 0.37185897 0.07966989
best.rbf <- rbf.tune$best.model
rbf.test <- predict(best.rbf, newdata = test_data)
table(rbf.test, test_data$diagnosis)
##         
## rbf.test   B   M
##        B 104   3
##        M   3  60
confusionMatrix(rbf.test, test_data$diagnosis, positive = "B")
## Confusion Matrix and Statistics
## 
##           Reference
## Prediction   B   M
##          B 104   3
##          M   3  60
##                                           
##                Accuracy : 0.9647          
##                  95% CI : (0.9248, 0.9869)
##     No Information Rate : 0.6294          
##     P-Value [Acc > NIR] : <2e-16          
##                                           
##                   Kappa : 0.9243          
##                                           
##  Mcnemar's Test P-Value : 1               
##                                           
##             Sensitivity : 0.9720          
##             Specificity : 0.9524          
##          Pos Pred Value : 0.9720          
##          Neg Pred Value : 0.9524          
##              Prevalence : 0.6294          
##          Detection Rate : 0.6118          
##    Detection Prevalence : 0.6294          
##       Balanced Accuracy : 0.9622          
##                                           
##        'Positive' Class : B               
## 
# Accuracy : 0.9647 svmRadial
set.seed(123)
svmRadial <- rfe(train_data[, -1], train_data[, 1], sizes = c(7, 6, 5, 4), rfeControl = rfeCNTL,
    method = "svmRadial")
svmRadial
## 
## Recursive feature selection
## 
## Outer resampling method: Cross-Validated (10 fold) 
## 
## Resampling performance over subset size:
## 
##  Variables Accuracy  Kappa AccuracySD KappaSD Selected
##          4   0.8941 0.7653    0.07515 0.17331         
##          5   0.9068 0.7983    0.05515 0.12066         
##          6   0.9244 0.8375    0.05201 0.11170         
##          7   0.9471 0.8852    0.03660 0.07977        *
##         30   0.9396 0.8721    0.04036 0.08635         
## 
## The top 5 variables (out of 7):
##    fractal_dimension_se, fractal_dimension_worst, smoothness_mean, concave_points_mean, texture_mean
vec <- names(coefficients(svmRadial$fit))[-1]
var <- paste(vec, collapse = "+")
fun <- as.formula(paste("diagnosis", "~", var))
svm <- svm(fun, data = train_data, kernel = "radial")
Radial.predict = predict(svm, newdata = test_data[, vec])
table(Radial.predict, test_data$diagnosis)
##               
## Radial.predict   B   M
##              B 104  12
##              M   3  51
confusionMatrix(Radial.predict, test_data$diagnosis, positive = "B")
## Confusion Matrix and Statistics
## 
##           Reference
## Prediction   B   M
##          B 104  12
##          M   3  51
##                                           
##                Accuracy : 0.9118          
##                  95% CI : (0.8586, 0.9498)
##     No Information Rate : 0.6294          
##     P-Value [Acc > NIR] : < 2e-16         
##                                           
##                   Kappa : 0.8051          
##                                           
##  Mcnemar's Test P-Value : 0.03887         
##                                           
##             Sensitivity : 0.9720          
##             Specificity : 0.8095          
##          Pos Pred Value : 0.8966          
##          Neg Pred Value : 0.9444          
##              Prevalence : 0.6294          
##          Detection Rate : 0.6118          
##    Detection Prevalence : 0.6824          
##       Balanced Accuracy : 0.8907          
##                                           
##        'Positive' Class : B               
## 
# Accuracy : 0.9118

4. sigmoid

################### tune the sigmoid
set.seed(123)
sigmoid.tune <- tune.svm(diagnosis ~ ., data = train_data, kernel = "sigmoid", gamma = c(0.1,
    0.5, 1, 2, 3, 4), coef0 = c(0.1, 0.5, 1, 2, 3, 4))
summary(sigmoid.tune)
## 
## Parameter tuning of 'svm':
## 
## - sampling method: 10-fold cross validation 
## 
## - best parameters:
##  gamma coef0
##    0.1   0.1
## 
## - best performance: 0.06512821 
## 
## - Detailed performance results:
##    gamma coef0      error dispersion
## 1    0.1   0.1 0.06512821 0.04428204
## 2    0.5   0.1 0.10807692 0.04746880
## 3    1.0   0.1 0.11314103 0.04922072
## 4    2.0   0.1 0.09057692 0.06814132
## 5    3.0   0.1 0.10051282 0.04565635
## 6    4.0   0.1 0.10538462 0.05611503
## 7    0.1   0.5 0.11282051 0.06022382
## 8    0.5   0.5 0.12064103 0.05782179
## 9    1.0   0.5 0.12576923 0.04912932
## 10   2.0   0.5 0.10557692 0.05879917
## 11   3.0   0.5 0.10051282 0.04867745
## 12   4.0   0.5 0.11820513 0.04298665
## 13   0.1   1.0 0.11538462 0.04558048
## 14   0.5   1.0 0.13064103 0.03682139
## 15   1.0   1.0 0.14064103 0.03928394
## 16   2.0   1.0 0.09788462 0.04767979
## 17   3.0   1.0 0.09064103 0.06521765
## 18   4.0   1.0 0.11801282 0.06337151
## 19   0.1   2.0 0.14589744 0.05171576
## 20   0.5   2.0 0.14076923 0.05047278
## 21   1.0   2.0 0.14814103 0.05686768
## 22   2.0   2.0 0.08801282 0.03407708
## 23   3.0   2.0 0.10794872 0.05531440
## 24   4.0   2.0 0.09807692 0.06531545
## 25   0.1   3.0 0.18621795 0.06910882
## 26   0.5   3.0 0.16333333 0.05563423
## 27   1.0   3.0 0.14083333 0.04645070
## 28   2.0   3.0 0.11307692 0.05173871
## 29   3.0   3.0 0.09570513 0.07013109
## 30   4.0   3.0 0.11057692 0.05076956
## 31   0.1   4.0 0.26929487 0.08718601
## 32   0.5   4.0 0.17589744 0.06772675
## 33   1.0   4.0 0.14326923 0.06472296
## 34   2.0   4.0 0.14301282 0.05738479
## 35   3.0   4.0 0.11064103 0.05580090
## 36   4.0   4.0 0.09794872 0.05577439

best.sigmoid <- sigmoid.tune$best.model
sigmoid.test <- predict(best.sigmoid, newdata = test_data)
table(sigmoid.test, test_data$diagnosis)
##             
## sigmoid.test   B   M
##            B 103  11
##            M   4  52
confusionMatrix(sigmoid.test, test_data$diagnosis, positive = "B")
## Confusion Matrix and Statistics
## 
##           Reference
## Prediction   B   M
##          B 103  11
##          M   4  52
##                                           
##                Accuracy : 0.9118          
##                  95% CI : (0.8586, 0.9498)
##     No Information Rate : 0.6294          
##     P-Value [Acc > NIR] : <2e-16          
##                                           
##                   Kappa : 0.8064          
##                                           
##  Mcnemar's Test P-Value : 0.1213          
##                                           
##             Sensitivity : 0.9626          
##             Specificity : 0.8254          
##          Pos Pred Value : 0.9035          
##          Neg Pred Value : 0.9286          
##              Prevalence : 0.6294          
##          Detection Rate : 0.6059          
##    Detection Prevalence : 0.6706          
##       Balanced Accuracy : 0.8940          
##                                           
##        'Positive' Class : B               
## 
# Accuracy : 0.9118 svmSigmoid
set.seed(123)
rfeCNTL <- rfeControl(functions = lrFuncs, method = "cv", number = 10)
svmSigmoid <- rfe(train_data[, -1], train_data[, 1], sizes = c(7, 6, 5, 4), rfeControl = rfeCNTL,
    method = "svmSigmoid")
svmSigmoid
## 
## Recursive feature selection
## 
## Outer resampling method: Cross-Validated (10 fold) 
## 
## Resampling performance over subset size:
## 
##  Variables Accuracy  Kappa AccuracySD KappaSD Selected
##          4   0.8941 0.7653    0.07515 0.17331         
##          5   0.9068 0.7983    0.05515 0.12066         
##          6   0.9244 0.8375    0.05201 0.11170         
##          7   0.9471 0.8852    0.03660 0.07977        *
##         30   0.9396 0.8721    0.04036 0.08635         
## 
## The top 5 variables (out of 7):
##    fractal_dimension_se, fractal_dimension_worst, smoothness_mean, concave_points_mean, texture_mean
vec <- names(coefficients(svmSigmoid$fit))[-1]
var <- paste(vec, collapse = "+")
fun <- as.formula(paste("diagnosis", "~", var))
svm <- svm(fun, data = train_data, kernel = "sigmoid")
Sigmoid.predict = predict(svm, newdata = test_data[, vec])
table(Sigmoid.predict, test_data$diagnosis)
##                
## Sigmoid.predict  B  M
##               B 97 13
##               M 10 50
confusionMatrix(Sigmoid.predict, test_data$diagnosis, positive = "B")
## Confusion Matrix and Statistics
## 
##           Reference
## Prediction  B  M
##          B 97 13
##          M 10 50
##                                           
##                Accuracy : 0.8647          
##                  95% CI : (0.8039, 0.9123)
##     No Information Rate : 0.6294          
##     P-Value [Acc > NIR] : 7.401e-12       
##                                           
##                   Kappa : 0.7071          
##                                           
##  Mcnemar's Test P-Value : 0.6767          
##                                           
##             Sensitivity : 0.9065          
##             Specificity : 0.7937          
##          Pos Pred Value : 0.8818          
##          Neg Pred Value : 0.8333          
##              Prevalence : 0.6294          
##          Detection Rate : 0.5706          
##    Detection Prevalence : 0.6471          
##       Balanced Accuracy : 0.8501          
##                                           
##        'Positive' Class : B               
## 
# Accuracy : 0.8647

结果解读

从不同角度比较四种 SVM方法的准确性，结果显示线性（linear）的SVM在做乳腺癌的诊断中表现突出，准确率高达0.947，而上期我们选择KNN以及KKNN的算法，分别为0.9294，0.9471，从这个结果中选用加权K-邻近算法，还是SVM的准确性不分伯仲，都可以，这也就是为什么乳腺癌这个选择KNN的方法其中一个原因，自己测试一下数据觉得还是蛮有意思，后面也会继续使用机器学习的办法继续做乳腺癌的这套数据，探索哪种方法能够更好的提高诊断的准确性。

1.比较每种方法的准确性及置信区间，如下：

acc <- resamples(list(Linear = svmLinear, Poly = svmPoly, Sigmoid = svmSigmoid, Radial = svmRadial))

dotplot(acc)

2. 绘制ROC曲线

将四种不同方法绘制在同一张图上，其中，Poly 与 Sigmoid 曲线非常接近，所以 sigmoid 使用细线，并且是实线，如下：

library(ROSE)
roc.curve(Linear.predict, test_data$diagnosis, main = "ROC curve ", col = 2, lwd = 2,
    lty = 2)
## Area under the curve (AUC): 0.947
roc.curve(Poly.predict, test_data$diagnosis, main = "ROC curve ", add = TRUE, col = 3,
    lwd = 2, lty = 2)
## Area under the curve (AUC): 0.883
roc.curve(Radial.predict, test_data$diagnosis, main = "ROC curve ", add = TRUE, col = 4,
    lwd = 2, lty = 2)
## Area under the curve (AUC): 0.920
roc.curve(Sigmoid.predict, test_data$diagnosis, main = "ROC curve ", add = TRUE,
    col = 5, lwd = 1, lty = 1)
## Area under the curve (AUC): 0.858
legend("bottomright", c("Linear", "Poly", "Radial", "Sigmoid"), col = 2:5, lty = c(1:3,
    1), lwd = c(2, 2, 2, 1), bty = "n")

References:

Byvatov, E. and Schneider, G., 2003. Support vector machine applications in bioinformatics. Applied bioinformatics, 2(2), pp.67-77.

大数据新视界 --大数据大厂之 Kubeflow 在大数据与机器学习融合中的应用探索青云交大数据新视界 Kubeflow 之道 Kubeflow 大数据机器学习模型训练数据处理资源利用应用案例
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
大数据新视界 --大数据大厂之 ClickHouse：大数据分析领域的璀璨明星青云交大数据新视界 #ClickHouse 之道 ClickHouse 大数据分析性能优势应用场景技术实现竞品对比前沿技术融合数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
大数据新视界 --大数据大厂之数据压缩算法比较与应用：节省存储空间青云交大数据新视界大数据数据压缩算法无损压缩有损压缩存储空间 GZIP ZIP 数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
Redis内存设置、缓存淘汰策略、LRU 算法与手写实现后端javaredis算法
1.生产环境中Redis内存设置思路？在生产环境中，Redis内存设置通常取决于以下因素：数据量大小：Redis数据库中存储的数据量大小，尤其是缓存数据。需要根据实际的数据量来设置内存。服务器内存大小：Redis是内存数据库，通常会根据可用的内存量来配置Redis。如果内存设置过大，可能会导致系统其他应用程序的内存不足。Redis的使用场景：如作为缓存使用时，通常只需要配置较小的内存限制；作为持久
Vue3中通过加密串进行后端验证并实现登录跳转教程 ecmascript-6
在Vue3中进行登录并通过加密串进行后端验证，一般步骤是：用户输入用户名和密码，前端将其加密后发送给后端进行验证，后端验证通过后，返回身份验证信息（如令牌），前端接收验证结果并实现登录跳转。主要步骤：用户输入信息并加密用户输入的密码可以通过加密算法（如SHA256,AES等）进行加密，确保数据的安全性。发送请求到后端前端将加密后的数据发送到后端进行验证，通常使用POST请求。后端验证加密数据后端解
等保、密评专用—双算法SSL证书
等保（网络安全等级保护）和密评（商用密码应用安全性评估）专用的双算法SSL证书，是结合了国际加密算法（如RSA）和国密算法（如SM2）的SSL证书。这类证书不仅满足了国内对于数据安全和信息保密的合规性要求，同时也确保了与国际标准的互操作性。以下是关于等保、密评专用双算法SSL证书的详细解析：一、优势合规性：满足《信息安全技术网络安全等级保护安全设计技术要求》（GB/T25070）中关于二级等保安全
代码随想录算法训练营第 5 天（哈希表1）| 242.有效的字母异位词 349. 两个数组的交集 202. 快乐数 1. 两数之和去薯条搞点码头代码随想录算法
当我们遇到了要快速判断一个元素是否出现集合里的时候，就要考虑哈希法数据小用数组，数据大用set，数据比较散用map一、242.有效的字母异位词题目：242.有效的字母异位词-力扣（LeetCode）视频：学透哈希表，数组使用有技巧！Leetcode：242.有效的字母异位词_哔哩哔哩_bilibili讲解：代码随想录思路a-z的ASCll码是连续的，用字母减去a的ASCll码的就是每个字母的码1.
Shell脚本实现Twitter的Snowflake算法的ID生成器
大部分时候，需要通过shell脚本批量处理一些数据，在分布式环境下，数据库表的主键存储的都是分布id，通过Java代码生成。shell脚本都是通过mysql命令生成insert语句，以前生成insert语句时，我都是先selectMAX(id)fromtable赋值到MAX_ID,然后拼接,类似于max_id_sql="selectMAX(id)fromtable";MAX_ID="$(query
jupyter notebook练手项目：线性回归——学习时间与成绩的关系橙意满满的西瓜大侠机器学习 jupyter 线性回归机器学习
线性回归——学习时间与学习成绩的关系第1步：导入工具库pandas——数据分析库，提供了数据结构（如DataFrame和Series）和数据操作方法，方便对数据集进行读取、清洗、转换等操作。matplotlib——绘图库，pyplot提供了一系列简单易用的绘图函数，用于创建各种类型的图表，如折线图、散点图、柱状图等。%matplotlibinline——使matplotlib绘制的图像嵌入在Jup
感觉自己开发或者写代码效率总是不高？哪些有用的小细节总是被你忽略？快来看看你和大佬的差距吧（快捷键篇）猫咪-9527 算法快捷键
️专栏：算法专栏主页：猫咪-9527-CSDN博客“欲穷千里目，更上一层楼。会当凌绝顶，一览众山小。”目录一、VisualStudio调试程序的快捷键二、VisualStudio编辑程序的快捷键三、Windows系统常用快捷键四、提升效率的小技巧在日常的编程与系统操作中，熟悉并灵活运用快捷键是一项极具性价比的提升效率方式。今天，我们整理了一份VisualStudio调试与编辑快捷键以及Window
21章5节：如何绘制三维曲面图、三维球面图和三维曲面地形图 DAT｜R科学用R探索医药数据科学信息可视化三维曲面图三维球面图三维曲面地形图
三维可视化图形在数据分析和科学研究中具有重要意义，尤其是用于展示复杂的三维数据结构。三维曲面图、三维球面图和三维曲面地形图是常见的可视化方式，它们帮助用户更直观地理解数据的分布和关系。在R语言中，plot3D包提供了多个强大的函数，如surf3D和spheresurf3D，用于绘制这些三维图形。通过这些函数，用户可以展示带有颜色编码、光照效果和不同视角的三维表面或球面，广泛应用于地形建模、数据可视
offer多多PDD25届实习生-前/后端研发、算法 2301_78234743 java
题解|#KiKi求质数个数##include/*素数:只能被1和它本身整除的数例如:题解|#牛牛的字符矩形##includeintmain(){charn='#'题解|#空心正方形图案##includeintmain(){inta,i,j;题解|#X形图案##includeintmain(){inta;in题解|#最长回文子串#constrl=require("readline").createI
ECharts实战：在UniApp中实现动态数据可视化 Front_Yue echarts uni-app 信息可视化
前言当今，数据可视化已经成当今，随着数据的日益增长，数据可视化变得越来越重要。ECharts是一个强大的数据可视化工具，它提供了丰富的图表类型和交互方式，可以帮助我们更好地理解和分析数据。当今的数据可视化已成为数据分析和决策制定的重要工当今时代，数据分析和可视化已经成为了各行各业中不可或缺的一部分。而ECharts作为一款强大的数据可视化库，已经成为了众多开发者的首选。在本文中，我们将会介当今，数
密评改造应该选用什么样的SSL证书 https
密评，即商用密码应用安全性评估，是指对采用商用密码技术、产品和服务的信息系统密码应用的合规性、正确性和有效性进行评估。密评改造则是针对现有信息系统不符合密评要求的部分进行调整、升级和完善的过程。一、密评改造应该选用SSL证书的类型：1.国密算法：密评改造专用SSL证书优先采用SM2、SM3、SM4等国产密码算法，同时兼容RSA、DSA或ECC等国际认可的加密算法，以确保数据传输的安全性。2.国产品
【原创】大数据治理入门（2）《提升数据质量：质量评估与改进策略》入门必看高赞实用精通代码大仙数据库 hadoop python 大数据信息可视化 python 数据库 sql
提升数据质量：质量评估与改进策略引言：数据质量的概念在大数据时代，数据的质量直接影响到数据分析的准确性和可靠性。数据质量是指数据在多大程度上能够满足其预定用途，确保数据的准确性、完整性、一致性和及时性是数据质量的关键要素。高质量的数据能够帮助企业更好地理解市场趋势、优化运营流程、支持业务决策，从而提升企业的竞争力。质量评估指标：准确性、完整性、一致性、及时性准确性（Accuracy）定义：数据的准
销售易、用友、销帮帮CRM：优势特色与适用企业深度总结程序员编辑器运维
一、销售易CRM优势特色全渠道客户互动：整合线上线下多个渠道，实现客户信息的统一管理。销售自动化：自动化销售流程，提高销售效率，减少人为错误。智能分析与报告：提供深入的数据分析和定制化报告，帮助企业做出数据驱动的决策。高度定制化：根据企业需求定制CRM功能，满足不同业务场景的需求。移动办公支持：移动应用支持销售人员随时随地访问CRM系统，提高工作效率。集成能力：能够与ERP、OA等企业管理系统集成
案例分享｜Alluxio数据流转方案在联通智网的应用人工智能运维大数据idc
分享嘉宾陈得泳-中国联通大数据平台SRE工程师，致力于基于开源生态构建稳定、高效、安全、低成本的大数据集群。观看完整分享回放业务背景统一底座和安全基座位于不同IDC；统一底座：承接O域全域网络数据，包括移动网信令、告警、故障、资源以及固网数据等基础数据加工的大数据集群，位于郑州IDC；安全基座：是应对网络安全专项支撑的大数据分析平台，位于呼和IDC。统一底座加工后的DNS/NetFlow等固网基础
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name