九方先生

ML算法推导细节08—极端梯度提升XGBoost

探究算法细节，深入了解算法原理

XGBoost的参考资料

XGBoost: A Scalable Tree Boosting System，论文原文，KDD@2016，华盛顿大学，陈天奇博士
XGBoost PPT资料，陈天奇

XGBoost

1. 回归树集成（Regression Tree Ensemble）
2. XGBoost（Gradient Boosting）

2.1 目标函数的近似表达式（二阶泰勒展开）
2.2 改进树的定义
2.3 定义树的复杂度
2.4 重写目标函数
2.5 最小化目标函数的解
2.6 寻找最佳的单棵树

2.6.1 使用贪心策略学习一颗树

3. XGBoost的总结
4. XGBoost论文原文解析

4.1 Introduction
4.2 Tree Boosting
4.3 Split Finding Algorithms

4.3.1 Basic Exact Greedy Algorithm
4.3.2 Approximate Algorithm
4.3.3 Weighted Quantile Sketch（加权分位数略图）
4.3.4 Sparsity-aware Split Finding

4.4 System Design

4.4.1 Column Block for Parallel Learning（并行化）
4.4.2 Cache-aware Access
4.4.3 Blocks for Out-of-core Computation

4.5 Related Works
4.6 End to End Evalutions

5. XGBoost 调参

5.1 XGBoost优点
5.2 XGBoost参数详解

5.2.1 通用参数
5.2.2 tree booster参数
5.2.3 学习目标参数
5.2.4 XGBoost基本方法和默认参数

6. XGBoost接口

6.1 XGBoost原生接口——分类问题
6.2 XGBoost的sklearn接口——分类问题
6.3 XGBoost 调参经验

1. 回归树集成（Regression Tree Ensemble）

【作者PPT内容】

（1）XGBoost全称：eXtreme Gradient Boosting 极端梯度提升

（2）学习算法的目标函数
$Obj(\Theta)=L(\Theta)+\Omega(\Theta)$

$L(\Theta)$ 训练损失，衡量训练集的拟合效果
$\Omega(\Theta)$ 正则化，衡量模型的复杂度

（3）集成CART回归树

例子：输入特征有年龄、性别、职业等，判断一个人是否喜欢电脑游戏。

$w_{11}=2,w_{12}=0.1,w_{13}=-1,w_{21}=0.9,w_{22}=-0.9$ 是每个叶子节点的预测分数
预测结果是每棵树预测的分数之和
树的集成方法，可以学习到特征之间的高阶交互信息

假设有 $K$ 棵树，则预测分数为：

$\hat{y_i}=\sum_{k=1}^{K}f_k(x_i)$

目标函数为：

$Obj=\sum_{i=1}^{n}l(y_i,\hat{y_i})+\sum_{k=1}^{K}\Omega(f_k)$

信息增益对应训练损失
剪枝对应正则化
最大深度限制树模型
平滑叶子节点的值对应叶子节点值的L2正则化

2. XGBoost（Gradient Boosting）

【作者PPT内容】

（1）第 $t$ 轮的模型表达式为：

$\hat{y_i}^{(t)}=\sum_{k=1}^{t}f_k(x_i)=\hat{y_i}^{(t-1)}+f_t(x_i)$

其中 $f_t(x)$ 是需要在第 $t$ 轮学习的。找出 $f_t(x)$ 最小化以下目标函数：

$Obj^{(t)}=\sum_{i=1}^{n}l\left(y_i,\hat{y_i}^{(t-1)}+f_t(x_i)\right)+\Omega(f_t)+constant$

（2）如果是平方损失，去掉常数项，则目标函数变为：

$\begin{aligned} Obj^{(t)} &= \sum_{i=1}^{n}\left[y_i-(\hat{y_i}^{(t-1)}+f_t(x_i))\right]^2+\Omega(f_t)+constant \\&= \sum_{i=1}^{n}\left[2(\hat{y_i}^{(t-1)}-y_i)f_t(x_i)+f_t(x_i)^2\right]+\Omega(f_t) \end{aligned}$

其中 $\hat{y_i}^{(t-1)}-y_i$ 被称为前一轮的残差

2.1 目标函数的近似表达式（二阶泰勒展开）

（1）二阶泰勒展开公式为：

$f(x+\Delta x)\simeq f(x)+f^{'}(x)\Delta x+\frac{1}{2}f^{''}(x)\Delta x$

（2）如果不是平方损失，目标函数很复杂

$Obj^{(t)}=\sum_{i=1}^{n}l\left(y_i,\hat{y_i}^{(t-1)}+f_t(x_i)\right)+\Omega(f_t)+constant$

（3）定义损失函数对第 $t - 1$ 轮的强学习器 $\hat{y_i}^{(t-1)}$ 的一阶偏导和二阶偏导

$g_i=\partial_{\hat{y_i}^{(t-1)}}l(y_i,\hat{y_i}^{(t-1)})$

$h_i=\partial^2_{\hat{y_i}^{(t-1)}}l(y_i,\hat{y_i}^{(t-1)})$

（4）目标函数的近似表达式为：

$Obj^{(t)}=\sum_{i=1}^{n}\left[l(y_i,\hat{y_i}^{(t-1)})+g_if_t(x_i)+\frac{1}{2}h_if_t^2(x_i)\right]+\Omega(f_t)+constant$

（5）去掉常数项，目标函数变为：

$Obj^{(t)}=\sum_{i=1}^{n}\left[g_if_t(x_i)+\frac{1}{2}h_if_t^2(x_i)\right]+\Omega(f_t)$

$f_t(x)$ 的学习仅仅取决于 $g_i, h_i$

2.2 改进树的定义

通过叶子节点中的分数向量和叶子索引映射函数来定义树，该函数将一个实例映射到一个叶子节点。

$f_t(x)=w_{q(x)}, \quad w \in R^T, \quad q:R^d \rightarrow \{1,2,...,T\}$

其中 $w_i$ 是叶子节点的权重，即叶子节点的分数。
$q$ 是树的结构

2.3 定义树的复杂度

利用叶子节点数 $T$ ，和叶子节点分数的L2范数 $w_j^2$ 共同定义模型的复杂度

$\Omega(f_t)=\gamma T+\frac{1}{2}\lambda\sum_{j=1}^{T}w_j^2$

2.4 重写目标函数

将叶子节点 $j$ 中的实例样本定义为：

$I_j=\{i|q(x_i)=j\}$

根据叶子节点将目标函数重写为：

$\begin{aligned} Obj^{(t)} & \simeq \sum_{i=1}^{n}\left[g_if_t(x_i)+\frac{1}{2}h_if_t^2(x_i)\right]+\Omega(f_t) \\ & = \sum_{i=1}^{n}\left[g_iw_q(x_i)+\frac{1}{2}h_iw_q^2(x_i)\right]+\gamma T+\frac{1}{2}\lambda\sum_{j=1}^{T}w_j^2 \\ &=\sum_{j=1}^{T}\left[(\sum_{i \in I_j}g_i)w_j+\frac{1}{2}(\sum_{i \in I_j}h_i+\lambda)w_j^2\right]+\gamma T \end{aligned}$

2.5 最小化目标函数的解

（1）对于单变量的平方函数，有如下结论：

$\arg \min_{x} Gx+\frac{1}{2}Hx^2=-\frac{G}{H}, \quad H>0$

$\min_{x} Gx+\frac{1}{2}Hx^2=-\frac{1}{2}\frac{G^2}{H}$

（2）替换目标函数中的系数

定义如下系数：

$G_j=\sum_{i \in I_j}g_i$

$H_j=\sum_{i \in I_j}h_i$

目标函数变为：

$\begin{aligned} Obj^{(t)} & \simeq \sum_{j=1}^{T}\left[(\sum_{i \in I_j}g_i)w_j+\frac{1}{2}(\sum_{i \in I_j}h_i+\lambda)w_j^2\right]+\gamma T \\ & = \sum_{j=1}^{T}\left[G_jw_j+\frac{1}{2}(H_j+\lambda)w_j^2\right]+\gamma T \end{aligned}$

（3）假设树的结构 $q (x)$ 是固定的，求得叶子节点的最佳权重、最小目标值（结构得分）为：

$w_j^*=-\frac{G_j}{H_j+\lambda}$

$Obj=-\frac{1}{2}\sum_{j=1}^{T}\frac{G_j^2}{H_j+\lambda}+\gamma T$

（4）最小目标值计算：

Obj衡量了树结构的好坏

2.6 寻找最佳的单棵树

枚举所有可能的树结构 $q$
计算结构得分， $Obj=-\frac{1}{2}\sum_{j=1}^{T}\frac{G_j^2}{H_j+\lambda}+\gamma T$
找出最好的树结构，即Obj最小的树，使用最佳叶子节点权重 $w_j^*=-\frac{G_j}{H_j+\lambda}$

2.6.1 使用贪心策略学习一颗树

（1）从深度为0的树开始。

（2）对树的每个叶子节点，试图去分裂。增加分裂后的目标变化是：

这个公式形式上跟ID3算法（采用entropy计算增益）、CART算法（采用gini指数计算增益）是一致的，都是用分裂后的某种值减去分裂前的某种值，从而得到增益

（3）寻找最佳分裂

从左到右线性扫描经过排序的实例，找出特征的最佳分割。

对每个特征，按照特征值，排序实例（样本）
使用线性扫描，寻找最佳分割特征
停止分裂，如果最佳分裂有一个负增益
生成一个最大深度的决策树，递归的剪枝负增益的分裂节点

3. XGBoost的总结

（1）xgboost与传统的GBDT相比，对代价函数进行了二阶泰勒展开，同时用到了一阶与二阶导数，而GBDT在优化时只用到了一阶导数的信息，个人认为类似牛顿法与梯度下降的区别。

（2）xgboost在损失函数里加入的正则项可用于控制模型的复杂度。

正则项里包含了树的叶子节点个数、每个叶子节点上输出score的L2模的平方和。
从Bias-variance trade-off角度来讲，正则项降低了模型的variance，使学习出来的模型更加简单，防止过拟合，这也是xgboost优于传统GBDT的一个特性。

（3）传统GBDT以CART回归树作为基分类器，xgboost还支持线性分类器，这个时候xgboost相当于带L1和L2正则化项的逻辑回归（分类问题）或线性回归（回归问题）。

（4）Shrinkage（缩减），相当于学习速率（xgboost中的eta）。

xgboost在进行完一次迭代后，会将叶子节点的权重乘上该系数，主要是为了削弱每棵树的影响，让后面有更大的学习空间。
实际应用中，一般把eta设置得小一点，然后迭代次数设置得大一点。
传统GBDT的实现也有学习速率

（5）列抽样（column subsampling）。xgboost借鉴了随机森林的做法，支持列抽样，不仅能降低过拟合，还能减少计算，这也是xgboost异于传统GBDT的一个特性。

（6）对缺失值的处理。对于特征的值有缺失的样本，xgboost可以自动学习出它的分裂方向。

（7）xgboost工具支持并行。boosting不是一种串行的结构吗?怎么并行的？

注意xgboost的并行不是tree粒度的并行，xgboost也是一次迭代完才能进行下一次迭代的（第t次迭代的代价函数里包含了前面t-1次迭代的预测值）。
xgboost的并行是在特征粒度上的。我们知道，决策树的学习最耗时的一个步骤就是对特征的值进行排序（因为要确定最佳分割点），xgboost在训练之前，预先对数据进行了排序，然后保存为block结构，后面的迭代中重复地使用这个结构，大大减小计算量。
这个block结构也使得并行成为了可能，在进行节点的分裂时，需要计算每个特征的增益，最终选增益最大的那个特征去做分裂，那么各个特征的增益计算就可以开多线程进行。

（8）可并行的近似直方图算法。

树节点在进行分裂时，我们需要计算每个特征的每个分割点对应的增益，即用贪心法枚举所有可能的分割点。
当数据无法一次载入内存或者在分布式情况下，贪心算法效率就会变得很低，所以xgboost还提出了一种可并行的近似直方图算法，用于高效地生成候选的分割点。

4. XGBoost论文原文解析

以上3节内容是PPT中的资料，本节主要看一下【论文原文】的一些细节部分。

【XGBoost： A Scalable Tree Boosting System】

从题目中就可以看出来，这篇文章重点讲的是一个system，而不是algorithm
本文的重点大篇幅地介绍了xgb整个系统是如何搭建，如何实现的，在模型算法的公式改进上只做了一点微小的工作。
摘要：XGBoost可用比现有系统少得多的资源来处理数十亿规模的数据。

4.1 Introduction

主要创新点：

构建高度可扩展的端到端的提升树系统。 XGBoost成功的最重要因素是其在所有情况下的可扩展性
该系统在单台机器上的运行速度比现有流行解决方案快十倍以上，并可在分布式或内存有限的环境中扩展到数十亿的数据规模。
提出一个理论上合理的加权分位数略图。（分裂节点时可以不用遍历所有点，省时间）
引入新颖的稀疏感知算法用于并行树学习。（令缺失值有默认方向）
提出有效的用于核外树形学习的缓存感知块结构。（用缓存加速寻找排序后被打乱的索引的列数据）

4.2 Tree Boosting

基本思想与GBDT一样，都是按照损失函数的负梯度方向提升
损失函数进行了泰勒二次展开（不理解为什么用二阶导数），求近似解
正则化项除了叶子节点数之外，加入了叶子节点得分的L2范数
shrinkage相当于学习速率
column（feature） subsampling，与RF类似。使用者反馈列的子采样比行的子采样更能防止过拟合，列的子采样也加速了并行化的特征筛选。

4.3 Split Finding Algorithms

论文的核心之一，是xgb跑的快的原因。

4.3.1 Basic Exact Greedy Algorithm

精确的贪心算法
遍历所有可能的分割点
根据特征值对数据进行排序，并对数据进行排序访问

4.3.2 Approximate Algorithm

当数据量过大，传统算法就不好用了，因为要遍历每个分割点，甚至内存都放不下。所以，xgb提出了一种近似算法能加快运行时间。
该算法首先根据特征分布的百分位数提出（propose）候选分割点。有 global proposal 和 local proposal 两种
global的是在建树之前就做proposal，然后每次分割都要更新一下proposal
local的方法是在每次split之后更新proposal。

4.3.3 Weighted Quantile Sketch（加权分位数略图）

4.3.4 Sparsity-aware Split Finding

在分割的时候，xgb系统还能感知稀疏值，给每个树的结点都加了一个默认方向
当一个值是缺失值时，就把它分类到默认方向，每个分支有两个选择，枚举向左和向右的情况，哪个gain大选哪个

4.4 System Design

论文重中之重

4.4.1 Column Block for Parallel Learning（并行化）

树学习最耗时的部分是数据排序
为了降低排序成本，将数据存储在内存单元中，称之为块
每个块中的数据以压缩列格式存储，每个列按相应的特征值排序。
这个输入数据布局只需要在训练之前计算一次，并且可以在以后的迭代中重用。

Fig.6 Block structure for parallel learning. Each column in a block is sorted by the corresponding feature value. A linear scan over one column in the block is sufficient to enumerate all the split points.

可以使用多个块，每个块对应于数据集中的行的子集。
不同的块可以分布在不同的机器上，也可以在内核外存储在磁盘上。
使用排序结构，分位数查找步骤将成为对排序列的线性扫描。
直方图聚集中的二值搜索也成为一种线性时间合并算法。

对每列的统计数据进行并行采集，给出了一种并行的分割查找算法。重要的是，列块结构还支持列子采样，因为很容易在块中选择列的子集。

【特征选择时，并行处理列数据，XGB就是在这实现的并行化，多线程实现加速】

4.4.2 Cache-aware Access

当数据排序后，索引值是乱序的，可能指向了不同的内存地址
找的时候数据是不连续的，这里加了个缓存，让以后找的时候能找到小批量的连续地址，以实现加速

4.4.3 Blocks for Out-of-core Computation

4.5 Related Works

4.6 End to End Evalutions

column subsampling表现不太稳定，sub有时好有时不好，什么时候该用sub呢？当没有重要的特征要选，每个特征值的重要性都很平均的时候，对列的subsampling效果就比较差了。

分布式的实验：在Amazon的云服务平台上用了32台m3.2xlarge搭建了一个YARN集群，数据没有放在HDFS里，放在了Amazon的S3 storage上，xgb虐了spark MLLib。

5. XGBoost 调参

5.1 XGBoost优点

正则化：控制模型复杂度，防止过拟合。
并行处理：不是tree粒度，特征粒度。特征排序最耗时，预排序后保存为block结构。
灵活性：可自定义目标函数，只要满足二阶可导。
缺失值处理：自动学习分裂方向
剪枝：先建立所有可以建立的子树，再从底到顶反向剪枝。
内置交叉验证：允许在每一轮boosting迭代中使用交叉验证，获得最迭代次数

5.2 XGBoost参数详解

三部分：通用参数，tree booster参数，学习目标参数

5.2.1 通用参数

booster：可选gbtree和gblinear
silent：取0打印运行时信息，取1不打印
nthread：运行时的线程数
num_pbuffer：预测结果缓冲区大小，保存最后一步提升的预测结果
num_feature：Boosting过程中用到的特征维数

5.2.2 tree booster参数

eta：收缩步长，类似于学习率，默认0.3
gamma：节点分裂时，只有分裂后损失函数的值下降了，才会分裂这个节点，用于控制是否后剪枝
max_depth：树的最大深度，默认为6，交叉验证调优
min_child_weight ：孩子节点中最小的样本权重和。如果叶子节点的样本权重和小于该值则拆分过程结束。用于避免过拟合，但是过高会导致欠拟合
subsample ：训练模型的子样本占整个样本集合的比例。随机抽取子样本建立树模型，防止过拟合
colsample_bytree：对特征采样的比例
lambda，alpha：Linear Booster时的L2、L1正则化参数

5.2.3 学习目标参数

objective：可选 reg:linear，reg:logistic，binary:logistic，multi:softmax等
base_score：所有实例样本的初始化预测分数，全局偏置，默认0.5
eval_metric：可选 mse，mae，logloss，error，merror，auc
seed：随机数种子

5.2.4 XGBoost基本方法和默认参数

params = {
    'booster': 'gbtree',
    'objective': 'multi:softmax',  
    'num_class': 10,               
    'gamma': 0.1,                  
    'max_depth': 6,               
    'lambda': 2,                   
    'subsample': 0.7,              
    'colsample_bytree': 0.7,       
    'min_child_weight': 3,
    'silent': 1,                   
    'eta': 0.007,                 
    'seed': 1000,
    'nthread': 4,                 
}
xgboost.train(params,
              dtrain,
              num_boost_round=10,
              evals=(),
              obj=None,
              feval=None,
              maximize=False,
              early_stopping_rounds=None,
              evals_result=None,
              verbose_eval=True,
              learning_rates=None,
              xgb_model=None)

params ：字典形式，参数
dtrain ：训练数据
num_boost_round：提升迭代个数
evals ：列表形式，训练过程中评估列表中的元素。如evals = [(dtrain,’train’), (dval,’val’)]
obj：自定义目标函数
feval：自定义评估函数
maximize：是否对评估函数进行最大化
early_stopping_rounds：早停次数，假设为100，验证集误差在100次迭代内不再继续降低，就停止迭代。
evals_result ：字典，存储在watch_list 中元素的评估结果。
verbose_eval：如果为True, evals中元素的评估结果会输出在结果中；如果输入数字，假设为5，则每隔5个迭代输出一次。
learning_rates ：每一次提升的学习率列表
xgb_model：训练之前用于加载的xgb

model

6. XGBoost接口

6.1 XGBoost原生接口——分类问题

from sklearn.datasets import load_iris
import xgboost as xgb
from xgboost import plot_importance
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score   

# 加载样本数据集
iris = load_iris()
X,y = iris.data,iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1) 

# 算法参数
params = {
    'booster': 'gbtree',
    'objective': 'multi:softmax',
    #  'objective': 'reg:gamma', # 回归问题目标函数
    'num_class': 3,
    'gamma': 0.1,
    'max_depth': 6,
    'lambda': 2,
    'subsample': 0.7,
    'colsample_bytree': 0.7,
    'min_child_weight': 3,
    'silent': 1,
    'eta': 0.1,
    'seed': 1000,
    'nthread': 4,
}
plst = params.items()

# 生成数据集格式
dtrain = xgb.DMatrix(X_train, y_train) 
dtest = xgb.DMatrix(X_test)

# xgboost模型训练
num_rounds = 500
model = xgb.train(plst, dtrain, num_rounds) 

# 对测试集进行预测
y_pred = model.predict(dtest)
accuracy = accuracy_score(y_test,y_pred)
print("accuarcy: %.2f%%" % (accuracy*100.0))

# 显示重要特征
plot_importance(model)
plt.show()

特征值越大，说明该特征越重要

6.2 XGBoost的sklearn接口——分类问题

from sklearn.datasets import load_iris
import xgboost as xgb
from xgboost import plot_importance
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 加载样本数据集
iris = load_iris()
X,y = iris.data,iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1) 

# 训练模型
model = xgb.XGBClassifier(max_depth=5, learning_rate=0.1, n_estimators=160, silent=True, objective='multi:softmax')
model.fit(X_train, y_train)

# 对测试集进行预测
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test,y_pred)
print("accuarcy: %.2f%%" % (accuracy*100.0))

# 显示重要特征
plot_importance(model)
plt.show()

6.3 XGBoost 调参经验

（1）先给定以下参数初始值，CV调整决策树数量

max_depth=6
min_child_weight=1
gamma=0
subsample=0.8
colsample_bytree=0.8
learning_rate=0.1

（2）调优 max_depth，min_child_weight

这两个参数对结果影响最大
先大范围粗调，再小范围微调

（3）依次 gamma，subsample ，colsample_bytree 参数调优

（4）正则化参数调优

（5）降低学习率，使用更多的决策树

参考博客
1. python机器学习案例系列教程——GBDT算法、XGBOOST算法
2. Boosting学习笔记（Adboost、GBDT、Xgboost）
3. xgboost原理
4. XGBoost 论文翻译+个人注释

巴尔加瓦算法图解：K最近邻算法 Ashleyxxihf 码上行动：巴尔加瓦算法图解算法近邻算法
巴尔加瓦算法图解：K最近邻算法目录巴尔加瓦算法图解：K最近邻算法判断水果创建推荐系统1.判断相似程度练习回归（预测结果）机器学习总结本章内容❑学习使用K最近邻算法创建分类系统。❑学习特征抽取。❑学习回归，即预测数值，如明天的股价或用户对某部电影的喜欢程度。❑学习K最近邻算法的应用案例和局限性。判断水果判断这个水果是橙子还是柚子呢？一种办法是看它的邻居。来看看离它最近的三个邻居。在这三个邻居中，橙子
大数据开发之机器学习总结（一）闻香识代码大数据机器学习用户画像机器学习大数据算法
大数据开发之机器学习总结1.背景在大数据开发中，数据分析目的一般分为2大类，一个是基于已有数据，提炼出想要的数据汇总信息。一个是基于已有数据使用算法训练出模型，基于模型预测和分析未来的新数据。前者就是很多时候的大数据分析场景，后者则涉及到算法模型，机器学习的范畴。更进一步，人工智能，但机器学习和人工智能，本身其实技术上并没有非常严格的界限。2.机器学习概念机器学习，故名思意，让机器通过学习过去的经
机器学习总结净土_0342
朴素贝叶斯fromsklearnimportdatasetsiris=datasets.load_iris()fromsklearn.naive_bayesimportGaussianNBgnb=GaussianNB()y_pred=gnb.fit(iris.data,iris.target).predict(iris.data)支持向量机fromsklearnimportsvmX=[[0,0],
深度之眼-机器学习总结任嘉平生愿
为期三个月的西瓜书机器学习训练营结束，昨天听完了毕业典礼。我做了如下总结：校长讲话：定目标短时间自己的小团队闭环开环闭环----学习小部分就应用时间和努力的堆积打比赛应用人工智能的课题和方向资料tensorflow实战google深度学习框架和强者学习才会遇强则强博士讲话：1.坚持写博客2.github3.多练习4.英文原版的文章高级课程你目前的弱点是什么5.多读论文
机器学习总结 gridlayout 机器学习人工智能
对以下文章机器学习总结什么是深度学习?最易懂的机器学习入门文章-CSDN博客人工智能和机器学习之间的关系人工智能是一个最宽泛的概念，是一个研究领域，同时也是一个实现目标，而机器学习则是实现这一目标的一类方法。深度学习只是机器学习这一类方法中的一种。机器学习之前的建模方式对比:深度学习改变了很多领域算法的实现模式。在深度学习兴起之前，很多领域建模的思路是投入大量精力做特征工程，将专家对某个领域的“人
2023 Google开发者大会：你了解机器学习的新动向吗？ Mr.Winter` 前沿资讯机器学习人工智能 google 数据挖掘计算机视觉语音识别深度学习
目录0年度科技盛会1生成式机器学习2无障碍游戏体验3跨平台机器学习总结0年度科技盛会2023Google开发者大会在上海浦东举办，为开发者和科技爱好者们带来新技术、新产品、新动向可能很多同学对Google开发者大会还不熟悉，Google开发者大会是Google展示最新产品和平台的年度盛会，为开发者提供丰富的学习资源、实践操作和现场演示，提供与Google专家互动、与其他开发者交流的契机，助力开发提
【机器学习】许多仙机器学习算法支持向量机
说明：机器学习总结0、数据集1、贝叶斯分类器（一）计算题所有样本分为两类（c）：好瓜=是、好瓜=否（1）计算先验概率：P(c)（2）计算每个属性的条件概率：P(xi|c)（3）代入朴素贝叶斯公式：（4）结论：（5）拉普拉斯修正（平滑处理，可选）上面的公式中出现连乘现象，这会导致对于0特别敏感，比如出现一个0，就会直接导致最终结果直接为0其中：N——所有类别数，这里一个有两类，所以N=2Ni——第i
数字验证码识别新思路及对opencv支持向量机机器学习总结快乐的阿常艾念宝机器学习杂谈＆随想机器学习 opencv 支持向量机
验证码识别框架新问题最近遇到了数字验证码识别的新问题。由于这次的数字验证码图片有少量变形和倾斜，所以，可能需要积累更多的原始采样进行学习。但按照4个验证码10个数字的理论随机组合(暗含某种数字仅有少量变化，不然此组合数量还应更大)，也就是要采样差不多一万张图片；对每个图片适当分割后，那就差不多几万张图片了。想要对这些切割后的图片进行手工分类，成为基本数字的训练学习数据，手工工作量不小，也很无趣。当
机器学习总结（lecture 4）算法：逻辑回归Logistic Regression （LR）九方先生机器学习总结
lecture4：逻辑回归LogisticRegression目录lecture4逻辑回归LogisticRegression目录1分类和模型表示2逻辑回归1逻辑回归的代价函数的选取3过拟合和正则化1分类和模型表示先来谈谈二分类问题。课程中先给出了几个例子。邮件是垃圾邮件还是非垃圾邮件；网上交易是的欺骗性（YorN）；肿瘤是恶性的还是良性的。对于这些问题，我们可以通过输出值yϵ{0,1}来表示。注
朴素贝叶斯——机器学习总结古月哥欠666 机器学习算法
朴素贝叶斯基础知识概念优缺点一般过程利用python进行文本分类准备数据训练算法测试算法示例1：使用朴素贝叶斯过滤垃圾邮件一般步骤准备数据：切分文本测试算法：使用朴素贝叶斯进行交叉验证示例2：使用朴素贝叶斯分类器从个人广告中获取区域倾向一般步骤收集数据：导入RSS源RSS源分类器及高频词去除函数分析数据：显示地域相关的用词基础知识概念从简单的概率分类器开始，给出一些假设（条件独立性）学习朴素贝叶斯
Python-Level5-day07am:聚类的基于噪声密度/凝聚层次算法及评价指标及小结,机器学习补充练习,机器学习总结, dpq666dpq666 数据分析人工智能 python
之前讲解了基于中心聚类，采用kmeans聚类算法，下面讲解基于噪声密度聚类算法DBSACN与基于层次聚类算法（Agglomerative）算法2）噪声密度①算法定义噪声密度（Density-BasedSpatialClusteringofApplicationswithNoise，简写DBSCAN）随机选择一个样本做圆心，以事先给定的半径做圆，凡被该圆圈中的样本都被划为与圆心样本同处一个聚类，再以
机器学习总结-基于sklearn包 zaprily 总结 sklearn python 机器学习
流程集成学习数据预处理（特征工程）1.处理负值（oroutlier）标记有问题的特征，但是不删去defgetres1(row):returnlen([xforxinrow.valuesiftype(x)==intandx20,'neg1']=20#平滑处理2.填充缺失值缺失值也可以删去样本或者特征，不过在样本量比较少，特征不明确的情况下不建议直接删除特征。可以直接用fillna补充data['le
《吴恩达机器学习》18 机器学习总结 JockerWong 机器学习吴恩达机器学习课程总结
前言原机器学习最后一章的内容为图片文字识别，但是笔者在看了这一章的课程之后发现其内容可能实际应用性不大，课程讲的ocr识别的方法已经不适合目前主流的算法（目前主流使用CNN——卷积神经网络），故省略这一章节的笔记，改为对整个机器学习课程的总结。一、监督学习算法1、线性回归线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，运用十分广泛。其表达形式为hθ
吴恩达机器学习总结（三）——神经网络的反向传播 Anaconda_ 机器学习深度学习机器学习神经网络反向传播
神经网络的反向传播在上一篇博客中，利用神经网络对手写数字数据进行分类的结果虽然已经很高了，但和测试样本本身的输出值进行比较还是存在着一定的误差。这时我们需要使用这个误差值来调整神经网络本身，进而改变神经网络的输出值。误差传递我们知道在前向传播中，每个节点向下一层传递的信号所占权重不同。若只有一个节点的信号传递到输出节点，那调整神经网络输出值的方式将简单的多，只需要更新这个节点的权重即可。假如有多个
博客目标与内容 Geng Rain python
目标量化学习总结回测框架Backtrader量化机器人的搭建因子模型技术分析编程学习总结网络编程python基础数学学习总结高数线性代数概率论机器学习总结pytorch神经网络强化学习具体项目总结目标管理app打卡app学习方法总结学习方法
机器学习总结奋斗的海绵机器学习数据分析数据挖掘
（1）x（2）表示训练集中x的第二个训练数据，y(2)表示训练集中的y的第二个训练数据（2）需要注意的是对于一个模型构建出来的函数F，那么我们如何找出该模型的可以更好拟合训练数据的模型参数呢，我们通过使用代价函数（costfunction），通过计算不同的参数得到的预测值y和最终结果y之间的误差大小来最终确定应该如何选择最佳的参数。（3）梯度下降算法被用来寻找使得代价函数J的最小值，从而确定其此时
分布式机器学习总结 Liao_Wenzhe 机器学习与数据挖掘分布式数据研发大数据
目前主流的分布式架构包括：1.基于mapreduce模型的spark-mllib，采用数据分布式+同步的模式，缺点是对异步和模型分布式不支持，但是社区完善。2.基于参数服务器的Multiverso，既可实现数据分布式，也可实现模型分布式，同时支持异步和同步，也可实现大规模的参数更新。3.基于数据流图的tensorflow，可以和1，2结合组成复杂的分布式机器学习网络。4.3种模式的区别：5.各种框
百面机器学习总结笔记（第二章模型评估） Avery123123 算法岗面试笔试准备百面机器学习模型评估
百面机器学习总结笔记（第二章模型评估）百面机器学习总结笔记第二章模型评估第1节评估指标的局限性问题：准确率的局限性问题：精确率与召回率的权衡第2节ROC曲线问题：什么是ROC曲线？问题：如何绘制ROC曲线？问题：如何计算AUC？问题：ROC曲线相比于P-R有什么特点？第3节余弦距离的应用第4节A/B的陷阱第5节模型评估的方法问题：在模型评估中，有哪些主要的评估方法，他们的优缺点是什么？问题：在自助
机器学习总结 Bryant998 人工智能 python
均值、中值和众数从一组数字中我们可以学到什么？在机器学习（和数学）中，通常存在三中我们感兴趣的值：均值（Mean）-平均值中值（Median）-中点值，又称中位数众数（Mode）-最常见的值例如：我们已经登记了13辆车的速度：speed=[99,86,87,88,111,86,103,87,94,78,77,85,86]什么是平均，中间或最常见的速度值？均值均值就是平均值。要计算平均值，请找到所有
若特征的相关系数为0或接近0，就一定可以被过滤吗？相关系数的显著性检验也不一定可靠，如何判断？陈谦机器学习人工智能算法 python
系列文章目录添加机器学习总结提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、若特征的相关系数为0或接近0，就一定可以被过滤吗？二、验证步骤1.通过皮尔逊相关系数得出的结论，名称一样的特征排名靠后，反而在模型训练之后的特征重要性在中间。同样的模型得出的特征排名靠后反而皮尔逊相关系数靠前。总结前言若特征的相关系数为0或接近0，就一定可以被过滤吗？相关系数的显
周志华机器学习总结夜夜0810
Lecture3线性模型基本形式一般向量形式:优点:线性回归广义线性模型对数几率回归由对数几率函数确定$\boldsymbol{\omega}$和$b$线性判别分析(LDA)思想求解多分类任务多分类问题基本形式一般向量形式:f(x)=ωT∗x+bf(\boldsymbol{x})=\boldsymbol{\omega}^T*\boldsymbol{x}+bf(x)=ωT∗x+b优点:非线性模型可由
机器学习总结之——标准化与归一化的区别 Greatpanc 机器学习标准化归一化标准化与归一化过程缺失数据处理
机器学习总结之——标准化与归一化的区别1、标准化简单来说，标准化是依照特征矩阵的列处理数据，其通过求z-score的方法，将样本的特征值转换到同一量纲下。标准化的前提是特征值服从正态分布，标准化后，其转换成标准正态分布。公式如下：x′=x−XS（其中X代表样本均值，S代表样本方差）x'=\frac{x-X}{S}（其中X代表样本均值，S代表样本方差）x′=Sx−X（其中X代表样本均值
李宏毅课程-机器学习总结张学义深度学习
李宏毅课程-机器学习总结迁移学习：TransferLearning1.什么是迁移学习呢？2.为什么用迁移学习3.迁移学习的概述3.1第一类迁移学习3.2第二类迁移学习3.3第三类迁移学习3.4第四类迁移学习大佬的笔记较好，拷贝留档学习学习网址https://aistudio.baidu.com/aistudio/education/group/info/1978迁移学习：TransferLearn
机器学习总结一：Bagging之决策树、随机森林原理与案例想考个研机器学习决策树随机森林
机器学习算法总结一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-means一、Bagging之决策树、随机森林原理与案例1.决策树1.1简介决策树(DecisionTree)是一种非参数的有监督学习方法，它能够从一系列有特征和标签的数据种总结出决策规则，并利用树状图结构呈现这些规则
机器学习总结三：SVM原理推导与案例想考个研机器学习支持向量机算法
机器学习算法总结一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-means三、SVM1.原理推导（硬间隔）1.1分类问题代数化**svm原理一句话概括：找出一个最优的直线(或超平面)去隔离不同类别样本数据，达到分类目的。**图1图2图1:找出一条直线将样本完美地划分成两类（注意这样
机器学习总结二：boosting之GBDT、XGBT原理公式推导想考个研机器学习算法 boosting
一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-meansBoosting1.简介通过在数据上构建多个弱评估器，汇总所有弱评估器的建模结果，以取得比单个模型更好的分类或回归表现。加法模型，前向分步计算学习。2.基本元素弱评估器f(x)：一般为决策树(cart树)，不同boostin
机器学习总结四：逻辑回归与反欺诈检测案例想考个研机器学习逻辑回归算法
机器学习算法总结一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-means四、逻辑回归1、概述由线性回归变化而来的，应用于分类问题中的广义回归算法。组成：回归函数z=w1x1+w2x2+...+wnxn+b=[w1w2wnb]∗[x1x2⋮xn1]=wTXz=w_1x_1+w_2x
吴恩达机器学习总结（二）——Logistic回归和简单的神经网络（附作业） Anaconda_ 机器学习机器学习逻辑回归神经网络
在线性回归模型中，输入和输出一般都是连续的，对于每个输入x，都有一个对应的输出y，模型的定义域和值域都可以是(−∞,+∞)(-∞,+∞)(−∞,+∞)。而对于分类模型来说，其输入可以是连续的，但它的输出是离散的，即只有有限个输出y。例如，其值域可以只有两个值{0,1}，这两个值可以表示对样本的某种分类，高/低、患病/健康、阴性/阳性等，这就是最常见的二分类问题。二、Logistic回归逻辑回归带有
机器学习总结（三）——梯度下降详解时代&信念机器学习
梯度下降通俗解释机器学习的问题中，线性回归问题是一个特殊的情况，线性回归可以直接求解，但是其他问题不行！举一个通俗的例子针对我们的问题，我们想要找到loss最小值所对应的θ值。我们“下山”的路有很多条，哪一条下山最快呢？那必定是对应点处的切线方向啊，也叫对应点的梯度反方向。每下降一步（或者叫“下山”一步），对应的点都会改变，所以对应的梯度方向也会改变。我们每次走一步，一步应该多大呢？步长应该小一些
机器学习总结（二）时代&信念机器学习机器学习 python 人工智能
独立同分布的意义在机器学习中很重要的一点：误差是独立同分布的，并且服从均值为0，方差为⊖2\ominus^2⊖2的高斯分布。解释一下：什么是独立？就是数据样本之间互相独立（互相不影响），例如：张三来银行贷款，他贷款多少并不影响李四的贷款金额和情况。两个数据是相互独立的。什么是同分布？样本数据得满足相同的分布。不能是这个数据满足正太分布，这个数据满足泊松分布。例如：咋们研究的是，根据年龄和月薪，预测
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S