求个offer救救俺

机器学习（二）

1、XGBoost为啥用二阶泰勒展开

利用泰勒公式去逼近任何函数，在GBDT一阶导数的基础上引入二阶导更加精确，同时在二阶导的基础上可以转化为关于叶子结点权重的一元二次方程，在顺序扫描计算增益损失时更加精准，因为本身二阶导在推导过程中可以更精确的反应梯度是如何变化的，从而更精确的实现loss下降（无放回训练，因为中间有梯度下降）

同时因为xgboost的损失函数是基于MSE的，这样有更好的扩展性，任何可以进行二阶泰勒展开的都可以自定义其损失函数，既可分类也可回归。

1、第一点利用泰勒展开本质上上是去模拟逼近函数，二阶展开可以进一步拟合精度，二阶信息可以描述梯度变化方向是如何变化的。

2、第二点为了xgboost的可扩展性，使xgboost能够【自定义loss function】，只要损失函数二阶可导就可套用推导结果，即可分类也可回归。

XGBoost官网上有说，当目标函数是 MSE时，展开是一阶项（残差）+二阶项的形式，而其它目标函数，如 logistic loss
的展开式就没有这样的形式。为了能有个统一的形式，所以采用泰勒展开来得到二阶项，这样就能把 MSE推导的那套直接复用到其它自定义损失函数上。简短来说，就是为了统一损失函数求导的形式以支持自定义损失函数。

至于为什幺要在形式上与 MSE统一？是因为 MSE是最普遍且常用的损失函数，而且求导最容易，求导后的形式也十分简单。所以理论上只要损失函数形式与 MSE统一了，那就只用推导 MSE就好了。

Xgboost相对于GBDT的不同

1、GBDT是机器学习方法，xgboost是该算法的工程实现

2、在使用CART作为基分类器时，XGBoost显式地加入正则化项来控制模型的复杂度，有利于防止过拟合，提高模型的泛化能力

3、GBDT在模型训练时只采用了代价函数的一阶导数信息，XGBoost进行二阶展开，可以同时采用一阶二阶导数

4、传统GBDT采用CART作为基分类器，XGBoost支持多种类型分类器，比如线性分类器

5、GBDT会采用全部的数据，XGBoost支持下采样，同时设置了缺失值的处理方式，通过左右两轮遍历办证稀疏值处于左右子树

6、分裂算法，线性排列后进行扫描特征，确定节点的增益损失大小，以确定最好的分割点。

2、过拟合的解决方案

重新清洗样本，增加样本数量进行样本集扩充，最简单淳朴的方法，在项目中对图片数据进行平移翻转、扩充等各种方法将数据集扩充

降低模型复杂度，引入L2正则化系数，利用early stopping，减少迭代次数，

在树模型中可以进行剪枝等相关操作，在数据层面也可以进一步减少特征项，降低拟合的复杂度

3、处理数据不均衡

可以进行数据集的扩充，对大类样本欠采样，小类样本进行过采样（基于聚类的过采样策略---SMOTE算法、图片样本扩充），插值等方法，引入新的评价指标，不单单使用P,R值，利用F1值，ROC曲线进行描述拟合，也可以进一步更新损失函数，比如在医学图像分割中提出的dice函数，iou交并比其实就是小样本占比比较小的一种策略

同时改变训练策略，可以引入RF等集成学习的策略，选择小类样本和相同数目的大类样本并行跑小模型最后集成学习

4、卷积中cnn的感受野？为什么用多个小卷积核代替大卷积核

2*3*3的感知野相当于5*5，但是每个卷积核后边都会接relu函数，这样的话可以引入更多的非线性，相当于引入更多的正则化项

同时小尺寸的卷积核所需要调参的数目也不大尺寸卷积核要少。

1*1卷积：https://zhuanlan.zhihu.com/p/40050371

1、1*1卷积用来降维，调整网络深度，使网络结构更紧凑，同时需要调节的参数也会减小，增加非线性

2、实现跨通道的交互和信息整合（改变channel数）

inception+ResNet

inception不用我们选择，而是把4个选项给神经网络，让它自由选择，自己选择最合适的解决方案

蓝色卷积块的作用就是为了让网络根据需要灵活的控制数据的depth，GoogLeNet利用1×1的卷积降维后，得到了更为紧凑的网络结构，虽然总共有22层，但是参数数量却只是8层的AlexNet的十二分之一

Inception模块采用不同尺寸的卷积核，可以不同时考虑区域和通道的问题

常见的卷积网络类型：

1、AlexNet：双GPU运行，Relu为激活函数，LRN局部归一化，Droupot随机化乘以系数p，在池化过程中z>s

2、VGGNet：卷积核3*3，最大池化 2*2 ，1*1的卷积在于线性变化

两个3*3卷积核串联相当于5*5，同理3个3*3串联相当于7*7

3、GoogleNet：同一层中卷积核大小不同，可以进行不同尺度的特征融合

5、双向LSTM优势

LSTM的基本网络结构：https://www.jianshu.com/p/9dc9f41f0b29

遗忘门+输入门+输出门

遗忘门：

确定更新信息：

更新细胞状态：

输出信息：

LSTM的核心，使用隐藏状态保存已经通过它的输入信息。

单向LSTM仅保留过去的信息，因为它看到的唯一输入来自过去。

使用双向将以两种方式运行输入，一种从过去到未来，一种从未来到过去，这种方法与单向的不同之处在于，在向后运行的LSTM中，您保留来自 future的信息并且使用两种隐藏状态，您可以在任何时间点保存过去和未来的信息。

（二）GRU循环神经网络的公式及更新

6、利用awk提取端口

用-F参数项指定列的分隔符。

awk -F"[: ]" '{print "协议:"$1,"端口号:"$NF}'

关于 awk 脚本，我们需要注意两个关键词 BEGIN 和 END。

BEGIN{ 这里面放的是执行前的语句 }
END {这里面放的是处理完所有的行后要执行的语句 }
{这里面放的是处理每一行时要执行的语句}

7、KNN和K-means的区别?

KNN本质上是有监督学习，数据是带有label的多分类算法，通过选取与样本点相近的k个样本的最多所属类别作为样本点的类别，主要有距离度量，k值选择，分类决策机制几部分构成，常见的分类机制有构建kd树进行划分。

k-means是无监督学习方法，用于聚类的算法，其他聚类方法还有层次聚类、密度聚类等。但是受离群点的影响比较大，需要进行数据归一化处理，同时利用手肘法等确定合理的拐点，找到合适的K值。

KNN

分类算法
监督学习
数据集是带Label的数据
没有明显的训练过程，基于Memory-based learning
K值含义 - 对于一个样本X，要给它分类，首先从数据集中，在X附近找离它最近的K个数据点，将它划分为归属于类别最多的一类

K-means

聚类算法
非监督学习
数据集是无Label，杂乱无章的数据
有明显的训练过程
K值含义- K是事先设定的数字，将数据集分为K个簇，需要依靠人的先验知识

8、SVM的核函数的作用是什么?解决的根本问题是什么?常见的核函数？

SVM核函数的主要作用是将低维空间中的样本映射到高维空间中，将原来不可分的两类点转换成线性可分的，因为svm本质上是将相似的样本划分到一类，同时在对偶问题的求解中会出现xi*xj的形式，这样引入核函数，将其中xi和xj的形式替换成 $\Phi$ （xi）的形式，这样学习是在特征空间上隐式的学习，而不用显式的定义特征空间和映射函数，其中正定核的条件内积大于等于0，从向量空间到内积空间再到希尔伯特空间。

避免了低维空间大量样本做内积的维数灾难，解决的根本问题是非线性不可分问题，SVM本身的思想是间隔最大化，寻找确定分隔边界使得所有间隔最大化。进一步引入对偶问题，对偶问题有拉格朗日函数更好求解，同时自然引入核函数，推广到非线性问题。

知乎专栏：https://zhuanlan.zhihu.com/p/93715996

把原问题转换为对偶问题？因为原问题是凸二次规划问题，转换为对偶问题更加高效。为什么求解对偶问题更加高效？因为只用求解alpha系数，而alpha系数只有支持向量才非0，其他全部为0.alpha系数有多少个？样本点的个数

在机器学习中常用的核函数，一般有这么几类，也就是LibSVM中自带的这几类：

一般用线性核和高斯核，也就是Linear核与RBF核
需要注意的是需要对数据归一化处理，很多使用者忘了这个小细节
然后一般情况下RBF效果是不会差于Linear，但是时间上RBF会耗费更多
下面是吴恩达的见解：

如果Feature的数量很大，跟样本数量差不多，这时候选用LR或者是Linear Kernel的SVM
如果Feature的数量比较小，样本数量一般，不算大也不算小，选用SVM+Gaussian Kernel
如果Feature的数量比较小，而样本数量很多，需要手工添加一些feature变成第一种情况

工作中，最常用的是Linear核与RBF核。

Linear核：主要用于线性可分的情形。参数少，速度快，对于一般数据，分类效果已经很理想了。
RBF核：主要用于线性不可分的情形。参数多，分类结果非常依赖于参数。有很多人是通过训练数据的交叉验证来寻找合适的参数，不过这个过程比较耗时。我个人的体会是：使用libsvm，默认参数，RBF核比Linear核效果稍差。通过进行大量参数的尝试，一般能找到比linear核更好的效果。

由泰勒公式展开，可以发现高斯核是一种特殊的多项式核函数，即n趋向于无穷时的解，因此高斯核是一种映射到无穷维的核函数，以保证VC维一定可以找到超平面把数据类别很好的分开。

SVM应用于多分类和回归问题

多分类可以采用一对一，一对多的方法，构建多个分类器，最后投票决定，libsvm中采用的是一对一法，在任意两个样本之间构建SVM分类器。

支持向量回归SVR，转化为回归问题，即在确定的fx两侧存在一定间隔带，落入间隔带的样本点不计较损失。

增加margin，我们人为定义在margin内部的点我们直接不计算在distance^2里面，仍可以利用松弛变量来减小margin的负面影响

SVM存在的问题

1、SVM算法对大规模训练样本难以实施，涉及到大量矩阵运算，引入SMO算法

2、解决多分类问题存在困难

9、为什么梯度的负方向是局部下降最快的方向?

10、sigmoid的反向传播,交叉熵反向传播

源网址：https://www.cnblogs.com/nowgood/p/sigmoidcrossentropy.html

反向传播算法：https://blog.csdn.net/u014313009/article/details/51039334

RNN网络BPTT更新：https://zybuluo.com/hanbingtao/note/541458

11、Attention原理

一般的attention机制在编码阶段对不同时刻的隐藏状态进行加权平均得到背景向量CT，在解码时要调整attention权重关注不同时刻的背景向量C，中间的背景向量ca是不断变化的，等于对每一个词的加权累加，权重系数的计算就是引入softmax函数它将解码器ht-1和编码器0到T时刻的所有状态作为输入来计算不同时刻a的值，本质可以模拟软件系统中的软寻址，哈希表通过构造函数来表征查询值与键值之间的相似性然后再乘以values进行加权求和

12、Embedding

词向量嵌入和word2vec：https://zhuanlan.zhihu.com/p/26306795

Enbedding最广泛的应用是在词嵌入向量领域，核心思想是将向量映射成低维空间上的稠密向量，k维空间的每一维都可以看成一个隐含的主题。

利用网络优化参数（低维表示且自学习参数），在词向量中对应乘以权值矩阵的时候，同时在深度学习模型中每个隐层对应着不同抽象层次的特征。

13、词向量嵌入和word2vec

链接：https://zhuanlan.zhihu.com/p/26306795

看看 Skip-gram 的网络结构了，x 就是上面提到的 one-hot encoder 形式的输入，y 是在这 V 个词上输出的概率，我们希望跟真实的 y 的 one-hot encoder 一样。

首先说明一点：隐层的激活函数其实是线性的，相当于没做任何处理（这也是 Word2vec 简化之前语言模型的独到之处），我们要训练这个神经网络，用反向传播算法，本质上是链式求导

当模型训练完后，最后得到的其实是神经网络的权重，比如现在输入一个 x 的 one-hot encoder: [1,0,0,…,0]，对应刚说的那个词语『吴彦祖』，则在输入层到隐含层的权重里，只有对应 1 这个位置的权重被激活，这些权重的个数，跟隐含层节点数是一致的，从而这些权重组成一个向量 vx 来表示x，而因为每个词语的 one-hot encoder 里面 1 的位置是不同的，所以，这个向量 vx 就可以用来唯一表示 x。

注意：上面这段话说的就是 Word2vec 的精髓！！

此外，我们刚说了，输出 y 也是用 V 个节点表示的，对应V个词语，所以其实，我们把输出节点置成 [1,0,0,…,0]，它也能表示『吴彦祖』这个单词，但是激活的是隐含层到输出层的权重，这些权重的个数，跟隐含层一样，也可以组成一个向量 vy，跟上面提到的 vx 维度一样，并且可以看做是词语『吴彦祖』的另一种词向量。而这两种词向量 vx 和 vy，正是 Mikolov 在论文里所提到的，『输入向量』和『输出向量』（对应输入层的embeding和输出层的embeding矩阵），一般我们用『输入向量』。

词向量的维度（与隐含层节点数一致）一般情况下要远远小于词语总数 V 的大小，所以 Word2vec 本质上是一种降维操作——把词语从 one-hot encoder 形式的表示降维到 Word2vec 形式的表示。

分层softmax函数：赫夫曼树，和树的深度有关，出现频率高的词更靠近根节点

负样本采样：在正确但粗以外进行负采样，随机生成【0，M-1】的int型

14、VC Dimension的公式意义与作用

模型的可学习型，只与数据量与模型复杂度有关----https://wizardforcel.gitbooks.io/ntu-hsuantienlin-ml/content/8.html

在这张图里，纵轴是错误率（1-精度），横轴是VC维，out-of-sample指的是测试集错误率，越小越好。in-sample-error指的是训练集错误率。

我们可以看出：

VC维跟模型复杂度是正相关的，以至于很多人误解VC维就是模型复杂度，当然这么理解好像也不会有什么不好的后果。
测试集的错误率一开始很高，随着VC维增大而减小，在dvc∗dvc∗ 达到最小值，然后开始增大。我们就称这个dvcdvc处为这个模型的VC维。
训练集的错误率一直在减小。

VC维的定义：

一个假设空间H的VC dimension，是这个H最多能够shatter掉的点的数量，记为dvc(H)。

假设空间可以看作模型的复杂度。
shatter翻译成打散，指的是不管数据的分布如何，H都要把它区分开。
“这个H最多能够shatter掉的点的数指的是无论数据的分布如何”，这句话翻译成人话是，不管数据是怎样分布的，H最多能区分多少个数据。我们可以想像，越是复杂的H能够区分的数据点就越多，VC维也就越大。

VC维的大小：与学习算法A无关，与输入变量X的分布也无关，与我们求解的目标函数f 无关。它只与模型和假设空间有关。

工业实践中通过引入正则对模型复杂度(VC维)进行控制，平衡这两个问题的矛盾。

VC Dimension就是某假设集H能够shatter的最多inputs的个数，即最大完全正确的分类能力。（注意，只要存在一种分布的inputs能够正确分类也满足）。

shatter的英文意思是“粉碎”，也就是说对于inputs的所有情况都能列举出来。例如对N个输入，如果能够将种情况都列出来，则称该N个输入能够被假设集H shatter。

根据之前break point的定义：假设集不能被shatter任何分布类型的inputs的最少个数。则VC Dimension等于break point的个数减一。

15、数据异常值的检测方法

首先从统计学意义上，观察均方差，3 $\delta$ 原则，落在3 $\delta$ 之外的应该是属于异常离群点；

箱型图，四分位数的上下两侧存在异常值予以剔除，计算第一第四分位数

密度聚类，DBSCAN，存在核心点和边界点，不属于任何团簇的点属于噪声点的范畴。

孤立森林，孤立数是孤立数据点所需的拆分数，异常值与非异常点相比具有更低的孤立数。因此，如果数据点的孤立数低于阈值，则将数据点定义为异常值。

##python直接可以调用
clf = IsolationForest(max_samples=100, random_state=42)

16、置信度与置信区间

置信区间是我们所计算出的变量存在的范围，置信水平就是我们对于这个数值存在于我们计算出的这个范围的可信程度。
举例来讲，有95%的把握，真正的数值在我们所计算的范围里。
在这里，95%是置信水平，而计算出的范围，就是置信区间。
如果置信度为95%，则抽取100个样本来估计总体的均值，由100个样本所构造的100个区间中，约有95个区间包含总体均值。

17、K-means的K的确定方法：

基于距离度量和在更新过程中用到梯度更新的模型都需要进行模型归一化和离群点处理等预处理操作。

其中合理选择K值的方法包括：

根据数据先验知识人为确定K值大小
基于变化拐点确定----手肘法+Gap Static统计优化函数
核函数高维映射，在新的特征空间进行聚类
基于距离度量：引入平均轮廓系数
基于层次聚类，迭代结束

常见的聚类方法有：k均值、K-means++、层次聚类、密度聚类、GMM（高斯混合）、SMO（自映射神经网络，保持拓扑结构不变）

18、PCA与LDA

PCA是一种线性、非监督、全局的降维方法，对应最大方差投影与最小回归误差。

最大化投影方差就是让数据在主轴上投影的方差最大，即找到一个投影方向，使得各变量在w的投影方差尽可能大。

而且投影存在内积形式，对应协方差矩阵的前n个特征值和特征向量。将n维样本映射到d维实现降维去噪。

PCA最小平方误差，其目标是求解一个线性函数使得对应直线能够更好地拟合样本集合。本质上和最大方差理论是一致的。

LDA是一种有监督的降维方法，最大化类间散度，最小化类内散度，但是存在一些强假设：要求类内数据服从高斯分布且各个类的协方差相等，主要但仍然可以压制噪声。

对应矩阵是最大的特征值，投影方向就是这个特征值对应的特征向量。类内散度矩阵，类间散度矩阵，全局散度矩阵。

19、SVM与LR的区别联系

Linear SVM和LR都是线性分类器,但LR可以给出对应类别的输出概率
从目标函数来看，区别在于逻辑回归采用的是logistical loss，svm采用的是hinge loss
Linear SVM不直接依赖数据分布，分类平面不受一类点影响；LR则受所有数据点的影响，如果数据不同类别strongly unbalance一般需要先对数据做balancing。线性SVM主要依赖于支持向量的作用
Linear SVM依赖数据表达的距离测度，所以需要对数据先做normalization归一化；LR其影响不大，只是为了在梯度更新的过程中防止陷入局部最优解而归一化。
Linear SVM依赖penalty的系数，实验中需要做validation，数据集规模Kernel SVM 在大规模数据集的情况下基本不实用，但是如果数据集本身比较小而且维度高的的话一般 SVM 表现更好。
Linear SVM和LR的performance都会收到outlier的影响，其敏感程度而言，SVM 的优点在于，通过忽略已经分类正确的点，最后训练出来的模型更加稳健，对 outlier 不敏感

20、LR model的推导过程：

LR Model 专场：https://www.jianshu.com/p/dce9f1af7bc9

逻辑回归本质上是线性回归，只是在特征到结果的映射中加入了一层逻辑函数g(z)，即先把特征线性求和，然后使用函数g(z)作为假设函数来预测。g(z)可以将连续值映射到0 和1。g(z)为sigmoid function.

则

sigmoid function 的导数如下：

逻辑回归用来分类0/1 问题，也就是预测结果属于0 或者1 的二值分类问题。这里假设了二值满足伯努利分布，也就是

其也可以写成如下的形式：

对于训练数据集，特征数据x={x1, x2, … , xm}和对应的分类标签y={y1, y2, … , ym}，假设m个样本是相互独立的，那么，极大似然函数为：

log似然为：

如何使其最大呢？与线性回归类似，我们使用梯度上升的方法（求最小使用梯度下降），那么

如果只用一个训练样例（x，y），采用随机梯度上升规则，那么随机梯度上升更新规则为：

损失函数：

LR加正则化项：

实际应用时，由于我们数据的维度可能非常高，L1正则化因为能产生稀疏解，使用的更为广泛一些。
LR model也可以加l2正则项，和svm类似，加l2正则项可以用核方便处理，方便解决不可分问题

LR解决线性不可分问题：

（1）利用特殊核函数，对特征进行变换：把低维空间转换到高维空间，而在低维空间不可分的数据，到高维空间中线性可分的几率会高一些。
（2）扩展LR算法，提出FM算法。

LR model 用于特征组合：

把特征离散化，然后做组合特征，可以实现一定程度的非线性

在LR中，我们可以通过在基本线性回归模型的基础上引入交叉项，来实现非线性分类，如下：

但是这种直接在交叉项xixj的前面加上交叉项系数wij的方式在稀疏数据的情况下存在一个很大的缺陷，即在对于观察样本中未出现交互的特征分量，不能对相应的参数进行估计。
即，在数据稀疏性普遍存在的实际应用场景中，二次项参数的训练是很困难的。其原因是，每个参数 wij的训练需要大量xi和 xj都非零的样本；由于样本数据本来就比较稀疏，满足xi 和 xj都非零”的样本将会非常少。训练样本的不足，很容易导致参数 wij 不准确，最终将严重影响模型的性能。

为什么LR可以用来做CTR预估

1. LR是线性模型，具有很好的可解释性，分布式计算迭代速度快。
2. LR可以很好的利用正则化解决稀疏性问题，尤其特征维数非常大，大到千亿级别。。
3. LR可以输出概率，天然适合Ranking.

4. 离散特征比较好，LR也可以做特征选择
逻辑回归与线性回归

都是一种广义线性模型（generalized linear model）。逻辑回归假设因变量 y 服从伯努利分布，而线性回归假设因变量 y 服从高斯分布。因此与线性回归有很多相同之处，去除Sigmoid映射函数的话，逻辑回归算法就是一个线性回归。可以说，逻辑回归是以线性回归为理论支持的，但是逻辑回归通过Sigmoid函数引入了非线性因素，因此可以轻松处理0/1分类问题

LR满足伯努利分布，而伯努利分布可以转化为指数分布，只要类条件概率满足指数分布的，其后验都可以写成sigmoid函数的形式

21、朴素贝叶斯思考：

朴素贝叶斯：https://zhuanlan.zhihu.com/p/107725697

避免陷入局部最优解：

1、学习率调整：重新把已经调整的很小的学习率数值放大，强行逼迫优化算法跳出此刻找到的鞍点或者极值点

2、以多组不同参数值初始化多个神经网络，按标准方法训练后，取其中误差最小的解作为最终参数，这相当于从多个不同的初始化点开始搜索，从而可能寻找全局最优。

3、使用模拟退化技术，模拟退火在每一步都以一定的概率接受比当前解更差的结果，从而有助于“跳出”局部极小。在每步迭代过程中，接受“次优解”的概率随着时间的推移而逐渐降低，从而保证算法的稳定。

22、时间序列预测：

https://zhuanlan.zhihu.com/p/50741970

1、视频数据的二八效应和长尾原则，利用优酷这些大平台电视剧的播放收益都交给制片方，但是像抖音快手这样的短视频app提供的优质内容都比较分散，但是最终的蚂蚁视频聚合起来，播放量就会特别大，包括蚂蚁金服，其实长尾原则更能体现平台的重要性和网站的相对优势地位。

如何处理：对数变化，box-cox变化，因为数据足够多的时候倾向于正态分布，因为本身公司的数据源是足够多的，但由中心极限定理可知是不用处理的。取对数是为了使数据尽量服从正态分布，其次是为了避免模型构建后出现异方差问题

2、趋势部分经过预处理（取对数和差分平稳的方法），再次通过ARIMA模型进行建模仿真，最后预测数据由趋势部分的建模结果累加周期部分。

ARIMA模型的思想就是从历史的数据中学习到随时间变化的模式，学到了就用这个规律去预测未来。

ARIMA(p,d,q)模型，其中 d 是差分的阶数，用来得到平稳序列：

AR：当前值只是过去值的加权求和。

MA：过去的白噪音的移动平均。

ARMA：AR和MA的综合。

23、熵和交叉熵

https://www.zhihu.com/people/ju-zhen-li-lun-he-ji-suan-fang-fa

香农提出了熵的定义：无损编码事件信息的最小平均编码长度。如果熵比较大(即平均编码长度较长)，意味着这一信息有较多的可能状态，相应的每个状态的可能性比较低；因此每当来了一个新的信息，我们很难对其作出准确预测，即有着比较大的混乱程度/不确定性/不可预测性。

上文中已知一个离散变量 i 的概率分布P(i)，熵的公式可以表示为：

在熵的公式中，对于离散变量和连续变量，我们都是计算了负的可能性的对数的期望，代表了该事件理论上的平均最小编码长度，所以熵的公式也可表示如下，公式中的x~P代表我们使用概率分布P来计算期望，熵又可以简写为H：

交叉熵利用观测到的假设分布去预估拟合真实分布，因此给出了观测和真实分布之间的差距

在二分类模型中，标签只有是和否两种；这时，可以使用二分类交叉熵作为损失函数。假设数据集中只有猫和狗的照片，则交叉熵公式中只包含两种可能性：

又因为：

所以交叉熵可以表示为：

使用如下定义：

二分类的交叉熵可以写作如下形式，看起来就熟悉多了。

24、GDBT比xgboost的优点在哪里？（反向思考）

xgboost引入L2正则化，在叶子结点的打分函数上会输出L2的平滑项。更多的一般是xgboost的优点，没有免费的午餐，没有一种模型是绝对意义上的优势，gbdt因为只利用一阶导数，而xgboost需要二阶展开，计算二阶海森矩阵的收敛过程，如果目标损失函数在一阶导对收敛的速度远远高于二阶导的情况下，那么在计算二阶导带来的增益远远不够支付额外计算海森矩阵带来的开销的话，可以选择一阶残差拟合网络GBDT。

同时一般的优势在于GBDT对于硬件的要求也会低一些，收敛和训练速度更快一些，不需要预排序和block的存储情况。

（二）XGBOOST正则项里包含了树的叶子节点个数、叶子节点权重的范式。正则项降低了模型的方差，使学习出来的模型更加简单，有助于防止过拟合

这个公式形式上跟ID3算法、CART算法是一致的，都是用分裂后的某种值减去分裂前的某种值，从而得到增益。为了限制树的生长，我们可以加入阈值，当增益大于阈值时才让节点分裂，上式中的gamma即阈值，它是正则项里叶子节点数T的系数，所以xgboost在优化目标函数的同时相当于做了预剪枝。另外，上式中还有一个系数lambda，是正则项里leaf score的L2模平方的系数，对leaf score做了平滑，也起到了防止过拟合的作用，这个是传统GBDT里不具备的特性。

GBDT还有一个缺点是不能利用mini_batch的方式进行训练，这样的话需要将所有数据进行全部加载，对内存的要求过高。

25、gbm与xgboost有哪些可以融合的点可以考虑？

LightGBM使用的是histogram算法，基本思想是先把连续的浮点特征值离散化成k个整数，同时构造一个宽度为k的直方图。在遍历数据的时候，根据离散化后的值作为索引在直方图中累积统计量，当遍历一次数据后，直方图累积了需要的统计量，然后根据直方图的离散值，遍历寻找最优的分割点；

优点在于决策树生长策略上：leaf-wise生长策略、histogram 做差加速、直接支持类别特征（一vs多）

特征并行的主要思想是在不同机器在不同的特征集合上分别寻找最优的分割点，然后在机器间同步最优的分割点。

数据并行则是让不同的机器先在本地构造直方图，然后进行全局的合并，最后在合并的直方图上面寻找最优分割点。

模型融合：Lightgbm在特征和数据尺度上都有并行的机制存在，同时有特征直方图的构建以及深度扩展和父节点做差策略的存在，可以保证树的快速分裂，但是在构建直方图的时候在特征尺度上会损失一定的精度，因此在前期特征量很大的时候可以选择gbm模型预测，而后对特征进行筛选后在后面模型中选择xgb进行贪心算法的分类。

同时对于跨模型的重复特征应用也是在stacking模型融合时可以改进的一个点。

26、CART回归树与缺点反思

CART是后剪枝，损失函数是带正则化的对数似然函数，后剪枝的a对应正则化过程，也有控制树的深度和过拟合的机制在的

分类树采用基尼指数，回归树采用均方差来计算，分类和回归任务不同，一个是离散值，一个是连续值

1）无论是ID3, C4.5还是CART,在做特征选择的时候都是选择最优的一个特征来做分类决策，但是大多数，分类决策不应该是由某一个特征决定的，而是应该由一组特征决定的。这样决策得到的决策树更加准确。这个决策树叫做多变量决策树(multi-variate decision tree)。在选择最优特征的时候，多变量决策树不是选择某一个最优特征，而是选择最优的一个特征线性组合来做决策。这个算法的代表是OC1，这里不多介绍。

2）如果样本发生一点点的改动，就会导致树结构的剧烈改变。这个可以通过集成学习里面的随机森林之类的方法解决。　

泛化能力强也是选择决策树作为基分类器的一个重要原因。

你可能感兴趣的:(机器学习)

支持向量机SVM 李昊哲小课 sklearn 人工智能机器学习支持向量机算法机器学习 sklearn 人工智能数据挖掘
支持向量机SVM一、支持向量机算法支持向量机（SupportVectorMachine，SVM）是一种用于分类和回归分析的机器学习算法。分类场景举例（更容易理解）假设现在有一个二维平面上散落着一些点，这些点分为两类，一类是红色的圆形点，另一类是蓝色的方形点。我们的任务就是找到一条直线，能够把这两类点尽可能准确地分开。支持向量机算法做的事情就和这个类似。算法核心思想它不是随便找一条能分开两类数据的直
高斯混合模型（GMM）中的协方差矩阵类型与聚类形状关系详解码字的字节机器学习机器学习人工智能高斯混合模型 GMM
高斯混合模型（GMM）简介高斯混合模型（GaussianMixtureModel,GMM）是概率统计与机器学习交叉领域的重要模型，其核心思想是通过多个高斯分布的线性组合来描述复杂数据分布。与单一高斯分布不同，GMM能够捕捉数据中的多模态特性，这使得它在处理真实世界非均匀分布数据时展现出独特优势。从数学形式上看，一个包含K个分量的GMM可表示为：其中(\pi_k)是第k个高斯分量的混合系数（满足(\
机器学习初学者理论初解 Mikhail_G 机器学习人工智能
大家好!为什么手机相册能自动识别人脸？为什么购物网站总能推荐你喜欢的商品？这些“智能”背后，都藏着一位隐形高手——机器学习（MachineLearning）。一、什么是机器学习？简单说，机器学习是教计算机从数据中自己找规律的技术。就像教孩子认猫：不是直接告诉他“猫有尖耳朵和胡须”，而是给他看100张猫狗照片，让他自己总结出猫的特征。传统程序vs机器学习传统程序：输入规则+数据→输出结果（例：按“温
Embedding与向量数据库玖月初玖大模型应用开发基础人工智能 embedding 数据库
1.Embedding是什么EmbeddingModel是一种机器学习模型，它的核心任务是将离散的、高维的符号（如单词、句子、图片、用户、商品等）转换成连续的、低维的向量（称为“嵌入”或“向量表示”），并且这个向量能有效地捕捉原始符号的语义、关系或特征。1.1通俗理解EmbeddingModel是让计算机“理解”世界的核心工具，把“文字、图片、音频”等信息变成一串有意义的数字我们称之为“向量”。类
2023年第10期(NeuroImage)：DomainATM：多中心医学图像数据标准化工具箱影浮科技ImageFlow
基本信息1.标题：DomainATM:Domainadaptationtoolboxformedicaldataanalysis.2.期刊：NeuroImage3.IF/JCR/分区：7.4/Q1/中科院一区4.DOI：10.1016/j.neuroimage.2023.119863目录1、导读2、背景动机3、研究目的4、工具箱介绍5、测试试验6、局限不足1导读域适应（DA）是基于机器学习的现代医
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
迁移学习：知识复用的智能迁移引擎 | 从理论到实践的跨域赋能范式大千AI助手人工智能 Python #OTHER 迁移学习人工智能机器学习算法神经网络大模型迁移
让AI像人类一样“举一反三”的通用学习框架本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与基本概念迁移学习（TransferLearning）是一种机器学习范式，其核心思想是：将源领域（SourceDomain）学到的知识迁移到目标领域（TargetDomain），以提升目标任务的性能
AI原生应用中的用户画像构建：从理论到实践全解析
AI原生应用中的用户画像构建：从理论到实践全解析关键词：用户画像、AI原生应用、特征工程、机器学习、个性化推荐、数据隐私、模型优化摘要：本文全面解析AI原生应用中用户画像构建的全过程，从基础概念到核心技术，再到实际应用和未来趋势。我们将用通俗易懂的方式讲解用户画像如何像"数字身份证"一样工作，深入探讨特征提取、模型构建等关键技术，并通过实际案例展示用户画像在推荐系统、精准营销等场景中的应用。文章还
Python爬虫【四十五章】爬虫攻防战：异步并发+AI反爬识别的技术解密程序员_CLUB Python入门到进阶 python 爬虫人工智能
目录引言：当爬虫工程师遇上AI反爬官一、异步并发基础设施层1.1混合调度框架设计1.2智能连接池管理二、机器学习反爬识别层2.1特征工程体系2.2轻量级在线推理三、智能决策系统3.1动态策略引擎3.2实时对抗案例四、性能优化实战4.1全链路压测数据4.2典型故障处理案例五、总结：构建智能化的爬虫生态系统Python爬虫相关文章（推荐）引言：当爬虫工程师遇上AI反爬官在大数据采集领域，我们正经历着技
万字长文，解读大模型技术原理（非常详细）零基础入门到精通，收藏这一篇就够了
大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的发展历程出发，对大模型领域的各个技术细节进行详细解读，供大家在了解大模型基本知识的过程中起到一定参考作用。一、大模型的定义大语言模型作为一个被验证可行的方向，其“大”体现在训练数据集广，模型参数和层数大，计算量大，其价值体现在通用性上，并且有更好的泛化能力。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设
TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
从零开始构建AI原生应用的认知架构 AI原生应用开发 AI-native 架构 ai
从零开始构建AI原生应用的认知架构关键词：AI原生应用、认知架构、机器学习、知识图谱、神经网络、智能决策、系统设计摘要：本文深入探讨如何从零开始构建AI原生应用的认知架构。我们将从基本概念出发，逐步解析认知架构的核心组件，包括知识表示、推理机制和学习能力等。通过生动的比喻和实际代码示例，帮助读者理解如何设计一个能够模拟人类认知过程的AI系统。文章还将介绍当前最先进的认知架构模型，并展望未来发展趋势
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
吴恩达机器学习cs229-学习笔记-更新中是娜个二叉树！机器学习学习笔记
吴恩达机器学习cs22901基础概念语言：Matlab/python监督学习定义：获取一组数据集拟合数据从X到Y的映射回归问题：预测的Y是连续的，Y是实数分类问题：分类指的是Y取离散值，输出是离散的两组，正示例和负示例，把所有样本推到这条直线上，用0，1，标识逻辑回归算法，拟合直线区分正，负示例处理相对大量特征的回归算法或者分类算法支持向量机算法：它使用的不是1,2,3,10个输入特征，而是使用无
「日拱一码」033 机器学习——严格划分胖达不服输「日拱一码」机器学习人工智能严格划分组划分
目录简单随机划分（train_test_split）分组划分（GroupSplitting）简单分组划分(GroupSplitting)分层分组划分(StratifiedGroupSplitting)交叉验证法（Cross-Validation）分组K折交叉验证（GroupKFold）留一组法（LeaveOneGroupOut）简单随机划分（train_test_split）简单随机分组通过随机分
从零开始：搭建你的人工智能开发环境人工智能教程人工智能 YOLO 机器学习 transformer 线性回归动态规划排序算法
前言在人工智能和机器学习的旅程中，一个稳定且高效的开发环境是成功的关键第一步。无论是初学者还是经验丰富的开发者，一个配置良好的开发环境都能大大提高工作效率，减少遇到的问题。本文将从零开始，逐步指导你如何搭建一个完整的人工智能开发环境，包括操作系统选择、Python安装、常用库的配置以及开发工具的选择。一、选择合适的操作系统（一）主流操作系统介绍在搭建人工智能开发环境时，首先需要选择一个合适的操作系
基于机器学习的加密货币资金费率预测与套利策略云梦量化科技 python
一、资金费率机制解析永续合约的资金费率是加密货币衍生品市场独有的机制，旨在使永续合约价格锚定现货价格。资金费率每8小时结算一次，结算时多空双方互相支付资金费用：费率为正时，多头支付给空头；费率为负时，空头支付给多头。此机制既促使永续合约价格回归现货价格，也反映市场多空情绪。某安永续合约资金费率计算公式通常为：资金费率 F = 平均溢价指数 P + Clamp(综合利率 I − 溢价指数 P, +0
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
一个例子带你入门机器学习
目录1.为建模选择数据2.选择预测目标3.选择“特征”4.构建您的模型（这篇文章将使用经典墨尔本房价数据集作为例子，引导机器学习的流程，数据集为melb_data.csv，请在csdn的下载区自行下载，运行代码时需要将数据集下载在同个目录下）1.为建模选择数据数据集有太多的变量，多到难以理解，甚至无法很好地打印出来。如何将这海量的数据削减为能够理解的内容？我们将首先凭借直觉选择几个变量。后续将介绍
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
通俗易懂：什么是决策树？淦暴尼算法 python 决策树算法机器学习
1.引言：决策树就像“选择题”你是否曾经在生活中做过“选择题”？比如：今天要不要带伞？晚饭吃什么？该不该买那件心仪已久的商品？其实，我们的大脑经常会像“决策树”一样，通过一连串问题和判断，逐步缩小选择范围，最终做出决定。**决策树（DecisionTree）**就是这样一种模拟人类决策过程的机器学习模型。它通过“提问-分支-决策”的方式，把复杂问题拆解成一系列简单的判断，广泛应用于分类（如判断邮件
java毕业设计-基于Javaweb的家常小菜烹饪学习管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿刘 vue spring boot 毕业设计 java 课程设计学习
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费开题报告、任务书、全bao定制+
java毕业设计源码案例-基于ssm+协同过滤的个性化小说推荐系统设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 项目帮 springboot java 计算机毕设 java 课程设计开发语言
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
机器学习中的数据预处理：从入门到实践耐思nice～机器学习由浅入深-吴恩达机器学习人工智能
在当今的智能时代，机器学习已经渗透到我们生活的方方面面。比如我们常用的推荐系统，它能根据我们的浏览记录精准推送喜欢的商品或视频，这背后就离不开机器学习的支撑。而一个优秀的机器学习模型，离不开高质量的数据，数据预处理正是保证数据质量的关键环节，它就像烹饪前的食材处理，直接影响着最终“菜品”的口感，也就是模型的性能。今天，我们就来全面学习机器学习中数据预处理的关键步骤。一、数据预处理的重要性数据预处理
计算机专业大数据毕业设计-基于 Spark 的音乐数据分析项目(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿八哥数据可视化计算机毕设 spark 大数据课程设计 spark
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1