平原2018

面试算法简述

文章目录

一、机器学习

生成模式和判别模式的区别：
感知机：
K-means：
k近邻：
朴素贝叶斯：
极大似然估计：
逻辑回归(LR)：
L1和L2的区别
FP(FP-growth)关联算法
支持向量机(SVM)：
决策树：
bagging
随机森林：
boosting
梯度提升和梯度下降的区别：
GBDT
XGBoost：
GBDT和XGBoost区别（百面机器学习）：
降维
LDA(隐含狄利克雷分布)：
EM算法：
动态规划
图模型发展史：
隐马尔可夫模型(HMM)：
条件随机场(CRF)：
LSTM+CRF
HMM和CRF的区别
HMM 、 MEMM和CRF之间的区别

二、深度学习

Batch Normalization(BN)：
标准化和归一化的区别：
Dropout：
cnn做文本分类：
残差网络（Residual Network，ResNet）：

梯度消失和梯度爆炸产生的原因：

循环神经网络(RNN)：
LSTM（长短期记忆模型）：
Seq2Seq（序列到序列模型）：
fine-tuning(微调)：
神经网络为什么需要隐藏层？
为什么使用交叉熵作为损失函数？
为什么使用batch_size?
为什么要使用embedding嵌入层？
梯度下降方法
梯度下降优化算法

三、自然语言处理(NLP)

word2vec：
FastTEXT:
负采样：
BERT：

四、聊天机器人：
五、知识图谱

知识图谱构建流程：

一、机器学习

从预测值的类型上看，连续变量预测的定量输出称为回归；离散变量预测的定性输出称为分类

生成模式和判别模式的区别：

生成模式： 由数据学得联合概率分布，求出条件概率分布P(Y|X)的预测模型；
常见的生成模型有：朴素贝叶斯、隐马尔可夫模型、高斯混合模型、文档主题生成模型（LDA）、限制玻尔兹曼机
判别模式： 由数据学得决策函数或条件概率分布作为预测模型
常见的判别模型有：K近邻、SVM、决策树、感知机、线性判别分析（LDA）、线性回归、传统的神经网络、逻辑斯蒂回归(LR)、boosting、条件随机场(CRF)

感知机：

是二分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别
具体方法：感知机对应于输入空间（特征空间）中将实例划分为正负两类的分离超平面，输入判别模型。
优化方法：随机梯度下降

K-means：

是一种典型的无监督学习算法，主要用于将相似的样本自动归到一个类别中。
kmeans的计算方法如下：

1 随机选取k个中心点
2 遍历所有数据，将每个数据划分到最近的中心点中
3 计算每个聚类的平均值，并作为新的中心点
4 重复2-3，直到这k个中线点不再变化（收敛了），或执行了足够多的迭代

K值选取： 在实际应用中，由于Kmean一般作为数据预处理，或者用于辅助分类贴标签。所以k一般不会设置很大。可以通过枚举，令k从2到一个固定值如10，在每个k值上重复运行数次kmeans(避免局部最优解)，并计算当前k的平均轮廓系数，最后选取轮廓系数最大的值对应的k作为最终的集群数目

k近邻：

K近邻法实际上利用训练集对特征向量空间进行划分，并作为其分类模型（分类回归）
三个基本要素： K值的选择（交叉验证），距离度量（欧氏距离），分类决策函数（多数表决）
实现方法： kd树
具体方法： 给定一个训练集，对新的输入实例，在训练数据集中找到与该实例最邻近的k个实例，这k个实例的多数属于某个类，就把该输入实例分为这个类。

朴素贝叶斯：

通过已知样本求得先验概率P(Y)和条件概率P(X|Y),对于给定的实例，计算联合概率，进而求出后验概率。
也就是说，它尝试去找到底这个数据是怎么生成的（产生的），然后再进行分类。哪个类别最有可能产生这个信号，就属于那个类别。
基于贝叶斯定理与特征条件独立假设分类方法（多分类）
生成方法： 由训练数据集学习联合概率分布P(X,Y),然后求得后验概率分布P(Y|X)
具体方法： 利用训练数据学习P(X|Y)和P(Y)的估计，得到联合概率分布 P(X,Y) = P(Y)P(X|Y)

极大似然估计：

就是利用已知的样本结果信息，反推最具有可能（最大概率）导致这些样本结果出现的模型参数值
最大似然估计的核心思想是： 找到参数θ的一个估计值，使得当前样本出现的可能性最大，俗话说是“谁大像谁”。
求最大释然估计值的步骤：

1.写似然函数
2.一般对似然函数取对数，并将对数似然函数整理
3.对数似然函数求导，令导数为0，求得似然方程
4.根据似然方程求解，得到的参数即为所求估计值

逻辑回归(LR)：

逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法，运用梯度下降来求解参数，来达到将数据二分类的目的。
http://www.cnblogs.com/ModifyRong/p/7739955.html
https://zhuanlan.zhihu.com/p/44591359
是由输入的线性函数表示的输出的对数几率模型
学习策略： 极大似然估计或正则化极大似然估计
学习算法： 梯度下降，拟牛顿法

逻辑回归为什么要用sigmoid？：
逻辑回归模型之所以是sigmoid 的形式，源于我们假设y服从伯努利分布，伯努利分布又属于指数分布族，经过推导，将伯努利分布变成指数分布族的形式后。我们发现伯努利分布的唯一参数Φ与指数分布族中的参数η具有sigmoid函数关系，于是我们转而求η与x的关系，此时，我们又假设η与x具有线性关系。至此，找到了我们要用的模型的样子，也就是逻辑回归。链接：https://www.jianshu.com/p/a8d6b40da0cf

L1和L2的区别

https://blog.csdn.net/jinping_shi/article/details/52433975
L1正则化是指权值向量w ww中各个元素的绝对值之和，通常表示为∣∣w∣∣
L2正则化是指权值向量w ww中各个元素的平方和然后再求平方根（可以看到Ridge回归的L2正则化项有平方符号），通常表示为∣∣w∣∣2
为什么L1正则化可以产生稀疏模型（L1是怎么让系数等于零的），以及为什么L2正则化可以防止过拟合？

FP(FP-growth)关联算法

将数据存储在一种称为FP树的紧凑数据结构中。FP代表频繁模式（Frequent Pattern）。一棵FP树看上去与计算机科学中的其他树结构类似，但是它通过链接（link）来连接相似元素，被连起来的元素项可以看成一个链表。
支持度： 指某频繁项集在整个数据集中的比例。假设数据集有 10 条记录，包含{‘鸡蛋’, ‘面包’}的有 5 条记录，那么{‘鸡蛋’, ‘面包’}的支持度就是 5/10 = 0.5。
置信度： 是针对某个关联规则定义的。有关联规则如{‘鸡蛋’, ‘面包’} -> {‘牛奶’}，它的置信度计算公式为{‘鸡蛋’, ‘面包’, ‘牛奶’}的支持度/{‘鸡蛋’, ‘面包’}的支持度。假设{‘鸡蛋’, ‘面包’, ‘牛奶’}的支持度为 0.45，{‘鸡蛋’, ‘面包’}的支持度为 0.5，则{‘鸡蛋’, ‘面包’} -> {‘牛奶’}的置信度为 0.45 / 0.5 = 0.9。
停止条件：支持度或者置信度小于某个阈值

支持向量机(SVM)：

定义在特征空间上的间隔最大的线性分类器
历史模型：线性可分支持向量机，线性支持向量机，非线性支持向量机
常用核函数： 多项式核函数，高斯核函数，字符串核函数
损失函数： 合页损失
推导：https://blog.csdn.net/sinat_30353259/article/details/80991273
目标函数：

决策树：

描述对实例进行分类的树形结构。（分类回归）
组成： 决策树由结点和有向边组成，结点有两种类型，内部结点和叶结点。内部结点表示一个特征或属性，叶结点表示一个类。
具体方法： 学习时，利用训练数据，根据损失函数最小化的原则建立决策树模型
步骤：特征选择，决策树的生成，决策树的修剪
算法实现：
ID3：选择信息增益最大的作为特征，不能剪枝，容易过拟合
C4.5：选择信息增益比最大的作为特征（因为信息增益偏向于选择取值较多的特征）
CART：回归模型（利用平方误差最小选取切分变量和切分点）
分类模型（选择基尼指数最小作为特征）
剪枝： 预剪枝和后剪枝

bagging

有放回采样，各基分类器无强依赖，可以并行训练，各个个体都进行单独学习，最终投票
bagging能够提高弱分类器性能的原因是降低了方差
算法实现： 随机森林，基于决策树基分类器（随机样本，随机特征）

随机森林：

顾名思义，是用随机的方式建立一个森林，森林里面有很多的决策树组成，随机森林的每一棵决策树之间是没有关联的。
随机森林的生成方法：

1.从样本集中通过重采样的方式随机选择n个样本
2.假设样本中的特征数量为a，再从这些特征中，随机选择k个特征，用建立决策树的方式选择最佳分割点，构建决策树树
3.重复m次，产生m棵决策树
4.多数投票机制来进行预测

boosting

训练基分类器时采用串行方式，各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加，每一层在训练的时候，对前一层基分类器分错的样本，给予更高的权重。测试时，根据各层分类器的加权得到最终结果。
boosting能够提升弱分类器性能的原因是降低了偏差
算法实现： adaboost
具体做法：

1.针对训练集修改权值，提高被前一轮弱分类器错误分类样本的权值，而降低那些被正确分类样本的权值。
2.弱分类器的组合，采取加权多数表决的方法。针对弱分类器修改权值，加大分类误差率小的弱分类器的权值，使其在表决中起较大作用，减小分类误差率大的弱分类器的权值，使其在表决中起较小作用

Gradient Boosting： 根据当前模型损失函数的负梯度信息来训练新加入的弱分类器，然后将训练好的弱分类器以累加的形式结合到现有模型中。
Gradient boosted 是一类boosting的技术，不同于Adaboost加大误分样本权重的策略，它每次迭代加的是上一轮梯度更新值：

梯度提升和梯度下降的区别：

相同点： 每一轮迭代中，都利用损失函数相对于模型的负梯度方向的信息来对当前模型进行更新
梯度提升： 模型并不需要进行参数化表示，而直接定义在函数空间中，大大扩展使用模型的种类
梯度下降： 模型是以参数化表示，从而模型的更新等价于参数的更新。

GBDT

首先gbdt 是通过采用加法模型（即基函数的线性组合），以及不断减小训练过程产生的残差来达到将数据分类或者回归的算法。针对一般损失函数优化困难问题，利用损失函数的负梯度在当前模型的值作为残差的近似值进行求解。
采用决策树作为弱分类器的Gradient Boosting算法被称为GBDT
损失函数：残差
https://blog.csdn.net/tinkle181129/article/details/79681702

XGBoost：

采用最大化这个差值作为准则来进行决策树的构建，通过遍历所有特征的取值，寻找使得损失函数前后相差最大时对应的分裂方式。是GBDT的工程实现
https://blog.csdn.net/v_july_v/article/details/81410574
核心思想：

1、不断地添加树，不断地进行特征分裂来生长一棵树，每次添加一个树，其实是学习一个新函数，去拟合上次预测的残差。
2、当我们训练完成得到k棵树，我们要预测一个样本的分数，其实就是根据这个样本的特征，在每棵树中会落到对应的一个叶子节点，每个叶子节点就对应一个分数
3、最后只需要将每棵树对应的分数加起来就是该样本的预测值。

在决策树构建节点加入正则项
https://blog.csdn.net/qq_28031525/article/details/70207918

GBDT和XGBoost区别（百面机器学习）：

1、GBDT是机器学习算法，XGBoost是该算法的工程实现
2、在使用CART作为基分类器时，XGBoost显式的加入正则项来控制模型的复杂度，有利于防止过拟合，从而提高模型的泛化能力
3、GBDT在模型训练时只使用了代价函数的一阶导数信息，XGBoost对代价函数进行二阶泰勒展开，可以同时使用一阶和二阶导数
4、传统的GBDT采用CART作为基分类器，XGBoost支持多种类型的基分类器，比如线性分类器
5、传统的GBDT在每轮迭代时使用全部的数据，XGBoost则采用了与随机森林相似的策略，支持对数据进行采样
6、传统的GBDT没有设计对缺失值进行处理，XGBoost能够自动学习出缺失值得处理策略

降维

PCA： 目的是找到数据中的主成分，利用这些主成分表征原始数据，从而达到降维的目的
最大方差理论，pca的目标是最大化投影方差，让数据在主轴上投影的方差最大（找到一个投影方向，使其方差最大）
步骤：

1、对样本数据进行中心化处理
2、求样本协方差
3、对协方差矩阵进行特征值分解，将特征值从大到小排列
4、取特征值前d大对应的特征向量w1,w2,…wd,通过以下映射将n维样本映射到d维

LDA(线性判别分析)： 为了分类服务，找到一个投影方向w，使得投影后的样本尽可能按照原始类别分开
**思想：**最大化类间距离，最小化类内距离（对数据做了很强的假设）

LDA(隐含狄利克雷分布)：

是一种主题模型，，它可以将文档集中每篇文档的主题以概率分布的形式给出，从而通过分析一些文档抽取出它们的主题（分布）出来后，便可以根据主题（分布）进行主题聚类或文本分类。同时，它是一种典型的词袋模型，即一篇文档是由一组词构成，词与词之间没有先后顺序的关系。
LDA生成文档的过程中，先从dirichlet先验中“随机”抽取出主题分布，然后从主题分布中“随机”抽取出主题，最后从确定后的主题对应的词分布中“随机”抽取出词。
生成过程： 假定语料库中共有M篇文章，每篇文章下的Topic的主题分布是一个从参数为α的Dirichlet先验分布中采样得到的Multinomial(多项式)分布，每个Topic下的词分布是一个从参数为β的Dirichlet先验分布中采样得到的Multinomial分布。
对于某篇文章中的第n个词，首先从该文章中出现的每个主题的Multinomial分布（主题分布）中选择或采样一个主题，然后再在这个主题对应的词的Multinomial分布（词分布）中选择或采样一个词。不断重复这个随机生成过程，直到M篇文章全部生成完成。

EM算法：

最大化目标函数时，先固定一个变量是整体函数变为凸优化函数，求导得到最值，然后利用最优参数更新被固定的变量，进入下一个循环。要设置停止条件，比如参数值的差少于某阈值
根据极大似然估计算出模型的参数，根据估计模型得出最大概率值，再次估计模型参数这样循环迭代
**损失函数：**对数损失函数
**学习策略：**极大似然估计

动态规划

将复杂的问题分解成一系列相对简单的子问题，只解决一次子问题并存储它的解决方案（solution），下一次遇到同样的子问题时无需重新计算它的解决方案，而是简单地查找先前计算的解决方案，从而节省计算时间。动态规划适用于有最优子结构（Optimal Substructure）和重叠子问题（Overlapping Subproblems）性质的问题。

图模型发展史：

https://www.zhihu.com/question/35866596/answer/236886066

隐马尔可夫模型(HMM)：

关于时序的概率模型，描述一个隐藏的马尔可夫链随机生成不可观测的状态随机序列，再由各个状态生成一个观测而产生观测随机序列的过程（生成模型：由隐藏的马尔科夫链生成观测序列的过程）
公式： λ=(A,B,π) λ:隐马尔可夫模型，π：初始状态概率向量，A：状态概率转移矩阵，B：观测概率矩阵

概率计算问题： 已知模型的所有参数，计算观测序列Y出现的概率。可使用前向和后向算法求解
预测问题： 已知模型所有参数和观测序列Y，计算最大最可能的隐状态序列X。动态规划-维特比算法
应用：序列标注
学习问题： 已知观测序列Y，求解使得该观测序列概率最大的模型参数，包括隐状态序列、隐状之间的转移概率分布以及从隐状态到观测状态的概率分布。Baum-Welch算法（EM算法在HMM实现过程）

条件随机场(CRF)：

给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型，特点是假设输出随机变量构成马尔可夫随机场。
https://www.cnblogs.com/shixiangwan/p/8983274.html

LSTM+CRF

CRF是全局范围内统计归一化的条件状态转移概率矩阵，再预测出一条指定的sample的每个token的label；LSTM（RNNs，不区分here）是依靠神经网络的超强非线性拟合能力，在训练时将samples通过复杂到让你窒息的高阶高纬度异度空间的非线性变换，学习出一个模型，然后再预测出一条指定的sample的每个token的label。
那就把CRF接到LSTM上面，把LSTM在timestep上把每一个hiddenstate的tensor输入给CRF，让LSTM负责在CRF的特征限定下，依照新的loss function，学习出一套新的非线性变换空间。

HMM和CRF的区别

1.HMM是生成模型，CRF是判别模型
2.HMM是概率有向图，CRF是概率无向图
3.HMM求解过程可能是局部最优，CRF可以全局最优
4.CRF概率归一化较合理，HMM则会导致label bias 问题

HMM 、 MEMM和CRF之间的区别

HMM -> MEMM(最大熵马尔可夫模型MEMM)： HMM模型中存在两个假设：一是输出观察值之间严格独立，二是状态的转移过程中当前状态只与前一状态有关。但实际上序列标注问题不仅和单个词相关，而且和观察序列的长度，单词的上下文，等等相关。MEMM解决了HMM输出独立性假设的问题。因为HMM只限定在了观测与状态之间的依赖，而MEMM引入自定义特征函数，不仅可以表达观测之间的依赖，还可表示当前观测与前后多个状态之间的复杂依赖。
MEMM -> CRF: CRF不仅解决了HMM输出独立性假设的问题，还解决了MEMM的标注偏置问题，MEMM容易陷入局部最优是因为只在局部做归一化，而CRF统计了全局概率，在做归一化时考虑了数据在全局的分布，而不是仅仅在局部归一化，这样就解决了MEMM中的标记偏置的问题。使得序列标注的解码变得最优解。
HMM、MEMM属于有向图，所以考虑了x与y的影响，但没讲x当做整体考虑进去（这点问题应该只有HMM）。CRF属于无向图，没有这种依赖性，克服此问题。

最大熵的思想： 当你要猜一个概率分布时，如果你对这个分布一无所知，那就猜熵最大的均匀分布，如果你对这个分布知道一些情况，那么，就猜满足这些情况的熵最大的分布。

交叉熵损失函数：

交叉熵的单个样本损失函数也可以简化：

softmax损失函数：

二、深度学习

神经网络训练过程的本质是学习数据分布。

Batch Normalization(BN)：

批量归一化是针对每一批数据，在网络的每一层输入之前增加归一化处理（均值为0，标准差为1），将所有批量数据强制在统一的数据分布下，

标准化和归一化的区别：

标准化（normalization）： 将数据按比例缩放，使之落入一个小的特定区间
归一化： 将数据统一映射到[0,1]区间上。
归一化方法： 线性函数归一化，零均值归一化（映射到均值为0，标准差为1的分布上）
好处： 1、提升模型的收敛速度；2、提升模型的精度

Dropout：

以一定概率随机“临时丢弃神经元节点，相当于每次迭代都在训练不同结构的神经网络
对于任意神经元，每次训练中都与一组随机挑选的不同的神经元集合共同进行优化，这个过程会减弱全体神经元之间的联合适应性，减少过拟合的风险，增强泛化能力

cnn做文本分类：

第一层为输入层，是一个NxK的矩阵，N是文章总单词总数，K是每个词对应训练好的K维词向量。
第二层为卷积层，卷积核为hxK
第三层为池化层，采用最大池化，平均池化等。
第四层为全连接层，softmax激活函数

残差网络（Residual Network，ResNet）：

跳层，最终模型为H(X)=F(x)+x,学习F(x)=H(x)-x残差
目的： 解决或缓解深层的神经网络训练中的梯度消失问题
残差网络(RestNet)： 残差连接是让前面某层的输出作为后面某层的输入，从而在序列网络中有效地创造了一条捷径
残差连接解决了困扰所有大规模深度学习模型的两个共性问题：梯度消失和表示瓶颈

梯度消失和梯度爆炸产生的原因：

卷积神经网络： 误差在传播的过程中，涉及到非常多的参数和导数的连乘，这时误差很容易产生消失或膨胀，影响对该层参数的学习
解决方法：

1、设计特殊的网络结构，使用残差网络
2、Dropout
3、利用正则化
4、改进训练算法

**梯度消失解决方法：**Relu激活函数

循环神经网络(RNN)：

循环神经网络梯度是连乘形式的，组成一个nxn维雅可比矩阵，由于预测误差是沿着神经网络的每一层反向传播，因此当雅可比矩阵的最大特征值大于1时，随着离输出越来越远，每层的梯度大小会呈指数增长，，导致梯度爆炸；反之，若雅可比矩阵的最大特征值小于1，梯度的大小会呈指数缩小，产生梯度消失（《百面机器学习p239 》）
解决方法：

1、梯度爆炸问题可以通过梯度裁剪，当梯度的范式大于某个给定值时，对梯度进行等比收缩。
2、梯度消失问题，需要对模型本身改进，例如：LSTM

目的： 用来建模序列化数据，通过神经元串行起来处理序列化数据。由于每个神经元能用它的内部变量保存之前输入的序列信息，因此整个序列被浓缩成抽象表示，并可以据此进行分类或生成新的序列

LSTM（长短期记忆模型）：

long short term memory，即我们所称呼的LSTM，是为了解决长期依赖问题而专门设计出来的，可以对价值的信息进行长期记忆，从而减少循环神经网络的学习难度
**结构：**输入门，遗忘门，输出门，记忆单元

输入门：控制当前计算的新状态以多大程度更新到记忆单元
遗忘门：控制前一步记忆单元中的信息有多大程度被遗忘掉
输出门：控制当前的输出有多大程度上取决于当前的记忆单元
激活函数：门都是用sigmoid，记忆单元使用Tanh，饱和激活函数，输入达到一定值的情况下，输出没有明显变化。而不用Relu，是因为Relu是非饱和激活函数，很难实现门控

Seq2Seq（序列到序列模型）：

通过深度神经网络将一个作为输入的序列映射为一个作为输出的序列，这一过程由编码输入与编码输出两个环节构成。编码器和解码器可以用RNN或LSTM。在seq2seq模型中，两个循环神经网络是共同训练的。
对比理解： 就像复习考试问题，将学到的历史归纳总结成知识体系这是编码过程；考试时，将高度抽象的知识应用到系列问题便是解码过程。
解码部分： 基础算法是贪心法，改进之后用集束搜索。
RNN和LSTM存在的问题：

1、时间片 t的计算依赖t-1时刻的计算结果，这样限制了模型的并行能力；
2、顺序计算的过程中信息会丢失，尽管LSTM等门机制的结构一定程度上缓解了长期依赖的问题，但是对于特别长期的依赖现象,LSTM依旧无能为力。

fine-tuning(微调)：

给一个预训练模型，基于此模型进行微调
优点： 不用从头计算，省去大量计算资源和计算时间，提高了计算效率，甚至准确率
场景： 数据集相似，自己构建的正确率太低，数据集数量太少，计算资源太少

**注意力机制（attention）：**是一种思想
强化学习： 由环境、机器人、状态、动作、奖励组成。

动作：所有可能做出的动作的集合
状态：所有状态的集合
奖励：机器人可能收到的奖励，一般一个实数
算法实现：Q-Learning、策略梯度、演员评判家算法

IDCNN(膨胀卷积)： dilated的好处是不做pooling损失信息的情况下，加大了感受野，让每个卷积输出都包含较大范围的信息

神经网络为什么需要隐藏层？

反向传播
每层隐藏层在做的事就是将数据变成另一种格式/模式/ feature representation

为什么使用交叉熵作为损失函数？

https://blog.csdn.net/liweibin1994/article/details/79510237
https://juejin.im/post/5b40a5156fb9a04faf478a45
https://juejin.im/post/5b28bd26f265da59bb0cc8f6
交叉熵公式：

对权重w求导得

为什么使用batch_size?

Batch 的选择，首先决定的是下降的方向。一是解决内存加载问题，而是找到更好的极值点
https://www.zhihu.com/question/32673260/answer/71137399

为什么要使用embedding嵌入层？

嵌入层embedding 的可以通过索引对该句子进行编码得到向量，在训练神经网络的过程中，每个嵌入向量都会得到更新，就会发现原来的词与词，通过向量高维的映射得到相似性。
https://spaces.ac.cn/archives/4122
word2vec也有嵌入层
https://blog.csdn.net/u010412858/article/details/77848878

梯度下降方法

https://blog.csdn.net/google19890102/article/details/69942970
批梯度下降： 在执行每次更新时，在整个数据集上计算所有的梯度
特点：批梯度下降法的速度会很慢，同时，批梯度下降法无法处理超出内存容量限制的数据集。
随机梯度下降： 根据每一条训练样本x(i)和标签y(i)更新参数
特点：通常SGD的运行速度更快，同时，可以用于在线学习。SGD以高方差频繁地更新，导致目标函数出现如图1所示的剧烈波动。
小批量梯度下降： 在每次更新时使用n个小批量训练样本
特点：

1、减少参数更新的方差，这样可以得到更加稳定的收敛结果；
2、可以利用最新的深度学习库中高度优化的矩阵优化方法，高效地求解每个小批量数据的梯度。

梯度下降优化算法

动量法(momentum)： 是一种帮助SGD在相关方向上加速并抑制摇摆的一种方法。
特点：从本质上说，动量法，就像我们从山上推下一个球，球在滚下来的过程中累积动量，变得越来越快
Nesterov加速梯度下降法(Nesterov accelerated gradient，NAG)： 是一种能够给动量项这样的预知能力的方法。
特点：这个具有预见性的更新防止我们前进得太快，同时增强了算法的响应能力，这一点在很多的任务中对于RNN的性能提升有着重要的意义。
Adagrad： 是这样的一种基于梯度的优化算法：让学习率适应参数，对于出现次数较少的特征，我们对其采用更大的学习率，对于出现次数较多的特征，我们对其采用较小的学习率。
特点：Adagrad非常适合处理稀疏数据。
Adadelta： 是Adagrad的一种扩展算法，以处理Adagrad学习速率单调递减的问题。不是计算所有的梯度平方，Adadelta将计算计算历史梯度的窗口大小限制为一个固定值w。
RMSprop： 将学习率分解成一个平方梯度的指数衰减的平均。
自适应矩估计Adaptive Moment Estimation，Adam)： 是另一种自适应学习率的算法，Adam对每一个参数都计算自适应的学习率。除了像Adadelta和RMSprop一样存储一个指数衰减的历史平方梯度的平均vt，Adam同时还保存一个历史梯度的指数衰减均值mt，类似于动量

三、自然语言处理(NLP)

word2vec：

目前有两种训练模型（CBOW和Skip-gram），两种加速算法（Negative Sample与Hierarchical Softmax）
https://www.zhihu.com/question/44832436
CBOW流程：

1、输入层：上下文单词的onehot. {假设单词向量空间dim为V，上下文单词个数为C}
2、隐藏层：所有onehot分别乘以共享的输入权重矩阵W. {VN矩阵，N为自己设定的数，初始化权重矩阵W}，所得的向量 {因为是onehot所以为向量} 相加求平均作为隐层向量, size为1N.
3、乘以输出权重矩阵W’ {N*V}，(W‘也为初始化，是为了保证最终得到的向量跟单词向量的维度一致）
4、得到向量 {1*V} 激活函数处理得到V-dim概率分布 {PS: 因为是onehot嘛，其中的每一维斗代表着一个单词}，概率最大的index所指示的单词为预测出的中间词（target word）
5、与true label的onehot做比较，误差越小越好
6、假设我们此时得到的概率分布已经达到了设定的迭代次数，那么现在我们训练出来的look up table应该为矩阵W。即，任何一个单词的one-hot表示乘以这个矩阵都将得到自己的word embedding。

架构： skip-gram（慢、对罕见字有利）vs CBOW（快）
训练算法： 分层softmax（对罕见字有利）vs 负采样（对常见词和低纬向量有利）
欠采样频繁词： 可以提高结果的准确性和速度（适用范围1e-3到1e-5）
文本（window）大小： skip-gram通常在10附近，CBOW通常在5附近

word2vev怎么避免维度灾难？
设词典中词语数量为V,隐藏节点数为N,当V远远小于N时，完成word2vec对词向量的降维。
http://kyonhuang.top/Word2vec-intro/

FastTEXT:

之前用fastText做过短文本分类，效果异常的好，f1值达到0.995，所以特地学习了一下。fastText 的结构其实和 CBOW 模型差不多，只不过前者的输入除了词的embedding，还有一些n-gram特征。其原理很简单，就是对这些输入的向量取平均，线性激活后，全连接到输出层，再用 softmax 归一化每个类别的概率。一开始很难相信这么简单的结构能取得如此好的分类效果，而且速度还超级快。
经过分析和参考了一些资料，我认为分类效果好的原因有这么几个：

1、除了词的embedding，还使用了word n-gram特征，这使得句子中的词序信息能被捕捉到；
2、词向量本身就蕴含了这么一种规律：两个词的向量距离越近，含义越相似。因此，在对输入的向量取平均时，就是意味着将输入文档的词向量累加起来并归一化，这可以将一个文档映射成空间中的一个向量，所以用这个向量来区分不同的文档是合理的。当用了softmax后，就相当于对输出空间划定了一些决策边界，用来进行分类；
3、输入文本较短，所以效果好；要是长文本，效果会变差。因为长文本本身包含了太多的信息，词向量经过平均后，失去了区分度（可通过大数定律或样本均值的方差来理解）。

出现问题：如果使用fasttext结果出现NaN，安装pip install fasttext-win，原先的删除

负采样：

对于给定的词w,如何生成它的负采样集合NEG(w)呢？已知一个词w,它的上下文是context(w),那么词w就是一个正例，其他词就是一个负例。
如何选择negative words： 一个单词被选作negative sample的概率跟它出现的频次有关，出现频次越高的单词越容易被选作negative words。
注意： 在论文中，作者指出指出对于小规模数据集，选择5-20个negative words会比较好，对于大规模数据集可以仅选择2-5个negative words。.

BERT：

BERT模型实际上是一个语言编码器，把输入的句子或者段落转换为特征向量。
两大亮点：

1、双向的transformer，利用masked模型实现双向
2、提出两种预训练方法，masked模型和下一个句子预测方法

训练流程：

1、输入表示：可以对单个句子或一对文本句子，输入嵌入为token embedding，segmentation embedding，position embedding的求和
2、masked语言模型：如cbow预测当前单词，不过只取了15%的样本（每个batchsize只有15%的词被遮盖的原因，是性能开销。双向编码器比单项编码器训练要慢）
3、预测下一个句子：预训练一个二分类的模型，来学习句子之间的关系。预测下一个句子的方法对学习句子之间关系很有帮助。
训练方法： 正样本和负样本比例是1：1，50%的句子是正样本，随机选择50%的句子作为负样本。
4、预训练阶段参数
5、微调：微调阶段根据不同任务使用不同网络模型。
https://zhuanlan.zhihu.com/p/46997268

自然语言理解(NLU)：
以语言学为基础，融合逻辑学、心理学和计算机科学等学科，试图解决以下问题：语言究竟是怎样组织起来传输信息的？人又是怎样从一连串的语言符号中获取信息的？换种表达就是，通过语法、语义、语用的分析，获取自然语言的语义表示。
方法：基于规则理解，基于机器学习理解，基于深度学习理解
多轮对话：

TensorTlow：
Variable和get_Variable区别：
使用tf.Variable时，如果检测到命名冲突，系统会自己处理。使用tf.get_variable()时，系统不会处理冲突，而会报错
实质区别：
由于tf.Variable() 每次都在创建新对象，所有reuse=True 和它并没有什么关系。对于get_variable()，来说，如果已经创建的变量对象，就把那个对象返回，如果没有创建变量对象的话，就创建一个新的。

四、聊天机器人：

rasa框架搭建聊天机器人
https://github.com/howl-anderson/WeatherBot

User Interface： 负责提供用户 UI ，方便用户使用，Rasa Core 支持和多种即时通讯软件（IM）的整合，Rasa Core 提供了一种称之为 Channel 的特性来方便接入 API。
Diaglog Manager:负责管理整个对话的流程，它会主动调用NLU 来解析用户的意图和提取相关的实体，在需要执行业务动作的时候会调用Action Server执行具体的业务动作。
NLU:负责理解用户的意图和提取相关的实体。
Action Server:负责执行自定义 Action (通常都是具体的业务动作，在本项目中是请求远程服务器以查询天气情况)。

五、知识图谱

知识图谱构建流程：

一、构建知识图结构
	1、读取文件，获得实体，实体之间的关系
	2、创建节点，为每个标签（实体），都创建图节点（用neo4j图数据库）
	3、创建节点属性，即每个实体的通用属性
	4、执行创建实体图的操作
	5、执行创建实体和实体之间的关系边
二、抽取问题意图
	1、数据处理，把原来实体库放到列表中
	2、为每个实体都构造一个ctree
	3、把输入的问题，分别用实体tree去匹配，匹配失败，用相似度计算找相近词
	4、列常出问问题的关键词集合
	5、预测意图（用朴素贝叶斯，TF-IDF进行意图预测）
	6、构建问题的可能组合规则，用预测的意图结合匹配到的tree搜索答案，并返回结果

你可能感兴趣的:(算法)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
高性能javascript--算法和流程控制海淀萌狗
-for,while和do-while性能相当-避免使用for-in循环，==除非遍历一个属性量未知的对象==es5:for-in遍历的对象便不局限于数组，还可以遍历对象。原因：for-in每次迭代操作会同时搜索实例或者原型属性，for-in循环的每次迭代都会产生更多开销，因此要比其他循环类型慢，一般速度为其他类型循环的1/7。因此，除非明确需要迭代一个属性数量未知的对象，否则应避免使用for-i
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
JVM源码分析之堆外内存完全解读 HeapDump性能社区
概述广义的堆外内存说到堆外内存，那大家肯定想到堆内内存，这也是我们大家接触最多的，我们在jvm参数里通常设置-Xmx来指定我们的堆的最大值，不过这还不是我们理解的Java堆，-Xmx的值是新生代和老生代的和的最大值，我们在jvm参数里通常还会加一个参数-XX:MaxPermSize来指定持久代的最大值，那么我们认识的Java堆的最大值其实是-Xmx和-XX:MaxPermSize的总和，在分代算法
《算法》四学习——1.1节进阶的Farmer 算法算法笔记
前言买了一本算法4，每天看一点，对每个小结来个学习总结，输出驱动输入。本篇笔记针对第一章基础1.1基础编程模型1.1节总结了相关的语法、语言特性和书中将会用到的库。笔记自己在编码中容易遗漏的点&&优先级比||高在开发中习惯了加括号，所以没注意到这点，教材上也有但是忘记了二分查找中计算mid=left+(right-left)/2这样计算可以有效避免(left+right)/2溢出答疑java无穷大
排序路小白同学
1.冒泡排序冒泡算法是一种基础的排序算法，这种算法会重复的比较数组中相邻的两个元素。如果一个元素比另一个元素大（小），那么就交换这两个元素的位置。重复这一比较直至最后一个元素。这一比较会重复n-1趟，每一趟比较n-j次，j是已经排序好的元素个数。每一趟比较都能找出未排序元素中最大或者最小的那个数字。这就如同水泡从水底逐个飘到水面一样。冒泡排序是一种时间复杂度较高，效率较低的排序方法。其空间复杂度是
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod