YuiGao

机器学习和深度学习以及NLP面试题

1.分类评价标准，准确率、精确率、召回率、F1

精确率P = TP/(TP+FP)也叫查准率

召回率R = TP/(TP+FN)也叫查全率

F1 = 2*P*R/(P+R)

我们希望精确率和召回率都很高，但实际上是矛盾的，上述两个指标是矛盾体，无法做到双高。因此，选择合适的阈值点，就需要根据实际问题需求，比如我们想要很高的精确率，就要牺牲掉一些召回率。想要得到很高的召回率，就要牺牲掉一些精准率。但通常情况下，我们可以根据他们之间的平衡点，定义一个新的指标：F1分数(F1-Score)。F1分数同时考虑精确率和召回率，让两者同时达到最高，取得平衡。（一）准确率是指分类正确的样本占总样本个数的比例，但是存在明显的缺陷，当不同类别的样本比例非常不均衡时，占比大的类别往往成为影响准确率的最主要因素，可以使用更为有效的平均准确率（每个类别下的样本准确率的算术平均）作为模型评估的指标。（二）精确率是指在所有预测为正的样本中，确实为正的比例，召回率是指本身为正的样本中，被预测为正的比例。精确率和召回率既是矛盾又统一的两个指标，为了评估一个模型的好坏，不仅要看不同模型的精确率和召回率，而且最好绘制出模型的P-R曲线，除此之外,F1 score和ROC曲线也能综合的反映一个排序模型的性能，F1 score是精确率和召回率的调和平均值，定义为F1 = (2*P*R)/(P+R)，此外还有F2和F0.5分数，F1分数认为召回率和精确率同等重要，F2分数认为召回率的重要程度是精确率的2倍，而F0.5分数认为召回率的重要程度是精确率的一半，计算公式：

真正率(TPR)和假正率(FPR)

真正率(TPR) = TP/(TP+FN)

假正率(FPR) = FP/(FP+TN)

TPR和FPR分别基于实际表现1、0出发的，也就是说在实际的正样本和负样本中来观察相关概率问题，因此无论样本是否均衡，都不会被影响，能避免样本不平衡的问题，这就是为什么用TPR和FPR作为ROC、AUC指标的原因。

ROC横坐标为假正率(FPR),纵坐标为真正率(TPR)，FPR=FP/N，TPR=TP/P，P代表真实的正样本的数量，N是真实的负样本的数量，TP是P个正样本中被分类器预测为正样本的个数，FP是N个负样本中被分类器预测为正样本的个数。AUC指的是ROC曲线下的面积大小，该值能够量化的反映基于ROC曲线衡量出的模型性能，ROC曲线能在样本不均匀的测试集中保持形状基本不变，而P-R曲线会发生明显的变化，ROC曲线则能够更加稳定的反映模型本身的好坏。

AUC就是从所有正样本中随机选取一个样本，从所有负样本中随机选取一个样本，然后根据你的分类器对两个随机样本进行预测，把正样本预测为正的概率为P1，把负样本预测为正的概率为P0，P1>P0的概率就等于AUC，所以AUC反应的是分类器对样本的排序能力。AUC表示ROC曲线下的面积，用于判断模型的优劣，比如连接对角线的面积刚好是0.5，对角线的含义也就是随机判断预测结果，正负样本覆盖应该都是50%，另外ROC曲线越陡越好，所以理想值是1，即正方形，所以AUC的值一般是0.5和1之间的

多分类评价指标：

sklearn包中计算precision_score的命令是sklearn.metrics.precision_score(y_true,y_pred,labels=None,pos_label=1,average='binary',sample_weight=None)，其中average参数定义了该指标的计算方法，二分类时average参数默认是binary，多分类时，有可选参数micro，macro，weighted，还可以采用混淆矩阵来看分类结果

（1）micro

micro算法是指把所有的类放在一起算，具体到precision，就是把所有类的TP加和，再除以所有类的TP和TN的加和，因此micro方法下的precision和recall都等于accuracy

（2）macro

macro方法就是先分别求出每个类的precision再算术平均

（3）weighted

weighted算法就是在macro算法的基础上进行改良，不再是取算术平均，乘以固定的weight了，而是乘以该类在总样本数中的占比，计算出每类的precision后再乘以各自的占比，最后加和

2.L1和L2正则化

L1正则化可以产生稀疏权值矩阵，即产生一个稀疏模型，可以用于特征选择，L1范数：向量中各个元素绝对值之和，稀疏性，说白了就是模型的很多参数是0。这相当于对模型进行了一次特征选择，只留下一些比较重要的特征，提高模型的泛化能力，降低过拟合的可能。在实际应用中，机器学习模型的输入动辄几百上千万维，稀疏性就显得更加重要。

L2正则化可以防止过拟合，L2范数：向量中各个元素平方和的开二次方根

降低过拟合程度：正则化之所以能降低过拟合的原因在于，正则化是结构风险最小化的一种策略实现，给Loss function加上正则化项，能使得新得到的优化目标函数h=f+normal需要在f和normal中做一个权衡，如果还像原来只优化的情况下，那可能得到一组比较复杂，使得正则项normal比较大，那么h就不是最优的，因此可以看出加正则项能让解更加简单，通过降低模型复杂度，得到更小的泛化误差，降低过拟合程度

L1正则化和L2正则化：L1正则化就是在Loss function后加正则项为L1范数，加上L1范数容易得到稀疏解(0比较多)，L2正则化就是在loss function后面加正则化为L2范数的平方，加上L2正则相比于L1来说，得到的解比较平滑，但是同样能够保证解中接近于0(但不是等于0，所以相对平滑)的维度比较多，降低模型复杂度。因为把参数加到了损失函数里，可以在梯度下降时让参数变得更小，防止模型能够拟合特别复杂的函数。

L1和L2的异同点

相同点：都用于避免过拟合

不同点：L1可以让一部分特征的系数缩小到0，从而间接实现特征选择。所以L1适用于特征之间有关联的情况。

L2让所有特征的系数都缩小，但是不会减为0，它会使优化求解稳定快速。所以L2适用于特征之间没有关联的情况

右图是L1正则项约束后的解空间（假设二维空间，简单理解为w1+w2=C），左图就是L2正则项约束后的解空间（简单理解为w1^2+w2^2=R）。彩色的等高线就是凸优化问题中目标函数的等高线，显然多边形的解空间更容易与等高线在交角处（顶点）碰撞出稀疏解（稀疏可以理解为，并非所有维度的参数均有值，部分参数为0，为0的话就可以理解为该维度的特征没有起到作用），而圆形的解空间，则很难在边角处碰撞，故不易产生稀疏解，更倾向于平滑的解。因此，几何角度的理解，比较直观易懂，在二维的情况下，黄色部分是L2和L1正则化约束后的解空间，绿色的等高线是凸优化问题中目标函数的等高线，见下图。由图可知，L2正则化约束后的解空间是圆形，而L1正则化约束的解空间是多边形。显然，多边形的解空间更容易在尖角处与等高线碰撞出稀疏解。

3.梯度消失与梯度爆炸的原因和解决方案

影响因素主要是权值和激活函数的偏导数，对一个参数求梯度，一般表达式是权值和激活函数的偏导数的乘积，当一层的权值和激活函数偏导数的乘积小于1，链式相乘反向传播网络层数越多以后，梯度就会越来越小接近为0造成梯度消失，当乘积大于1，梯度就会越来越大造成梯度爆炸

σ为sigmoid函数

梯度消失和梯度爆炸问题都是因为网络太深，网络权值更新不稳定造成的，本质上是因为梯度反向传播中的连乘效应。对于更普遍的梯度消失问题，可以考虑一下三种方案解决：

（1）用ReLU、Leaky-ReLU、P-ReLU、R-ReLU、Maxout等替代sigmoid函数。

（2）用Batch Normalization或者Layer Normalization

BN是对同一batch内的数据的同一纬度做归一化，因此有多少维度就有多少个均值和方差；而LN则是对单个样本的所有维度来做归一化，因此一个batch中就有batch_size 个均值和方差。

（3）残差网络

（4）LSTM的结构设计也可以改善RNN中的梯度消失问题。

4.训练数据不足会带来什么问题？如何缓解数据量不足带来的问题

回答：训练数据不足带来的问题主要表现在过拟合方面，处理方法大致分为两类，（一）是基于模型的方法，主要是采用降低过拟合的措施，包括简化模型（如将非线性模型简化为线性模型）、添加约束项以缩小假设空间（如L1/L2正则项）、集成学习、Dropout超参数等；（二）是基于数据的方法，主要通过数据扩充，即根据一些先验知识，在保持特定信息的前提下，对原始数据进行适当变换以达到扩充数据集的效果。通用的数据扩充方法有SMOTE算法、上采样技术、生成式对抗网络模型生成新样本

5.比较Bagging和Boosting的异同

二者都是集成学习算法，都是将多个弱学习器组合成强学习器的方法。

（1）Bagging：对数据进行自助采样法，从原始数据集中每一轮有放回地抽取训练集，对结果进行简单投票法，从原始数据集中每一轮有放回地抽取训练集，训练得到k个弱学习器，将这k个弱学习器以投票的方式得到最终的分类结果。

随机森林是Bagging的一个扩展变体，随机森林在以决策树为基学习器构建Bagging集成的基础上，进一步在决策树的训练过程中映入了随机属性选择。具体来说，传统的决策树在选择划分属性时在当前节点选择一个最优属性；而在随机森林中对基决策树的每个节点，先从该节点的属性集合中随机选择一个包含k个属性的子集，然后再从这个子集中选择一个最优属性用于划分。在很多例子中表现功能强大，进一步使泛化性能提升，被称为 ‘代表集成学习技术水平的方法’。随机森林在Bagging的基础上做了修改

从样本集中用Bootstrap采样选出n个样本；

从所有属性中随机选择k个属性，选择最佳分割属性作为节点建立CART决策树；

重复以上两个步骤m次，即建立了m棵CART决策树

这m棵CART决策树形成随机森林，通过投票表决结果，决定数据属于哪一类

（2）Boosting：每一轮根据上一轮的分类结果动态调整每个样本在分类器中的权重，训练得到k个弱分类器，他们都有各自的权重，通过加权组合的方式得到最终的分类结果。

GBDT回归和XGBoost

7.集成学习算法

集成学习 (ensemble learning)通过构建并结合多个学习器来完成学习任务。先产生一组"个体学习器" (individual learner)，再用某种策略将它们结合起来。集成算法包括很多种包括Bagging，随机森林，Boosting 以及其他更加高效的集成算法。

集成学习主要分为两类：

平均方法：例如随机森林， Bagging methods。在平均方法中，系统分别去建立多个基分类器，分类器之间没有任何联系。然后在分类或者回归阶段，各个分类器根据测试数据给出自己的答案，然后系统根据各个分类器给出的结果去综合出最后的结果，比如可以使投票的形式。

提升方法：例如梯度提升决策树GBDT，AdaBoost。在提升方法中，系统模型在训练过程中会先后建立一系列分类器，这些分类器单个可能是弱分类器，但是组合起来就成为一个强分类器。

平均方法通常比其任何一个基分类器效果好因为尝试去降低模型的方差，而提升方法尝试去降低模型的偏差。

方差和偏差的来源

我们机器学习的模型，必不可少地对数据非常依赖。然而，如果你不知道数据服从一个什么样的分布，或者你没有办法拿到所有可能的数据（肯定拿不到所有的），那么我们训练出来的模型和真实模型之间，就会存在不一致。这种不一致表现在两个方面。

真实模型根本就没有包含在我们训练模型的模型空间中。比如本来是非线性模型，你非要拿线性模型去拟合数据，那么不论你怎么调整模型参数去选择模型，结果也是不对的。这就是偏差的来源。表现为模型不正确。

不管真实模型在不在我们训练模型的空间中，由于我们不能拿到所有可能的数据，如果拿到的数据不是那么具有代表性，那么不同的数据训练出来的模型参数就会不同。然后用这个模型去做预测，结果也就会和真实值之间有差异。这就是方差的来源。表现为模型不稳定。

避免偏差的话，首先我们需要尽量选择正确的模型, 避免方差的话需要慎重选择数据集的大小, 我们还要正确选择模型的复杂度

平均的方法采用多个分类器集体表决，就算其中一个分类器偏差较大，整体不会受其影响，偏差较小；然后，集体表决意味着模型泛化能力比较强，其分类能力相对于其中的每一个单一分类器是稳定的，所以相当于降低了方差。

提升的方法通过构造一系列的弱分类器对相同的训练数据集的重要性区别对待达到对训练数据的精确拟合，因此是降低了偏差。

8.文本分类有哪些方法

机器学习：朴素贝叶斯，支持向量机，K近邻，决策树

深度学习：CNN，RNN，FastText，LDA，LSTM

FastText模型输入一个词的序列(一段文本或者一句话)，输出这个词序列属于不同类别的概率

序列中的词和词组组成特征向量(加和)，特征向量通过线性变换映射到中间层，中间层再映射到标签

FastText在预测标签时使用了非线性激活函数，但在中间层不使用非线性激活函数

FastText模型架构和word2vec中的cbow模型很类似，不同之处在于，FastText预测标签，而cbow模型预测中间词

FastText方法不同与word2vec方法，引入了两类特征并进行embedding。其中n-gram颗粒度是词与词之间，n-char是单个词之间。两类特征的存储均通过计算hash值的方法实现。

n-gram示例: who am I? n-gram设置为2
n-gram特征有，who, who am, am, am I, I
n-char示例: where, n=3, 设置起止符<, >
n-char特征有，
FastText词向量和word2vec对比：

FastText = word2vec中cbow + h-softmax的灵活使用

模型的输出层：word2vec的输出层，对应的是每一个term，计算某term的概率最大；而FastText 的输出层对应的是分类的label。不过不管输出层对应的是什么内容，起对应的vector都不会被保留和使用；

模型的输入层：word2vec的输入层，是 context window 内的term；而fasttext 对应的整个sentence的内容，包括term，也包括 n-gram的内容；两者本质的不同，体现在 h-softmax的使用。 Word2vec的目的是得到词向量，该词向量最终是在输入层得到，输出层对应的 h-softmax 也会生成一系列的向量，但最终都被抛弃，不会使用。FastText 则充分利用了h-softmax的分类功能，遍历分类树的所有叶节点，找到概率最大的label（一个或者N个）。

9.均方根误差的"意外"

回答：模型在95%的样本中预测误差都小于%1，说明大部分预测的结果都是非常优秀的，然而，RMSE却一直很差，这很可能是由于在其他的5%样本中存在非常严重的离群点，解决方案：（一）如果认为这些离群点是”噪声点“的话，就需要在数据预处理的阶段把这些噪声点过滤掉。（二）如果不认为这些离群点是”噪声点“的话，就需要进一步提高模型的预测能力，将离群点产生的机制建模进去。（三）可以找一个更合适的指标来评估该模型，比如平均绝对百分比误差(MAPE)，相比RMSE，MAPE相当于把每个点的误差进行了归一化，降低了个别离群点带来的绝对误差的影响

11.余弦相似度

回答：余弦相似度就是两个向量夹角的余弦，余弦距离就是1-余弦相似度范围是【0，2】，欧式距离体现数值上的绝对差异，而余弦距离体现方向上的相对差异

12.模型评估的方法

回答：（一）Holdout将原始的样本集随机分成训练集和验证集两部分，缺点是验证集计算出来的最后评估指标与原始分组有很大关系。（二）k-fold(k折交叉验证)首先将全部样本划分为k个大小相等的样本子集，依次遍历这k个子集，每次把当前子集作为验证集，其余所有子集作为训练集，进行模型的训练和评估，最后把k次评估指标的平均值作为最终的评估指标。（三）自助法，基于自助采样法的检验方法，对于总数为m的样本集合，进行n次有放回的随机抽样，得到大小为m的训练集，n次采样过程中，有的样本会被重复采样，有的样本没有被抽出过，将这些没有被抽出的样本作为验证集，进行模型验证，问题：在自助法采样过程中，对n个样本进行n次自助抽样，当n趋于无穷大时，最终有多少数据从未被选择？回答：36.8%

13.说出几种降低过拟合和欠拟合的方法

回答：降低过拟合风险的方法：（一）增加训练数据，可以采取扩充训练数据的方法，比如生成式对抗网络来合成大量的新训练数据。（二）降低模型复杂度，在数据较少时，模型过于复杂是产生过拟合的主要原因，适当降低模型复杂度可以避免模型拟合过多的采样噪声。（三）正则化方法，给模型的参数加上一定的正则约束，比如将权值的大小加入到损失函数中，这样在优化原来的目标函数时候，也能避免权值过大带来的过拟合风险。（四）集成学习方法，集成学习方法是把多个模型集成在一起，来降低单一模型的过拟合风险，如Bagging方法

回答：降低欠拟合风险的方法：（一）添加新特征，当特征不足或者现有特征与样本标签相关性不强时，模型容易出现欠拟合，可以通过挖掘“上下文特征”，“ID类特征”，“组合特征”等新的特征。（二）增加模型的复杂度。（三）减小正则化系数，正则化用来防止过拟合的，但是当模型出现欠拟合现象时，则需要有针对性的减小正则化系数

14.三种决策树方法的差异

回答：（一）ID3(最大信息增益)采样信息增益作为评价指标，会倾向于取值较多的特征，信息增益反映的是给定条件以后不确定性减少的程度，从样本类型的角度，ID3只能处理离散型变量，而其他两种方法都可以处理连续型变量。ID3和ID4.5只能用于分类任务，而CART还可以应用于回归任务（二）ID4.5(最大信息增益比)ID3对样本特征缺失值比较敏感，而C4.5和CART可以对缺失值进行不同方式的处理（三）CART(最大基尼指数)ID3和C4.5通过剪枝来权衡树的准确性与泛化能力，而CART直接利用全部数据发现所有可能的树结构进行对比

15.如何对决策树进行剪枝

回答：（一）预剪枝即在生成决策树的过程中提前停止树的增长。中心思想是在树中结点进行扩展之前，先计算当前的划分是否能带来模型泛化能力的提升，如果不能，则不再继续生长子树，此时可能存在不同类别的样本同时存于结点中，按照多数投票的原则判断该结点所属类别，预剪枝对于如何停止决策树的生长有以下几种方法（1）当树到底一定深度的时候，停止树的生长（2）当到达当前结点的样本数量小于某个阈值的时候，停止树的生长（3）计算每次分裂对测试集的准确度提升，当小于某个阈值的时候，不再继续扩展。预剪枝具有思想直接，算法简单，效率高等特点，适合解决大规模问题，缺点是很难判断何时停止，而且具有欠拟合的风险。（二）后剪枝是在已生成的过拟合完全生长的决策树进行剪枝，得到简化版的剪枝决策树。核心思想是让算法生成一颗完全生长的决策树，然后从最底层上计算是否剪枝，剪枝过程将子树删除，用一个叶子结点替代，该结点的类别同样按照多数投票的原则进行判断，同样的后剪枝也可以通过在测试集上的准确率进行判断，如果剪枝过后准确率有所提升，则进行剪枝，相比于预剪枝，后剪枝方法通常可以得到泛化能力更强的决策树，但是时间消耗会更大。

16.对于具有类别标签的数据，应当如何设计目标函数使得降维的过程中不损失类别信息？在这种目标下，应当如何进行求解？

LDA和PCA都可以进行数据降维，LDA更善于对有类别信息的数据进行降维处理，但是它对数据的分布做了一些很强的假设，比如每个类别都是高斯分布、各个类的协方差相等

17.LDA降维算法流程

LDA是一种监督学习的降维技术，也就是说它的数据集的每个样本是有类别输出的。这点和PCA不同。PCA是不考虑样本类别输出的无监督降维技术。LDA的思想可以用一句话概括，就是“投影后类内方差最小，类间方差最大”。什么意思呢？我们要将数据在低维度上进行投影，投影后希望每一种类别数据的投影点尽可能的接近，而不同类别的数据的类别中心之间的距离尽可能的大。

（1）计算类内散度矩阵Sw

（2）计算内间散度矩阵Sb

（3）计算矩阵Sw点积Sb

后面步骤和PCA类似

18.LDA和PCA降维

相同点：

（1）两者均可以对数据进行降维

（2）两者在降维时均使用了矩阵特征分解的思想

（3）两者都假设数据符合高斯分布

不同点：

（1）LDA是有监督的降维方法，而PCA是无监督的降维方法

（2）LDA降维最多降到类别数k-1的维数，而PCA没有这个限制

（3）LDA除了可以用于降维，还可以用于分类

（4）LDA选择分类性能最好的投影方向，而PCA选择样本点投影具有最大方差的方向

LDA优点：

（1）在降维过程中可以使用类别的先验知识经验，而像PCA这样的无监督学习则无法使用类别先验知识

（2）LDA在样本分类信息依赖均值而不是方差的时候，比PCA之类的算法较优

LDA缺点：

（1）LDA不适合对非高斯分布样本进行降维，PCA也有这个问题

（2）LDA降维最多降到类别数k-1的维数，如果我们降维的维度大于k-1，则不能使用LDA

（3）LDA在样本分类信息依赖方差而不是均值的时候，降维效果不好

（4）LDA可能过度拟合数据

19.SVM

支持向量机（support vector machines, SVM）是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机；SVM还包括核技巧，这使它成为实质上的非线性分类器。SVM的的学习策略就是间隔最大化，可形式化为一个求解凸二次规划的问题，也等价于正则化的合页损失函数的最小化问题。SVM的的学习算法就是求解凸二次规划的最优化算法。对于线性可分的数据集来说，这样的超平面有无穷多个（即感知机），但是几何间隔最大的分离超平面却是唯一的。

你可能感兴趣的:(机器学习和深度学习以及NLP面试题)

两夫妻就可以做，一年轻松收入60万，农村干最适合！氧惠帮朋友一起省
随着农村经济的不断发展，越来越多的农民开始选择自主创业。其中，小型睡衣加工厂就是非常受欢迎的一种创业方式。这种加工厂投资小、见效快，非常适合农村夫妻创业。本文将以一个真实案例为背景，详细介绍小型睡衣加工厂的经营模式、市场前景以及盈利方式，帮助读者更好地了解这一创业项目。一、小型睡衣加工厂的经营模式1.投资规模小型睡衣加工厂的投资规模相对较小，一般只需要几万元人民币就可以启动。主要投资项目包括厂房租
情感主播培训有哪些项目，说说我的经历糖葫芦不甜
作为一名从情感主播培训中走出来的“新人”，我想分享一些我所经历的培训项目以及这段经历如何塑造了我。5星公会，免费加入，一对一指导扶持↓微信在文章底部。培训的第一步，是从理论根基开始。我们系统地学习了情感解析的技巧，包括如何识别不同情绪背后的深层需求、理解人际关系的动态变化等。作为主播，声音是我们最直接的“武器”。培训中，我们接受了专业的声音训练，包括发音技巧、语调控制、情感融入等，旨在通过声音传递
如何理解DT将是未来IT的转型之路？ Leo.yuan 信息化 DT IT 转型信息化
如今的IT面临着内忧外患的挑战。一方面，企业多多少少都建立了信息化，有些企业或集团甚至会有数几十个分公司，包含直销、代理、零售以及第三方物流等多种业态。越是复杂的业务，信息化建设越困难，比如运用大量的业务系统，但人力资源有限，大量的数据需要自动对接。IT人员每天忙于处理各种数据需求。因为权限的问题，各个平台需要登录不同的账号去查询。同一类数据每个部门需要查看明细不同，导致IT部门一团糟，非常头疼。
2023-02-27 小小子很能
明明狗可以给人的正反馈更多，为什么却是养猫的人越来越多？先说说狗狗和猫咪区别以及对人类活动的影响吧，本人家猫狗齐全。狗狗：1、需要室外活动，大小便室外解决。2、毛发需要打理，在脱毛旺盛季节，让你绝望。3、购买狗狗时候，一定要注意，提前上网做好功课，一般外国血统的狗狗都带有这些或者那些先天遗传弱化和缺陷方面的毛病，要提前知道，最好能提前知道并预防。比如泰迪，它的髋部容易脱位，这些只能要关注一些。泰迪
利用 Python 爬取小红书热门笔记并进行标签关键词分析程序员威哥最新爬虫实战项目 python 笔记开发语言
一、背景与目标小红书（RED）作为中国最活跃的内容社区之一，拥有大量关于美妆、穿搭、美食、旅游等领域的用户生成内容（UGC）。对于产品、品牌方或研究人员来说，提取热门笔记的标签关键词，可以有效捕捉用户关注点、消费趋势及内容热词。本项目目标：使用Python爬取小红书某个话题下的热门笔记；分析每篇笔记中的标题、正文、标签等字段；利用NLP技术提取高频关键词；对关键词进行可视化与聚类分析。二、技术难点
Spring, Spring Boot 和Spring MVC的关系以及区别棕豆兔＆面试总结 spring spring boot mvc
一、Spring简单来说,Spring是一个开发应用框架，主打轻量级、一站式、模块化，其目的是用于简化企业级应用程序开发。Spring的主要功能：管理对象，以及对象之间的依赖关系，面向切面编程，数据库事务管理,数据访问，web框架支持等。但是Spring具备高度可开放性，并不强制依赖Spring，开发者可以自由选择Spring的部分或者全部，Spring可以无缝继承第三方框架，比如数据访问框架(H
按时写作|2021-04-17 格莱在创作
旷野上的风和老人.jpg（哈哈，声明一下：所有在发布的图片均为格莱诺本人的摄影作品）按时写作是一种训练方式，是通往作家之路的一种办法。就像是人们常说的那样，要想成为作家，你就要天天写，要想成为画家，你就要天天画。是的，每天都要按时写作，成为习惯，结合不断的输入，水到渠成的那天便是指日可待。按时写作是自己生活的笔记，是用来保存记忆场景、对话，以及为自己的创作埋下种子，还有训练文笔流畅，提升思辨力等等
Oracle数据库性能调优完整指南.zip 高杉峻
本文还有配套的精品资源，点击获取简介：Oracle数据库性能优化是企业和数据库专业人员必须掌握的关键技能。Oracle作为广泛使用的数据库管理系统，其性能直接影响业务效率。本文档深入探讨了性能优化的各个方面，包括SQL优化、索引管理、表和分区设计、内存调优、系统资源管理、并发控制、日志和归档策略、性能监控和诊断，以及数据库架构优化和版本升级。通过综合考虑业务场景和硬件环境，结合Oracle提供的工
34、Oracle数据库调优全攻略 tequila 精通Oracle Oracle数据库调优 STATSPACK
Oracle数据库调优全攻略1.调优目标与策略调优的目标是让数据库满足业务需求，即解决依赖系统的用户所发现的问题。管理者和终端用户更关心报表能否按时生成以及数据能否快速返回屏幕，而非数据库内部的精妙程度。因此，需要明确他们认为重要的方面，然后进行调优以实现目标。例如，对于OLTP系统性能不佳的情况，应专注于让数据快速返回屏幕，而非修复偶尔出现的批处理作业。调优时要关注能带来最大收益的领域，并知道何
孩子学习写作的好方法-写日记憧憬着的人儿
这是我之前在亲子群中的一次学姐分享，分享孩子写日记的经历以及如何引导的经历。从一开始，我对写日记有自己的定义，简单来说，就是每日天气每日发生每日感受。它可以平淡如水一字带过，可波澜壮阔长篇大论。他是输出，我们的大脑天生懒惰，不喜欢这活。所以开始，我们得让他足够简单可行。大脑先接受再强化再内化成生活的一部分！它的长期效果我就不讲了，大家都特别清晰。打磨一个人的思维，文字的力量是巨大的。最后我再讲讲它
OpenCV引擎：驱动实时应用开发的科技狂飙芯作者 DD：计算机科学领域 opencv 计算机视觉
在人工智能与计算机视觉技术迅猛发展的今天，实时图像处理已成为工业自动化、自动驾驶、医疗诊断、增强现实等领域的核心技术需求。而**OpenCV（OpenSourceComputerVisionLibrary）**作为全球最活跃的开源计算机视觉库，正以其强大的算法生态、跨平台兼容性以及持续进化的架构设计，成为驱动实时应用开发的“数字引擎”。本文将深入剖析OpenCV如何通过技术创新突破实时处理的性能极
2021-10-26 弗莱斯曼
凡事预则立，不预则废。记忆力以及理解能力，需要不断的用事情去打磨，越磨越灵光，越刺激越好用。不是在总结，就是在总结的路上。闲言碎语跟进给湖北区域客户做实施同事的行程，客户原定25号开始给服务器上架，具体负责这块的区域实施负责人安排同事于27号上门服务。跟内部同事沟通NeonSAN软件是否具备升级条件的必要性，跟实施负责人约时间共同探讨这个事情，会议上由于研发侧负责人具体不了解前因后果，给的论断不具
「2022青创繁星跨年大课复盘05」创业路上，不懂这个思考方法，也许会耗费你很多时间精力！米娅成长日记
“我们面临的局面不是缺少思想，而往往是缺乏对思想的实施。对于每一个得到实施的思想，都有成千上万个思想未能得到贯彻落实。”——FredmundMalik《管理成就生活》理念想法再好，没有执行就等于零！！道理谁都懂，其实很多人总是选择等待，然后错失机会~“四位一体”的稳赢思考模型中，有基于时代的策略分析、战略分析以及组织设计，这3个思考点非常重要，但其终归都属于想法层面的，它们只是脑中“蓝图”。蓝图设
nohup命令和tail命令，实现后台任务运行（不用一直开着运行窗口） qq_48626006 服务器 linux 运维深度学习
使用nohup、tail和jobs命令：提升Linux操作效率的利器在Linux系统中，命令行工具的强大之处不仅在于其丰富的功能，还在于其灵活的组合使用。本文将介绍三个常用的Linux命令——nohup、tail和jobs，以及它们在实际使用中的一些场景和方法。nohup命令nohup（nohangup）命令用于在终端关闭后继续运行一个进程。通常，当我们在终端中运行一个命令时，如果关闭了终端，会导
ROS和autosar区别和联系，以及AP/CP对比ROS Jaliang_ 汽车
ROS和autosar区别和联系ROS(RobotOperatingSystem)和AUTOSAR(AutomotiveOpenSystemArchitecture)是两个不同领域的开源软件框架。应用领域的不同:ROS主要面向机器人技术和相关的智能系统，它为机器人研发提供了一套完整的软件解决方案，包括通信、驱动、算法、模拟等各方面的支持。ROS适合用于机器人的控制、感知、规划、模拟等方面的开发，也
肇庆九个正规司法亲子鉴定地方大全（附2024年鉴定汇总收费标准）国权基因
肇庆司法亲子鉴定哪家正规？肇庆亲鉴生物亲子鉴定中心是正规的亲子鉴定机构。为了方便肇庆的小伙伴能快速找到鉴定机构，小编整理了肇庆各地区司法鉴定机构名单以及肇庆亲子鉴定咨询机构在此供大家参考，排名不分先后。注：各鉴定机构鉴定范畴不同，请根据自身情况及鉴定机构的业务范围自行选择，内容仅供参考。肇庆司法亲子鉴定机构地址大全1、肇庆亲鉴生物亲子鉴定咨询中心地址：广东省肇庆市端州区服务区域：端州区、鼎湖区、高
Linux系统启动流程以及基础命令下一些根目录的含义
Linux系统启动流程：1.开机自检，BIOS,在主板上的ROM芯片上存储2.加载MBR\UEFI3.GRUB2引导菜单4.加载内核5.启动init（初始化）0~6·0关机·1无网络的单用户模式（root）·2无网络的多用户模式·3有网络的多用户模式·4（无）保留模式·5GUI有网络多用户模式·6重启模式6.启动内核模块7.启动不同级别的脚本8.启动成功（sshd）Linux系统启动过程详解一、启
格局 _Rain__
格局是什么呢？格是对认知范围内事物认知的程度，局是指认知范围内所做事情以及事情的结果，合起来称之为格局。而人的格局具体反映在处理三种关系中——与自己的关系，与工作的关系，与社会的关系。相似的遭遇，相似的起点，人生的路却会不同。一个人有怎样的格局，会如何对待这些关系，就会拥有怎样的人生。—十点读书
泸州亲子鉴定做一次要多少钱（附2024最新费用标准）民鉴基因科技
泸州做亲子鉴定要多少钱的费用?泸州做亲子鉴定的费用通常在2000至4500元之间。然而，亲子鉴定的最终费用会根据多种因素而有所不同，包括样本的种类、检测机构的资质、检测人员的专业水平、是否需要加急服务以及检测的数量等。在选择亲子鉴定服务时，除了考虑价格，还应该重视检测机构的信誉、专业水平以及服务质量等其他重要因素。泸州亲子鉴定做一次要多少钱（附2024最新费用标准）泸州亲子鉴定收费一览：泸州的司法
数据结构入门指南：程序世界的基石 Mikhail_G 数据结构 python 开发语言
大家好!在计算机的世界里，数据结构就像我们日常生活中的收纳系统——它决定了数据如何被存储、组织和使用。无论你是刚接触编程的新手，还是希望巩固基础的开发者，理解数据结构都是提升编程能力的关键一步。一、什么是数据结构？数据结构是计算机中组织、管理和存储数据的方式，它定义了数据元素之间的关系以及对数据进行操作的方法。简单来说，数据结构就是数据的“容器”，不同的容器适合存放不同类型的数据，就像书架适合放书
科普关于kz厂浪琴名匠真用eta吗奢侈品总汇
大家好，我是广城腕表，一个专注腕表知识的爱好者，不定时更新腕表真假对比，拆解评测以及视频解说，学会用专业知识了解腕表的好与坏，让您在玩表之路不入坑，本期给大家说说目前究竟gf厂和zf厂积家月相顶级复刻哪个好。重要提醒→买大厂手表联系方式看文章底部浪琴是国内认识和认可度最高的瑞士钟表二线品牌，基本上国内大部分城市和一些县城都有浪琴专柜，相信很多表友都了解，尤其是浪琴旗下的名匠系列，名表城复刻在写评测
社交应用全栈开发实战：前后端与数据库整合
本文还有配套的精品资源，点击获取简介：本资源包详细介绍了构建一个社交应用程序的全过程，包括前端、后端以及数据库管理的核心组件和关键功能。Uniapp框架用于开发跨平台的移动端用户界面，Java后端负责处理业务逻辑和数据交互，MySQL数据库用于管理用户信息和动态数据。项目还包括前后端通信、身份验证、性能优化和推送通知服务的实现。学习这些代码可以提升开发者的技能，帮助快速构建社交应用。1.社交APP
声控灯设计与Protus仿真语嫣凝冰
本文还有配套的精品资源，点击获取简介：声控灯是智能家居系统中关键的智能设备，通过声音信号控制灯光的开关。本文深入分析了声控灯的设计原理、工作流程，并探讨了如何利用Protus软件进行声控灯的仿真，以及电位器在灵敏度调节中的应用。学生将学习声控模块的组成和阈值设定，以及如何使用Protus软件来模拟声控灯的实际运作，优化其性能。1.声控灯设计原理声控灯技术是一种利用声音信号来控制灯具开关的现代照明技
网络参考模型以及各层对应的协议窗外千纸鹤网络网络网络协议
网络参考模型在互联网中实际使用的是TCP/IP参考模型。实际存在的协议主要包括在：物理层、数据链路层、网络层、传输层和应用层。各协议也分别对应这5个层次而已。【1】物理层：主要定义物理设备标准，如网线的接口类型、光纤的接口类型、各种传输介质的传输速率等。它的主要作用是传输比特流（就是由1、0转化为电流强弱来进行传输,到达目的地后在转化为1、0，也就是我们常说的数模转换与模数转换），这一层的数据叫做
焦作17家亲子鉴定中心地址大全（附2024年汇总鉴定）民鉴基因科普
焦作亲子鉴定中心在哪里？焦作亲子鉴定中心在焦作市山阳区解放中路。为了方便焦作的小伙伴能快速找到鉴定机构，小编整理了焦作各地区司法鉴定机构名单以及焦作亲子鉴定中心机构在此供大家参考，排名不分先后。注：各鉴定机构鉴定范畴不同，请根据自身情况及鉴定机构的业务范围自行选择，内容仅供参考。焦作17家亲子鉴定中心地址大全（附2024年汇总鉴定）焦作17家亲子鉴定中心地址大全焦作民鉴基因亲子鉴定中心焦作亲子鉴定
己做到99.2%准一比一复刻手表万国葡计在哪里买靠谱高端顶级复刻手表大厂货源
大家好，我是广城腕表，一个专注腕表知识的爱好者，不定时更新腕表真假对比，拆解评测以及视频解说，学会用专业知识了解腕表的好与坏，让您在玩表之路不入坑。近些年，随着社会经济的发展和人们生活水平的提高，各类名牌奢侈品的需求也不断增长。而对于钟表爱好者来说，Rolex（劳力士）是一种无法抗拒的时尚潮流。尤其是日志系列，以其独特的外观设计和卓越的品质，成为了许多人的追求目标。市场上也是很多厂家在做，那么劳力
麦吉丽代理好吗？麦吉丽品牌怎样？广州时尚王子
化妆品是现代生活的快消品，麦吉丽贵妇膏的使用着反馈也是相当好，通过加盟代理，加快了品牌的知名度，在化妆品界有了一席之地。麦吉丽贵妇膏代理价格表分几种？1、一级代理一级代理是指享受产品批发价价格，需要10000押金以及12000首批货款，即可享受麦吉丽旗下所有产品，推荐比较专业的销售人员使用。最大的优势是价格低。2、市级代理市级代理是对于有创业想法的人可以尝试，费用相比一类，保证金3000，但货款2
做什么主播最容易，说说我的看法糖葫芦不甜
在探讨“做什么主播最容易”这一话题时，首先需要明确的是，“容易”这一标准往往因人而异，它取决于个人的兴趣、技能、资源以及市场环境等多重因素。不过，从普遍性和可操作性的角度出发，我认为以下几类主播相对更容易起步并吸引到一定的观众群体。1.生活Vlog主播生活Vlog（视频博客）以其真实、接地气的特点深受大众喜爱。对于初入主播行业的人来说，记录并分享自己的日常生活、旅行经历、美食制作或是家居改造等内容
拼多多官方返利新动向，高省App引领购物省钱新趋势古楼
电商行业的快速发展带来了无数的新趋势和新机遇，而拼多多官方返利的新趋势无疑是其中的一大亮点。高省App作为这一趋势的敏锐洞察者和积极参与者，致力于帮助用户精准把握这些新机遇。通过高省App，用户可以及时了解拼多多官方返利的最新政策和活动信息，从而做出更加明智的购物决策。同时，高省App还提供了专业的数据分析工具，帮助用户分析自己的消费行为和省钱效果，让省钱之路更加清晰和明确。我们在开始讲今天的文章
python2.x里面的input（）和raw_input（）函数以及3.x中的input（）函数的区别 scuter_yu python python input函数 raw_input函数 3.x中的input函数
在python3.0及以上的版本中，raw_input（）函数已经和我们说再见了，但是呢，input（）函数则很好地替代了消失了的raw_input（）函数。而且现在的input（）函数所返回的值都是字符串，所以对于要有int，float等类型的数值必须进行强制的类型转换。下面让我对3.0的input（）函数做个小总结：>>>str=input("abc:")abc:15>>>str'15'(虽然
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include