古老的屋檐下

1000 面试题（含答案），BAT 机器学习面试刷题宝典！

刷题，是面试前的必备环节。本文作者便总结了往年BAT机器学习面试题，干货满满，值得收藏。

想要入职大厂可谓是千军万马过独木桥。

为了通过层层考验，刷题肯定是必不可少的。本文作者根据网络在线发布的BAT机器学习面试1000题系列，整理了一份面试刷题宝典。

1.请简要介绍下SVM。

SVM，全称是support vector machine，中文名叫支持向量机。SVM是一个面向数据的分类算法，它的目标是为确定一个分类超平面，从而将不同的数据分隔开。

扩展：

支持向量机学习方法包括构建由简至繁的模型：线性可分支持向量机、线性支持向量机及非线性支持向量机。当训练数据线性可分时，通过硬间隔最大化，学习一个线性的分类器，即线性可分支持向量机，又称为硬间隔支持向量机；当训练数据近似线性可分时，通过软间隔最大化，也学习一个线性的分类器，即线性支持向量机，又称为软间隔支持向量机；当训练数据线性不可分时，通过使用核技巧及软间隔最大化，学习非线性支持向量机。

支持向量机通俗导论（理解SVM的三层境界）

https://www.cnblogs.com/v-July-v/archive/2012/06/01/2539022.html

机器学习之深入理解SVM

http://blog.csdn.net/sinat_35512245/article/details/54984251

2.请简要介绍下Tensorflow的计算图。

@寒小阳：Tensorflow是一个通过计算图的形式来表述计算的编程系统，计算图也叫数据流图，可以把计算图看做是一种有向图，Tensorflow中的每一个计算都是计算图上的一个节点，而节点之间的边描述了计算之间的依赖关系。

3.请问GBDT和XGBoost的区别是什么？

@Xijun LI：XGBoost类似于GBDT的优化版，不论是精度还是效率上都有了提升。与GBDT相比，具体的优点有：

损失函数是用泰勒展式二项逼近，而不是像GBDT里的就是一阶导数；

对树的结构进行了正则化约束，防止模型过度复杂，降低了过拟合的可能性；

节点分裂的方式不同，GBDT是用的基尼系数，XGBoost是经过优化推导后的。

知识点链接：集成学习的总结

https://xijunlee.github.io/2017/06/03/集成学习总结/

4.在k-means或kNN，我们是用欧氏距离来计算最近的邻居之间的距离。为什么不用曼哈顿距离？

曼哈顿距离只计算水平或垂直距离，有维度的限制。另一方面，欧氏距离可用于任何空间的距离计算问题。因为，数据点可以存在于任何空间，欧氏距离是更可行的选择。例如：想象一下国际象棋棋盘，象或车所做的移动是由曼哈顿距离计算的，因为它们是在各自的水平和垂直方向做的运动。

5.百度2015校招机器学习笔试题。

知识点链接：百度2015校招机器学习笔试题

http://www.itmian4.com/thread-7042-1-1.html

6.简单说说特征工程。

7.关于LR。

@rickjin：把LR从头到脚都给讲一遍。建模，现场数学推导，每种解法的原理，正则化，LR和maxent模型啥关系，LR为啥比线性回归好。有不少会背答案的人，问逻辑细节就糊涂了。原理都会? 那就问工程，并行化怎么做，有几种并行化方式，读过哪些开源的实现。还会，那就准备收了吧，顺便逼问LR模型发展历史。

知识点链接：机器学习之Logistic回归(逻辑蒂斯回归）

http://blog.csdn.net/sinat_35512245/article/details/54881672

8.overfitting怎么解决？

dropout、regularization、batch normalizatin

9.LR和SVM的联系与区别？

@朝阳在望，联系：

1、LR和SVM都可以处理分类问题，且一般都用于处理线性二分类问题（在改进的情况下可以处理多分类问题）

2、两个方法都可以增加不同的正则化项，如L1、L2等等。所以在很多实验中，两种算法的结果是很接近的。

区别：

1、LR是参数模型，SVM是非参数模型。

2、从目标函数来看，区别在于逻辑回归采用的是Logistical Loss，SVM采用的是hinge loss.这两个损失函数的目的都是增加对分类影响较大的数据点的权重，减少与分类关系较小的数据点的权重。

3、SVM的处理方法是只考虑Support Vectors，也就是和分类最相关的少数点，去学习分类器。而逻辑回归通过非线性映射，大大减小了离分类平面较远的点的权重，相对提升了与分类最相关的数据点的权重。

4、逻辑回归相对来说模型更简单，好理解，特别是大规模线性分类时比较方便。而SVM的理解和优化相对来说复杂一些，SVM转化为对偶问题后,分类只需要计算与少数几个支持向量的距离,这个在进行复杂核函数计算时优势很明显,能够大大简化模型和计算。

5、Logic 能做的 SVM能做，但可能在准确率上有问题，SVM能做的Logic有的做不了。

6.简单说说特征工程。

7.关于LR。

知识点链接：机器学习之Logistic回归(逻辑蒂斯回归）

http://blog.csdn.net/sinat_35512245/article/details/54881672

8.overfitting怎么解决？

dropout、regularization、batch normalizatin

9.LR和SVM的联系与区别？

@朝阳在望，联系：

1、LR和SVM都可以处理分类问题，且一般都用于处理线性二分类问题（在改进的情况下可以处理多分类问题）

2、两个方法都可以增加不同的正则化项，如L1、L2等等。所以在很多实验中，两种算法的结果是很接近的。

区别：

1、LR是参数模型，SVM是非参数模型。

答案来源：机器学习常见面试问题（一）

http://blog.csdn.net/timcompp/article/details/62237986

10.LR与线性回归的区别与联系？

@nishizhen

个人感觉逻辑回归和线性回归首先都是广义的线性回归，

其次经典线性模型的优化目标函数是最小二乘，而逻辑回归则是似然函数，

另外线性回归在整个实数域范围内进行预测，敏感度一致，而分类范围，需要在[0,1]。逻辑回归就是一种减小预测范围，将预测值限定为[0,1]间的一种回归模型，因而对于这类问题来说，逻辑回归的鲁棒性比线性回归的要好。

@乖乖癞皮狗：逻辑回归的模型本质上是一个线性回归模型，逻辑回归都是以线性回归为理论支持的。但线性回归模型无法做到sigmoid的非线性形式，sigmoid可以轻松处理0/1分类问题。

11.为什么XGBoost要用泰勒展开，优势在哪里？

@AntZ：XGBoost使用了一阶和二阶偏导, 二阶导数有利于梯度下降的更快更准. 使用泰勒展开取得二阶倒数形式, 可以在不选定损失函数具体形式的情况下用于算法优化分析.本质上也就把损失函数的选取和模型算法优化/参数选择分开了. 这种去耦合增加了XGBoost的适用性。

12.XGBoost如何寻找最优特征？是又放回还是无放回的呢？

@AntZ：XGBoost在训练的过程中给出各个特征的评分，从而表明每个特征对模型训练的重要性.。XGBoost利用梯度优化模型算法, 样本是不放回的(想象一个样本连续重复抽出,梯度来回踏步会不会高兴)。但XGBoost支持子采样, 也就是每轮计算可以不使用全部样本。

13.谈谈判别式模型和生成式模型？

判别方法：由数据直接学习决策函数 Y = f（X），或者由条件分布概率 P（Y|X）作为预测模型，即判别模型。

生成方法：由数据学习联合概率密度分布函数 P（X,Y）,然后求出条件概率分布P(Y|X)作为预测的模型，即生成模型。

由生成模型可以得到判别模型，但由判别模型得不到生成模型。

常见的判别模型有：K近邻、SVM、决策树、感知机、线性判别分析（LDA）、线性回归、传统的神经网络、逻辑斯蒂回归、boosting、条件随机场

常见的生成模型有：朴素贝叶斯、隐马尔可夫模型、高斯混合模型、文档主题生成模型（LDA）、限制玻尔兹曼机

14.L1和L2的区别。

L1范数（L1 norm）是指向量中各个元素绝对值之和，也有个美称叫“稀疏规则算子”（Lasso regularization）。

比如向量A=[1，-1，3]，那么A的L1范数为 |1|+|-1|+|3|.

简单总结一下就是：

L1范数: 为x向量各个元素绝对值之和。

L2范数: 为x向量各个元素平方和的1/2次方，L2范数又称Euclidean范数或Frobenius范数

Lp范数: 为x向量各个元素绝对值p次方和的1/p次方.

在支持向量机学习过程中，L1范数实际是一种对于成本函数求解最优的过程，因此，L1范数正则化通过向成本函数中添加L1范数，使得学习得到的结果满足稀疏化，从而方便人类提取特征。

L1范数可以使权值稀疏，方便特征提取。

L2范数可以防止过拟合，提升模型的泛化能力。

15.L1和L2正则先验分别服从什么分布？

@齐同学：面试中遇到的，L1和L2正则先验分别服从什么分布，L1是拉普拉斯分布，L2是高斯分布。

16.CNN最成功的应用是在CV，那为什么NLP和Speech的很多问题也可以用CNN解出来？为什么AlphaGo里也用了CNN？这几个不相关的问题的相似性在哪里？CNN通过什么手段抓住了这个共性？

@许韩

知识点链接（答案解析）：深度学习岗位面试问题整理笔记

https://zhuanlan.zhihu.com/p/25005808

17.说一下Adaboost，权值更新公式。当弱分类器是Gm时，每个样本的的权重是w1，w2…，请写出最终的决策公式。

答案解析

http://www.360doc.com/content/14/1109/12/20290918_423780183.shtml

18.LSTM结构推导，为什么比RNN好？

推导forget gate，input gate，cell state， hidden information等的变化；因为LSTM有进有出且当前的cell informaton是通过input gate控制之后叠加的，RNN是叠乘，因此LSTM可以防止梯度消失或者爆炸。

19.经常在网上搜索东西的朋友知道，当你不小心输入一个不存在的单词时，搜索引擎会提示你是不是要输入某一个正确的单词，比如当你在Google中输入“Julw”时，系统会猜测你的意图：是不是要搜索“July”，如下图所示：

这叫做拼写检查。根据谷歌一员工写的文章How to Write a Spelling Corrector显示，Google的拼写检查基于贝叶斯方法。请说说的你的理解，具体Google是怎么利用贝叶斯方法，实现”拼写检查”的功能。

用户输入一个单词时，可能拼写正确，也可能拼写错误。如果把拼写正确的情况记做c（代表correct），拼写错误的情况记做w（代表wrong），那么”拼写检查”要做的事情就是：在发生w的情况下，试图推断出c。换言之：已知w，然后在若干个备选方案中，找出可能性最大的那个c，也就是求P(c|w)P(c|w)的最大值。而根据贝叶斯定理，有：

!](https://upload-images.jianshu.io/upload_images/14326004-3355b9c5155e180d.png?imageMogr2/auto-orient/strip|imageView2/2/w/1240)

由于对于所有备选的c来说，对应的都是同一个w，所以它们的P(w)是相同的，因此我们只要最大化P(w|c)P©即可。其中：

P©表示某个正确的词的出现”概率”，它可以用”频率”代替。如果我们有一个足够大的文本库，那么这个文本库中每个单词的出现频率，就相当于它的发生概率。某个词的出现频率越高，P©就越大。比如在你输入一个错误的词“Julw”时，系统更倾向于去猜测你可能想输入的词是“July”，而不是“Jult”，因为“July”更常见。

P(w|c)表示在试图拼写c的情况下，出现拼写错误w的概率。为了简化问题，假定两个单词在字形上越接近，就有越可能拼错，P(w|c)就越大。举例来说，相差一个字母的拼法，就比相差两个字母的拼法，发生概率更高。你想拼写单词July，那么错误拼成Julw（相差一个字母）的可能性，就比拼成Jullw高（相差两个字母）。值得一提的是，一般把这种问题称为“编辑距离”，参见程序员编程艺术第二十八~二十九章：最大连续乘积子串、字符串编辑距离。

http://blog.csdn.net/v_july_v/article/details/8701148#t4

所以，我们比较所有拼写相近的词在文本库中的出现频率，再从中挑出出现频率最高的一个，即是用户最想输入的那个词。具体的计算过程及此方法的缺陷请参见How to Write a Spelling Corrector。

http://norvig.com/spell-correct.html

20.为什么朴素贝叶斯如此“朴素”？

因为它假定所有的特征在数据集中的作用是同样重要和独立的。正如我们所知，这个假设在现实世界中是很不真实的，因此，说朴素贝叶斯真的很“朴素”。

21.机器学习中，为何要经常对数据做归一化？

@zhanlijun

本题解析来源：为什么一些机器学习模型需要对数据进行归一化？

http://www.cnblogs.com/LBSer/p/4440590.html

22.谈谈深度学习中的归一化问题。

详情参见此视频：深度学习中的归一化

http://www.julyedu.com/video/play/69/686

23.请简要说说一个完整机器学习项目的流程。

1 抽象成数学问题

明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情，胡乱尝试时间成本是非常高的。

这里的抽象成数学问题，指的我们明确我们可以获得什么样的数据，目标是一个分类还是回归或者是聚类的问题，如果都不是的话，如果划归为其中的某类问题。

2 获取数据

数据决定了机器学习结果的上限，而算法只是尽可能逼近这个上限。

数据要有代表性，否则必然会过拟合。

而且对于分类问题，数据偏斜不能过于严重，不同类别的数据数量不要有数个数量级的差距。

而且还要对数据的量级有一个评估，多少个样本，多少个特征，可以估算出其对内存的消耗程度，判断训练过程中内存是否能够放得下。如果放不下就得考虑改进算法或者使用一些降维的技巧了。如果数据量实在太大，那就要考虑分布式了。

3 特征预处理与特征选择

良好的数据要能够提取出良好的特征才能真正发挥效力。

特征预处理、数据清洗是很关键的步骤，往往能够使得算法的效果和性能得到显著提高。归一化、离散化、因子化、缺失值处理、去除共线性等，数据挖掘过程中很多时间就花在它们上面。这些工作简单可复制，收益稳定可预期，是机器学习的基础必备步骤。

筛选出显著特征、摒弃非显著特征，需要机器学习工程师反复理解业务。这对很多结果有决定性的影响。特征选择好了，非常简单的算法也能得出良好、稳定的结果。这需要运用特征有效性分析的相关技术，如相关系数、卡方检验、平均互信息、条件熵、后验概率、逻辑回归权重等方法。

4 训练模型与调优

直到这一步才用到我们上面说的算法进行训练。现在很多算法都能够封装成黑盒供人使用。但是真正考验水平的是调整这些算法的（超）参数，使得结果变得更加优良。这需要我们对算法的原理有深入的理解。理解越深入，就越能发现问题的症结，提出良好的调优方案。

5 模型诊断

如何确定模型调优的方向与思路呢？这就需要对模型进行诊断的技术。

过拟合、欠拟合判断是模型诊断中至关重要的一步。常见的方法如交叉验证，绘制学习曲线等。过拟合的基本调优思路是增加数据量，降低模型复杂度。欠拟合的基本调优思路是提高特征数量和质量，增加模型复杂度。

误差分析也是机器学习至关重要的步骤。通过观察误差样本，全面分析误差产生误差的原因:是参数的问题还是算法选择的问题，是特征的问题还是数据本身的问题……

诊断后的模型需要进行调优，调优后的新模型需要重新进行诊断，这是一个反复迭代不断逼近的过程，需要不断地尝试，进而达到最优状态。

6 模型融合

一般来说，模型融合后都能使得效果有一定提升。而且效果很好。

工程上，主要提升算法准确度的方法是分别在模型的前端（特征清洗和预处理，不同的采样模式）与后端（模型融合）上下功夫。因为他们比较标准可复制，效果比较稳定。而直接调参的工作不会很多，毕竟大量数据训练起来太慢了，而且效果难以保证。

7 上线运行

这一部分内容主要跟工程实现的相关性比较大。工程上是结果导向，模型在线上运行的效果直接决定模型的成败。不单纯包括其准确程度、误差等情况，还包括其运行的速度(时间复杂度)、资源消耗程度（空间复杂度）、稳定性是否可接受。

这些工作流程主要是工程实践上总结出的一些经验。并不是每个项目都包含完整的一个流程。这里的部分只是一个指导性的说明，只有大家自己多实践，多积累项目经验，才会有自己更深刻的认识。

故，基于此，七月在线每一期ML算法班都特此增加特征工程、模型调优等相关课。比如，这里有个公开课视频《特征处理与特征选择》。

24.new 和 malloc的区别？

知识点链接：new 和 malloc的区别

https://www.cnblogs.com/fly1988happy/archive/2012/04/26/2470542.html

25.hash 冲突及解决办法？

@Sommer_Xia

关键字值不同的元素可能会映象到哈希表的同一地址上就会发生哈希冲突。解决办法：

1）开放定址法：当冲突发生时，使用某种探查(亦称探测)技术在散列表中形成一个探查(测)序列。沿此序列逐个单元地查找，直到找到给定的关键字，或者碰到一个开放的地址(即该地址单元为空)为止（若要插入，在探查到开放的地址，则可将待插入的新结点存人该地址单元）。查找时探查到开放的地址则表明表中无待查的关键字，即查找失败。

2）再哈希法：同时构造多个不同的哈希函数。

3）链地址法：将所有哈希地址为i的元素构成一个称为同义词链的单链表，并将单链表的头指针存在哈希表的第i个单元中，因而查找、插入和删除主要在同义词链中进行。链地址法适用于经常进行插入和删除的情况。

4）建立公共溢出区：将哈希表分为基本表和溢出表两部分，凡是和基本表发生冲突的元素，一律填入溢出表。

26.如何解决梯度消失和梯度膨胀？

（1）梯度消失：

根据链式法则，如果每一层神经元对上一层的输出的偏导乘上权重结果都小于1的话，那么即使这个结果是0.99，在经过足够多层传播之后，误差对输入层的偏导会趋于0。

可以采用ReLU激活函数有效的解决梯度消失的情况。

（2）梯度膨胀：

根据链式法则，如果每一层神经元对上一层的输出的偏导乘上权重结果都大于1的话，在经过足够多层传播之后，误差对输入层的偏导会趋于无穷大。

可以通过激活函数来解决。

27.下列哪个不属于CRF模型对于HMM和MEMM模型的优势（）

A. 特征灵活

B. 速度快

C. 可容纳较多上下文信息

D. 全局最优

解答：首先，CRF，HMM(隐马模型)，MEMM(最大熵隐马模型)都常用来做序列标注的建模。

隐马模型一个最大的缺点就是由于其输出独立性假设，导致其不能考虑上下文的特征，限制了特征的选择。

最大熵隐马模型则解决了隐马的问题，可以任意选择特征，但由于其在每一节点都要进行归一化，所以只能找到局部的最优值，同时也带来了标记偏见的问题，即凡是训练语料中未出现的情况全都忽略掉。

条件随机场则很好的解决了这一问题，他并不在每一个节点进行归一化，而是所有特征进行全局归一化，因此可以求得全局的最优值。

答案为B。

28.简单说下有监督学习和无监督学习的区别？

有监督学习：对具有标记的训练样本进行学习，以尽可能对训练样本集外的数据进行分类预测。（LR,SVM,BP,RF,GBDT）

无监督学习：对未标记的样本进行训练学习，比发现这些样本中的结构知识。(KMeans,DL)

29.了解正则化么？

正则化是针对过拟合而提出的，以为在求解模型最优的是一般优化最小的经验风险，现在在该经验风险上加入模型复杂度这一项（正则化项是模型参数向量的范数），并使用一个rate比率来权衡模型复杂度与以往经验风险的权重，如果模型复杂度越高，结构化的经验风险会越大，现在的目标就变为了结构经验风险的最优化，可以防止模型训练过度复杂，有效的降低过拟合的风险。

奥卡姆剃刀原理，能够很好的解释已知数据并且十分简单才是最好的模型。

30.协方差和相关性有什么区别？

相关性是协方差的标准化格式。协方差本身很难做比较。例如：如果我们计算工资（$）和年龄（岁）的协方差，因为这两个变量有不同的度量，所以我们会得到不能做比较的不同的协方差。为了解决这个问题，我们计算相关性来得到一个介于-1和1之间的值，就可以忽略它们各自不同的度量。

31.线性分类器与非线性分类器的区别以及优劣。

如果模型是参数的线性函数，并且存在线性分类面，那么就是线性分类器，否则不是。

常见的线性分类器有：LR,贝叶斯分类，单层感知机、线性回归。

常见的非线性分类器：决策树、RF、GBDT、多层感知机。

SVM两种都有(看线性核还是高斯核)。

线性分类器速度快、编程方便，但是可能拟合效果不会很好。

非线性分类器编程复杂，但是效果拟合能力强。

32.数据的逻辑存储结构（如数组，队列，树等）对于软件开发具有十分重要的影响，试对你所了解的各种存储结构从运行速度、存储效率和适用场合等方面进行简要地分析。

33.什么是分布式数据库？

分布式数据库系统是在集中式数据库系统成熟技术的基础上发展起来的，但不是简单地把集中式数据库分散地实现，它具有自己的性质和特征。集中式数据库系统的许多概念和技术，如数据独立性、数据共享和减少冗余度、并发控制、完整性、安全性和恢复等在分布式数据库系统中都有了不同的、更加丰富的内容。

34.简单说说贝叶斯定理。

在引出贝叶斯定理之前，先学习几个定义：

条件概率（又称后验概率）就是事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为P(A|B)，读作“在B条件下A的概率”。

比如，在同一个样本空间Ω中的事件或者子集A与B，如果随机从Ω中选出的一个元素属于B，那么这个随机选择的元素还属于A的概率就定义为在B的前提下A的条件概率，所以：P(A|B) = |A∩B|/|B|，接着分子、分母都除以|Ω|得到：

联合概率表示两个事件共同发生的概率。A与B的联合概率表示为P(A∩B)或者P(A，B)。

边缘概率（又称先验概率）是某个事件发生的概率。边缘概率是这样得到的：在联合概率中，把最终结果中那些不需要的事件通过合并成它们的全概率，而消去它们（对离散随机变量用求和得全概率，对连续随机变量用积分得全概率），这称为边缘化（marginalization），比如A的边缘概率表示为P(A)，B的边缘概率表示为P(B)。

接着，考虑一个问题：P(A|B)是在B发生的情况下A发生的可能性。

1）首先，事件B发生之前，我们对事件A的发生有一个基本的概率判断，称为A的先验概率，用P(A)表示；

2）其次，事件B发生之后，我们对事件A的发生概率重新评估，称为A的后验概率，用P(A|B)表示；

3）类似的，事件A发生之前，我们对事件B的发生有一个基本的概率判断，称为B的先验概率，用P(B)表示；

4）同样，事件A发生之后，我们对事件B的发生概率重新评估，称为B的后验概率，用P(B|A)表示。

贝叶斯定理的公式表达式：

35.#include 和#include“filename.h”有什么区别？

知识点链接：#include 和 #include”filename.h”有什么区别

http://blog.csdn.net/u010339647/article/details/77825788

36.某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题？(A)

A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理

37.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务？©

A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘

38.下面哪种不属于数据预处理的方法？ (D)

A变量代换 B离散化 C 聚集 D 估计遗漏值

39.什么是KDD？ (A)

A. 数据挖掘与知识发现 B. 领域知识发现C. 文档知识发现 D. 动态知识发现

40.当不知道数据所带标签时，可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离？(B)

A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链

41.建立一个模型，通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务？©

A. 根据内容检索 B. 建模描述

C. 预测建模 D. 寻找模式和规则

42.以下哪种方法不属于特征选择的标准方法？(D)

A嵌入 B 过滤 C 包装 D 抽样

43.请用python编写函数find_string，从文本中搜索并打印内容，要求支持通配符星号和问号。

44.说下红黑树的五个性质。

教你初步了解红黑树

http://blog.csdn.net/v_july_v/article/details/6105630

45.简单说下sigmoid激活函数。

常用的非线性激活函数有sigmoid、tanh、relu等等，前两者sigmoid/tanh比较常见于全连接层，后者relu常见于卷积层。这里先简要介绍下最基础的sigmoid函数（btw，在本博客中SVM那篇文章开头有提过）。

Sigmoid的函数表达式如下：

也就是说，Sigmoid函数的功能是相当于把一个实数压缩至0到1之间。当z是非常大的正数时，g(z)会趋近于1，而z是非常小的负数时，则g(z)会趋近于0。

压缩至0到1有何用处呢？用处是这样一来便可以把激活函数看作一种“分类的概率”，比如激活函数的输出为0.9的话便可以解释为90%的概率为正样本。

举个例子，如下图（图引自Stanford机器学习公开课）：

46.什么是卷积?

对图像（不同的数据窗口数据）和滤波矩阵（一组固定的权重：因为每个神经元的多个权重固定，所以又可以看做一个恒定的滤波器filter）做内积（逐个元素相乘再求和）的操作就是所谓的『卷积』操作，也是卷积神经网络的名字来源。

非严格意义上来讲，下图中红框框起来的部分便可以理解为一个滤波器，即带着一组固定权重的神经元。多个滤波器叠加便成了卷积层。

OK，举个具体的例子。比如下图中，图中左边部分是原始输入数据，图中中间部分是滤波器filter，图中右边是输出的新的二维数据。

分解下上图

47.什么是CNN的池化pool层?

池化，简言之，即取区域平均或最大，如下图所示（图引自cs231n）:

上图所展示的是取区域最大，即上图左边部分中左上角2x2的矩阵中6最大，右上角2x2的矩阵中8最大，左下角2x2的矩阵中3最大，右下角2x2的矩阵中4最大，所以得到上图右边部分的结果：6 8 3 4。很简单不是？

48.简述下什么是生成对抗网络。

GAN之所以是对抗的，是因为GAN的内部是竞争关系，一方叫generator，它的主要工作是生成图片，并且尽量使得其看上去是来自于训练样本的。另一方是discriminator，其目标是判断输入图片是否属于真实训练样本。

更直白的讲，将generator想象成假币制造商，而discriminator是警察。generator目的是尽可能把假币造的跟真的一样，从而能够骗过discriminator，即生成样本并使它看上去好像来自于真实训练样本一样。

如下图中的左右两个场景：

更多请参见此课程：生成对抗网络

https://www.julyedu.com/course/getDetail/83

49.学梵高作画的原理是啥？

这里有篇如何做梵高风格画的实验教程教你从头到尾利用DL学梵高作画：GTX 1070 cuda 8.0 tensorflow gpu版，至于其原理请看这个视频：NeuralStyle艺术化图片（学梵高作画背后的原理）。

http://blog.csdn.net/v_july_v/article/details/52658965

http://www.julyedu.com/video/play/42/523

50.现在有 a 到 z 26 个元素，编写程序打印 a 到 z 中任取 3 个元素的组合（比如打印 a b c ，d y z等）。

一道百度机器学习工程师职位的面试题

http://blog.csdn.net/lvonve/article/details/53320680

51.哪些机器学习算法不需要做归一化处理？

概率模型不需要归一化，因为它们不关心变量的值，而是关心变量的分布和变量之间的条件概率，如决策树、RF。而像Adaboost、GBDT、XGBoost、SVM、LR、KNN、KMeans之类的最优化问题就需要归一化。

52.说说梯度下降法。

@LeftNotEasy

机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)

http://www.cnblogs.com/LeftNotEasy/archive/2010/12/05/mathmatic_in_machine_learning_1_regression_and_gradient_descent.html

53.梯度下降法找到的一定是下降最快的方向么？

梯度下降法并不是下降最快的方向，它只是目标函数在当前的点的切平面（当然高维问题不能叫平面）上下降最快的方向。在Practical Implementation中，牛顿方向（考虑海森矩阵）才一般被认为是下降最快的方向，可以达到Superlinear的收敛速度。梯度下降类的算法的收敛速度一般是Linear甚至Sublinear的（在某些带复杂约束的问题）。

知识点链接：一文清晰讲解机器学习中梯度下降算法（包括其变式算法）

http://blog.csdn.net/wemedia/details.html?id=45460

54.牛顿法和梯度下降法有什么不同？

@wtq1993

知识点链接：机器学习中常见的最优化算法

http://blog.csdn.net/wtq1993/article/details/51607040

55.什么是拟牛顿法（Quasi-Newton Methods）？

@wtq1993

机器学习中常见的最优化算法

56.请说说随机梯度下降法的问题和挑战？

57.说说共轭梯度法？

@wtq1993

机器学习中常见的最优化算法

http://blog.csdn.net/wtq1993/article/details/51607040

58.对所有优化问题来说, 有没有可能找到比現在已知算法更好的算法?

答案链接

https://www.zhihu.com/question/41233373/answer/145404190

59、什么最小二乘法？

我们口头中经常说：一般来说，平均来说。如平均来说，不吸烟的健康优于吸烟者，之所以要加“平均”二字，是因为凡事皆有例外，总存在某个特别的人他吸烟但由于经常锻炼所以他的健康状况可能会优于他身边不吸烟的朋友。而最小二乘法的一个最简单的例子便是算术平均。

最小二乘法（又称最小平方法）是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据，并使得这些求得的数据与实际数据之间误差的平方和为最小。用函数表示为：

由于算术平均是一个历经考验的方法，而以上的推理说明，算术平均是最小二乘的一个特例，所以从另一个角度说明了最小二乘方法的优良性，使我们对最小二乘法更加有信心。

最小二乘法发表之后很快得到了大家的认可接受，并迅速的在数据分析实践中被广泛使用。不过历史上又有人把最小二乘法的发明归功于高斯，这又是怎么一回事呢。高斯在1809年也发表了最小二乘法，并且声称自己已经使用这个方法多年。高斯发明了小行星定位的数学方法，并在数据分析中使用最小二乘方法进行计算，准确的预测了谷神星的位置。

对了，最小二乘法跟SVM有什么联系呢？请参见支持向量机通俗导论（理解SVM的三层境界）。

http://blog.csdn.net/v_july_v/article/details/7624837

60、看你T恤上印着：人生苦短，我用Python，你可否说说Python到底是什么样的语言？你可以比较其他技术或者语言来回答你的问题。

15个重要Python面试题测测你适不适合做Python？

http://nooverfit.com/wp/15个重要python面试题-测测你适不适合做python？/

61.Python是如何进行内存管理的？

2017 Python最新面试题及答案16道题

http://www.cnblogs.com/tom-gao/p/6645859.html

62.请写出一段Python代码实现删除一个list里面的重复元素。

1、使用set函数，set(list)；

2、使用字典函数：

63.编程用sort进行排序，然后从最后一个元素开始判断。

64.Python里面如何生成随机数？

@Tom_junsong

random模块

随机整数：random.randint(a,b)：返回随机整数x,a<=x<=b

random.randrange(start,stop,[,step])：返回一个范围在(start,stop,step)之间的随机整数，不包括结束值。

随机实数：random.random( ):返回0到1之间的浮点数

random.uniform(a,b):返回指定范围内的浮点数。

65.说说常见的损失函数。

对于给定的输入X，由f(X)给出相应的输出Y，这个输出的预测值f(X)与真实值Y可能一致也可能不一致（要知道，有时损失或误差是不可避免的），用一个损失函数来度量预测错误的程度。损失函数记为L(Y, f(X))。

常用的损失函数有以下几种（基本引用自《统计学习方法》）：

66.简单介绍下Logistics回归。

Logistic回归目的是从特征学习出一个0/1分类模型，而这个模型是将特性的线性组合作为自变量，由于自变量的取值范围是负无穷到正无穷。因此，使用logistic函数（或称作sigmoid函数）将自变量映射到(0,1)上，映射后的值被认为是属于y=1的概率。

假设函数：

其中x是n维特征向量，函数g就是Logistic函数。而：g(z)=11+e−zg(z)=11+e−z的图像是：
可以看到，将无穷映射到了(0,1)。而假设函数就是特征属于y=1的概率。

67.看你是搞视觉的，熟悉哪些CV框架，顺带聊聊CV最近五年的发展史如何？

答案解析
https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2651986617&idx=1&sn=fddebd0f2968d66b7f424d6a435c84af&scene=0#wechat_redirect

68.深度学习在视觉领域有何前沿进展？

@元峰

本题解析来源：深度学习在计算机视觉领域的前沿进展

https://zhuanlan.zhihu.com/p/24699780

69.HashMap与HashTable区别？

HashMap与Hashtable的区别

http://oznyang.iteye.com/blog/30690

70.在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是( )

A、将负样本重复10次,生成10w样本量,打乱顺序参与分类

B、直接进行分类,可以最大限度利用数据

C、从10w正样本中随机抽取1w参与分类

D、将负样本每个权重设置为10,正样本权重为1,参与训练过程

@管博士：准确的说，其实选项中的这些方法各有优缺点，需要具体问题具体分析，有篇文章对各种方法的优缺点进行了分析，讲的不错感兴趣的同学可以参考一下：

How to handle Imbalanced Classification Problems in machine learning?

https://www.analyticsvidhya.com/blog/2017/03/imbalanced-classification-problem/

71.深度学习是当前很热门的机器学习算法，在深度学习中，涉及到大量的矩阵相乘，现在需要计算三个稠密矩阵A,B,C的乘积ABC,假90设三个矩阵的尺寸分别为m∗n，n∗p，p∗q，且m

A.(AB)C

B.AC(B)

C.A(BC)

D.所以效率都相同

正确答案：A

@BlackEyes_SGC：mnp nq,mpq < npq, 所以 (AB)C 最小

72.Nave Bayes是一种特殊的Bayes分类器,特征变量是X,类别标签是C,它的一个假定是:( C )

A.各类别的先验概率P©是相等的

B.以0为均值，sqr(2)/2为标准差的正态分布

C.特征变量X的各个维度是类别条件独立随机变量

D.P(X|C)是高斯分布

正确答案：C

@BlackEyes_SGC：朴素贝叶斯的条件就是每个变量相互独立。

73.关于支持向量机SVM,下列说法错误的是（C）

A.L2正则项，作用是最大化分类间隔，使得分类器拥有更强的泛化能力

B.Hinge 损失函数，作用是最小化经验分类错误

C.分类间隔为1||w||1||w||，||w||代表向量的模

D.当参数C越小时，分类间隔越大，分类错误越多，趋于欠学习

正确答案：C

@BlackEyes_SGC：

A正确。考虑加入正则化项的原因：想象一个完美的数据集，y>1是正类，y<-1是负类，决策面y=0，加入一个y=-30的正类噪声样本，那么决策面将会变“歪”很多，分类间隔变小，泛化能力减小。加入正则项之后，对噪声样本的容错能力增强，前面提到的例子里面，决策面就会没那么“歪”了，使得分类间隔变大，提高了泛化能力。

B正确。

C错误。间隔应该是2||w||2||w||才对，后半句应该没错，向量的模通常指的就是其二范数。

D正确。考虑软间隔的时候，C对优化问题的影响就在于把a的范围从[0，+inf]限制到了[0,C]。C越小，那么a就会越小，目标函数拉格朗日函数导数为0可以求出w=∑iai∗yi∗xiw=∑iai∗yi∗xi，a变小使得w变小，因此间隔2||w||2||w||变大

74.在HMM中,如果已知观察序列和产生观察序列的状态序列,那么可用以下哪种方法直接进行参数估计( D )

A.EM算法

B.维特比算法

C.前向后向算法

D.极大似然估计

正确答案：D

@BlackEyes_SGC：

EM算法：只有观测序列，无状态序列时来学习模型参数，即Baum-Welch算法

维特比算法：用动态规划解决HMM的预测问题，不是参数估计

前向后向算法：用来算概率

极大似然估计：即观测序列和相应的状态序列都存在时的监督学习算法，用来估计参数

注意的是在给定观测序列和对应的状态序列估计模型参数，可以利用极大似然发估计。如果给定观测序列，没有对应的状态序列，才用EM，将状态序列看不不可测的隐数据。

75.假定某同学使用Naive Bayesian（NB）分类模型时，不小心将训练数据的两个维度搞重复了，那么关于NB的说法中正确的是：(BD)

A.这个被重复的特征在模型中的决定作用会被加强

B.模型效果相比无重复特征的情况下精确度会降低

C.如果所有特征都被重复一遍，得到的模型预测结果相对于不重复的情况下的模型预测结果一样。

D.当两列特征高度相关时，无法用两列特征相同时所得到的结论来分析问题

E.NB可以用来做最小二乘回归

F.以上说法都不正确

正确答案：BD

@BlackEyes_SGC：NB的核心在于它假设向量的所有分量之间是独立的。在贝叶斯理论系统中，都有一个重要的条件独立性假设：假设所有特征之间相互独立，这样才能将联合概率拆分。

76.以下哪些方法不可以直接来对文本分类？(A)

A、Kmeans

B、决策树

C、支持向量机

D、KNN

正确答案: A分类不同于聚类。

@BlackEyes_SGC：A：Kmeans是聚类方法，典型的无监督学习方法。分类是监督学习方法，BCD都是常见的分类方法。

77.已知一组数据的协方差矩阵P,下面关于主分量说法错误的是( C )

A、主分量分析的最佳准则是对一组数据进行按一组正交基分解, 在只取相同数量分量的条件下,以均方误差计算截尾误差最小

B、在经主分量分解后,协方差矩阵成为对角矩阵

C、主分量分析就是K-L变换

D、主分量是通过求协方差矩阵的特征值得到

正确答案: C

@BlackEyes_SGC：K-L变换与PCA变换是不同的概念，PCA的变换矩阵是协方差矩阵，K-L变换的变换矩阵可以有很多种（二阶矩阵、协方差矩阵、总类内离散度矩阵等等）。当K-L变换矩阵为协方差矩阵时，等同于PCA。

78.Kmeans的复杂度？

时间复杂度：O(tKmn)，其中，t为迭代次数，K为簇的数目，m为记录数，n为维数空间复杂度：O((m+K)n)，其中，K为簇的数目，m为记录数，n为维数。

具体参考：机器学习之深入理解K-means、与KNN算法区别及其代码实现

http://blog.csdn.net/sinat_35512245/article/details/55051306

79.关于Logit 回归和SVM 不正确的是（A）

A. Logit回归本质上是一种根据样本对权值进行极大似然估计的方法，而后验概率正比于先验概率和似然函数的乘积。logit仅仅是最大化似然函数，并没有最大化后验概率，更谈不上最小化后验概率。A错误

B. Logit回归的输出就是样本属于正类别的几率，可以计算出概率，正确

C. SVM的目标是找到使得训练数据尽可能分开且分类间隔最大的超平面，应该属于结构风险最小化。

D. SVM可以通过正则化系数控制模型的复杂度，避免过拟合。

@BlackEyes_SGC：Logit回归目标函数是最小化后验概率，Logit回归可以用于预测事件发生概率的大小，SVM目标是结构风险最小化，SVM可以有效避免模型过拟合。

80.输入图片大小为200×200，依次经过一层卷积（kernel size 5×5，padding 1，stride 2），pooling（kernel size 3×3，padding 0，stride 1），又一层卷积（kernel size 3×3，padding 1，stride 1）之后，输出特征图大小为：（）

正确答案：97

@BlackEyes_SGC：计算尺寸不被整除只在GoogLeNet中遇到过。卷积向下取整，池化向上取整。

本题（200-5+2*1）/2+1 为99.5，取99

（99-3）/1+1 为97

（97-3+2*1）/1+1 为97

研究过网络的话看到stride为1的时候，当kernel为 3 padding为1或者kernel为5 padding为2 一看就是卷积前后尺寸不变。计算GoogLeNet全过程的尺寸也一样。

81.影响聚类算法结果的主要因素有（BCD ）

A.已知类别的样本质量；

B.分类准则；

C.特征选取；

D.模式相似性测度

82.模式识别中，马式距离较之于欧式距离的优点是（CD）

A. 平移不变性；

B. 旋转不变性；

C. 尺度不变性；

D. 考虑了模式的分布

83.影响基本K-均值算法的主要因素有(ABD）

A. 样本输入顺序；

B. 模式相似性测度；

C. 聚类准则；

D. 初始类中心的选取

84.在统计模式分类问题中，当先验概率未知时，可以使用（BD）

A. 最小损失准则；

B. 最小最大损失准则；

C. 最小误判概率准则；

D. N-P判决

85.如果以特征向量的相关系数作为模式相似性测度，则影响聚类算法结果的主要因素有（BC）

A. 已知类别样本质量；

B. 分类准则；

C. 特征选取；

D. 量纲

86.欧式距离具有（AB ）；马式距离具有（ABCD ）。

A. 平移不变性；

B. 旋转不变性；

C. 尺度缩放不变性；

D. 不受量纲影响的特性

87.你有哪些Deep Learning（RNN，CNN）调参的经验？

答案解析，来自知乎

https://www.zhihu.com/question/41631631

88.简单说说RNN的原理。

我们升学到高三准备高考时，此时的知识是由高二及高二之前所学的知识加上高三所学的知识合成得来，即我们的知识是由前序铺垫，是有记忆的，好比当电影字幕上出现：“我是”时，你会很自然的联想到：“我是中国人”。

89.什么是RNN？

@一只鸟的天空，本题解析来源：

循环神经网络(RNN, Recurrent Neural Networks)介绍

http://blog.csdn.net/heyongluoyao8/article/details/48636251

90.RNN是怎么从单层网络一步一步构造的的?

@何之源，本题解析来源：

完全图解RNN、RNN变体、Seq2Seq、Attention机制

https://zhuanlan.zhihu.com/p/28054589

101.深度学习（CNN RNN Attention）解决大规模文本分类问题。

用深度学习（CNN RNN Attention）解决大规模文本分类问题 - 综述和实践

https://zhuanlan.zhihu.com/p/25928551

102.如何解决RNN梯度爆炸和弥散的问题的？

深度学习与自然语言处理(7)_斯坦福cs224d 语言模型，RNN，LSTM与GRU

http://blog.csdn.net/han_xiaoyang/article/details/51932536

103.如何提高深度学习的性能？

机器学习系列(10)_如何提高深度学习(和机器学习)的性能

http://blog.csdn.net/han_xiaoyang/article/details/52654879

104.RNN、LSTM、GRU区别？

@我愛大泡泡，本题解析来源：

面试笔试整理3：深度学习机器学习面试问题准备（必会）

http://blog.csdn.net/woaidapaopao/article/details/77806273

105.当机器学习性能遭遇瓶颈时，你会如何优化的？

可以从这4个方面进行尝试：基于数据、借助算法、用算法调参、借助模型融合。当然能谈多细多深入就看你的经验心得了。

这里有一份参考清单：机器学习系列(20)_机器学习性能改善备忘单

http://blog.csdn.net/han_xiaoyang/article/details/53453145

106.做过什么样的机器学习项目？比如如何从零构建一个推荐系统？

推荐系统的公开课http://www.julyedu.com/video/play/18/148，另，再推荐一个课程：机器学习项目班 [10次纯项目讲解，100%纯实战]（https://www.julyedu.com/course/getDetail/48）。

107.什么样的资料集不适合用深度学习?

@抽象猴，来源：

知乎解答

https://www.zhihu.com/question/41233373

108.广义线性模型是怎被应用在深度学习中?

@许韩，来源：

知乎解答

https://huangqinjian.blog.csdn.net/article/details/如果你是面试官，你怎么去判断一个面试者的深度学习水平？ - 许韩的回答 - 知乎 https://www.zhihu.com/question/41233373/answer/145404190

109.准备机器学习面试应该了解哪些理论知识？

知乎解答

https://www.zhihu.com/question/62482926

110.标准化与归一化的区别?

简单来说，标准化是依照特征矩阵的列处理数据，其通过求z-score的方法，将样本的特征值转换到同一量纲下。归一化是依照特征矩阵的行处理数据，其目的在于样本向量在点乘运算或其他核函数计算相似性时，拥有统一的标准，也就是说都转化为“单位向量”。规则为L2的归一化公式如下：

特征向量的缺失值处理：

1.缺失值较多.直接将该特征舍弃掉，否则可能反倒会带入较大的noise，对结果造成不良影响。

2.缺失值较少,其余的特征缺失值都在10%以内，我们可以采取很多的方式来处理:

把NaN直接作为一个特征，假设用0表示；
用均值填充；
用随机森林等算法预测填充

111.随机森林如何处理缺失值。

方法一（na.roughfix）简单粗暴，对于训练集,同一个class下的数据，如果是分类变量缺失，用众数补上，如果是连续型变量缺失，用中位数补。

方法二（rfImpute）这个方法计算量大，至于比方法一好坏？不好判断。先用na.roughfix补上缺失值，然后构建森林并计算proximity matrix，再回头看缺失值，如果是分类变量，则用没有阵进行加权平均的方法补缺失值。然后迭代4-6次，这个补缺失值的思想和KNN有些类似1缺失的观测实例的proximity中的权重进行投票。如果是连续型变量，则用proximity矩2。

112.随机森林如何评估特征重要性。

衡量变量重要性的方法有两种，Decrease GINI 和 Decrease Accuracy：

Decrease GINI：对于回归问题，直接使用argmax(VarVarLeftVarRight)作为评判标准，即当前节点训练集的方差Var减去左节点的方差VarLeft和右节点的方差VarRight。
Decrease Accuracy：对于一棵树Tb(x)，我们用OOB样本可以得到测试误差1；然后随机改变OOB样本的第j列：保持其他列不变，对第j列进行随机的上下置换，得到误差2。至此，我们可以用误差1-误差2来刻画变量j的重要性。基本思想就是，如果一个变量j足够重要，那么改变它会极大的增加测试误差；反之，如果改变它测试误差没有增大，则说明该变量不是那么的重要。

113.优化Kmeans。

使用Kd树或者Ball Tree

将所有的观测实例构建成一颗kd树，之前每个聚类中心都是需要和每个观测点做依次距离计算，现在这些聚类中心根据kd树只需要计算附近的一个局部区域即可。

114.KMeans初始类簇中心点的选取。

K-means++算法选择初始seeds的基本思想就是：初始的聚类中心之间的相互距离要尽可能的远。

1.从输入的数据点集合中随机选择一个点作为第一个聚类中心

2.对于数据集中的每一个点x，计算它与最近聚类中心(指已选择的聚类中心)的距离D(x)

3.选择一个新的数据点作为新的聚类中心，选择的原则是：D(x)较大的点，被选取作为聚类中心的概率较大

4.重复2和3直到k个聚类中心被选出来

5.利用这k个初始的聚类中心来运行标准的k-means算法

115.解释对偶的概念。

一个优化问题可以从两个角度进行考察，一个是primal 问题，一个是dual 问题，就是对偶问题，一般情况下对偶问题给出主问题最优值的下界，在强对偶性成立的情况下由对偶问题可以得到主问题的最优下界，对偶问题是凸优化问题，可以进行较好的求解，SVM中就是将Primal问题转换为dual问题进行求解，从而进一步引入核函数的思想。

116.如何进行特征选择？

特征选择是一个重要的数据预处理过程，主要有两个原因：一是减少特征数量、降维，使模型泛化能力更强，减少过拟合;二是增强对特征和特征值之间的理解。

常见的特征选择方式：

1.去除方差较小的特征。

2.正则化。1正则化能够生成稀疏的模型。L2正则化的表现更加稳定，由于有用的特征往往对应系数非零。

3.随机森林，对于分类问题，通常采用基尼不纯度或者信息增益，对于回归问题，通常采用的是方差或者最小二乘拟合。一般不需要feature engineering、调参等繁琐的步骤。它的两个主要问题，1是重要的特征有可能得分很低（关联特征问题），2是这种方法对特征变量类别多的特征越有利（偏向问题）。

4.稳定性选择。是一种基于二次抽样和选择算法相结合较新的方法，选择算法可以是回归、SVM或其他类似的方法。它的主要思想是在不同的数据子集和特征子集上运行特征选择算法，不断的重复，最终汇总特征选择结果，比如可以统计某个特征被认为是重要特征的频率（被选为重要特征的次数除以它所在的子集被测试的次数）。理想情况下，重要特征的得分会接近100%。稍微弱一点的特征得分会是非0的数，而最无用的特征得分将会接近于0。

117.数据预处理。

1.缺失值，填充缺失值fillna：

i. 离散：None,

ii. 连续：均值。

iii. 缺失值太多，则直接去除该列

2.连续值：离散化。有的模型（如决策树）需要离散值

3.对定量特征二值化。核心在于设定一个阈值，大于阈值的赋值为1，小于等于阈值的赋值为0。如图像操作

4.皮尔逊相关系数，去除高度相关的列

118.简单说说特征工程。

119.你知道有哪些数据处理和特征工程的处理？

限于文章字数，更多精彩面试题，请点击这里

扫描下方二维码，及时获取更多互联网求职面经、java、python、爬虫、大数据等技术，和海量资料分享：
公众号**菜鸟名企梦后台发送“csdn”即可免费领取【csdn】和【百度文库】下载服务；
公众号菜鸟名企梦后台发送“资料”:即可领取5T精品学习资料**、java面试考点和java面经总结，以及几十个java、大数据项目，资料很全，你想找的几乎都有

你可能感兴趣的:(互联网求职)

python实战案例：采集招聘网，知晓现今岗位要求颜狗一只
前言嗨喽！大家好呀，这里是魔王~今天我们来采集专业的互联网求职招聘网站。致力于提供真实可靠的互联网岗位求职招聘找工作信息,拥有海量的互联网人才储备环境介绍：python3.8pycharm2021.2专业版激活码模块使用:内置模块:importpprint>>>格式化输入模块importcsv>>>保存csv文件importre>>>re正则表达式importtime>>>时间模块importjs
智能求职助手 - ChatGPT 与 RPA 技术的完美结合 Lorin 洛林技术资讯 chatgpt rpa 人工智能
随着全球互联网行业的快速发展，互联网求职市场也变得越来越竞争激烈。在互联网求职寒冬的背景下，一位热心的开发者创造了一个令人惊叹的开源项目，结合了ChatGPT和RPA技术，为求职者提供了一键自动投递简历的便捷解决方案。项目背景该项目的灵感来源于对求职过程中繁琐任务的深刻理解。作者意识到，在不同的招聘平台上寻找工作并提交个性化的求职信是一个耗时而繁琐的任务。因此，这位创造者决心通过结合人工智能（AI
【python】新手想练习python？给你推荐几个网站 bagell python 开发语言爬虫数据库前端
现在我们经过前几天的文章，相信大家对python有了一定的了解，但是对于自己的实力没有一个完整的认知，那么该如何是好呢？小编给大家整理了一些可以答题的网站。那么废话不多说，推荐6个！let’sgo！1、牛客网牛客网作为国内内容超级丰富的IT题库，各种东西看的我眼花缭乱，题库+面试+学习+求职+讨论360度无死角服务，堪称"互联网求职神器"，如果你是应届生，这里更是你面试找工作的好去处。它好就好在不
每日一练蓝桥杯C语言:2020年真题题集（B组）电子魔术师每日一练蓝桥杯C/C++B组蓝桥杯 c语言 c++算法
在这里我给大家推荐一款不错刷算法学习网站：点击这处链接牛客网；牛客网作为国内内容超级丰富的IT题库，各种东西看的我眼花缭乱，题库+面试+学习+求职+讨论+大厂内推等等服务，堪称"互联网求职神器"。它好就好在不只是一个刷题的平台，还是一个交流学习的平台，发个问题贴总有热心的大佬帮助。文章目录⛳1.门牌制作⛳2.既约分数⛳3.蛇形填数⛳4.跑步锻炼⛳5.七段码⛳6.成绩统计⛳7.回文日期⛳8.子串分值
操作系统存储器章节知识梳理宏夏c windows linux java
宏夏Coding网站，致力于为编程学习者、互联网求职者提供最需要的内容！网站内容包括求职秘籍，葵花宝典（学习笔记），资源推荐等内容。在线阅读：https://hongxiac.com存储器的层次结构对于通用的计算机，存储层次至少应具有3层：最高层为CPU寄存器，中间层为主存储器，最低层为辅助存储器（简称辅存）。对于较高档的计算机，存储层次可细分为：寄存器，高速缓存，主存储器，磁盘缓存，固定磁盘，可
软件工程知识总结梳理宏夏c 软件工程
宏夏Coding网站，致力于为编程学习者、互联网求职者提供最需要的内容！网站内容包括求职秘籍，葵花宝典（学习笔记），资源推荐等内容。在线阅读：https://hongxiac.com1.软件与软件组成？软件工程常用的8个质量要素的定义？计算机科学对软件的定义：软件是在计算机系统支持下，能够完成特定功能和性能的程序、数据和相关的文档。软件可形式化表示为：软件=知识+程序+数据+文档用户关注软件质量的
我的个人网站——宏夏Coding上线啦宏夏c java git mysql
网站地址：宏夏CodingGithub地址：宏夏coding网站，致力于为编程学习者、互联网求职者提供最需要的内容！网站内容包括求职秘籍，葵花宝典（学习笔记），资源推荐等内容。前言大家好，我是宏夏c，目前是一名软件工程专业的大三学生。回顾起大一入学的那个初夏，我仿佛是一只刚刚出生的小鸟，对于自己的专业和浩瀚的编程宇宙一无所知，一切都嗷嗷待哺。我也同许多人一样，曾对一些选择感到困惑，不知道是选择考研
人才网站如何盈利的一些思考（李德伟）李德伟A
在发达国家，有80%以上的人士是通过互联网求职。而在中国，一份调查数据显示，通过人才招聘网站求职成功的占比约仅为31%左右。而得益于庞大的市场，这并未妨碍该领域诞生独角兽。如前程无忧、智联招聘、中华英才网等传统互联网招聘巨头，曾一度占据国内网络招聘市场份额的8成。人才网络招聘优点：成本低；针对性强；覆盖面广；方便、快捷、时效性强；具有初步筛选功能，提高了招聘工作的效率。网络招聘缺点：网络招聘技术和
今年C++找工作这么这么难？程序员
本文首发自「慕课网」，想了解更多IT干货内容，程序员圈内热闻，欢迎关注！“金九银十”求职季到了，但一些细心的互联网求职者发现，今年的C++开发岗位好像不怎么多，甚至可以说是十分稀少。哪怕是2023年的秋招市场，C++后端开发岗也是寥寥数几。关于C++岗位的问题也一跃成为了知乎热议话题，Whathappened？其实，过去几年来，市场上C++后端开发岗位占比一直就就不高，今年经济形势紧张，加上缩招，
今年C++找工作这么这么难？ imooc慕课 c++java 开发语言
今年一些细心的互联网求职者发现，C++开发岗位好像不怎么多，甚至可以说是十分稀少。哪怕是2023年的秋招市场，C++后端开发岗也是寥寥数几。关于C++岗位的问题也一跃成为了某乎热议话题，Whathappened？其实，过去几年来，市场上C++后端开发岗位占比一直就就不高，今年经济形势紧张，加上缩招，一片红海也是正常操作。C++作为有着40多年历史的老牌编程语言，很多人大学第一次接触编程就是C语言，
互联网求职指南2023版（内含腾讯、阿里、字节真实面经）果7 面试经验分享程序人生
0.缘起五年前，小编曾经写过一篇文章，文章主要带大家了解当时的互联网巨头公司、独角兽公司。并给出了互联网的求职建议。从简历、知识储备、暑期实习、面试上给出了中肯的建议。现在看来也是很受用的，感兴趣的可以点击链接《互联网求职指南》http://mp.weixin.qq.com/s?__biz=MzA4NDA0NzM4Ng==&mid=2649793993&idx=1&sn=4e30722ebdd71
python爬虫selenium操作(1) 我是你哥！d 爬虫 python 学习开发语言 ux hadoop
1.数据源互联网求职招聘找工作-上拉勾招聘-专业的互联网求职招聘网站利用selenium自动化工具进行操作首先我们先导入包fromselenium.webdriverimportChrome1.创造浏览器对象然后运行程序会自动打开这个网站web=Chrome()web.get("http://lagou.com")找到某个元素然后点击比如搜索框然后复制xpath路径el=web.find_elem
程序员拿到拼多多和招行信用卡工作，吐槽都是侮辱价不知如何选温柔的倾诉
一名程序员在互联网求职论坛吐槽自己拿到的工作都不怎么样，不知道该怎么选择：排除了技术岗的offer，现在决定做非技术了，拼多多产品，工资其实是个侮辱价，15k，但是部门感觉挺喜欢，计算广告部，给pdd挣钱的部门，半年一次调薪，招行卡中心产品，掌上生活移动互联方向，26万加一点福利，涨薪慢，跳槽难于拼多多。我自己是一名高级python开发工程师，这里有我自己整理了一套最新的python系统学习教程，
程序员拿到拼多多和招行信用卡工作，吐槽都是侮辱价，不知如何选择零点145
一名程序员在互联网求职论坛吐槽自己拿到的工作都不怎么样，不知道该怎么选择：排除了技术岗的offer，现在决定做非技术了，拼多多产品，工资其实是个侮辱价，15k，但是部门感觉挺喜欢，计算广告部，给pdd挣钱的部门，半年一次调薪，招行卡中心产品，掌上生活移动互联方向，26万加一点福利，涨薪慢，跳槽难于拼多多。对于这部分所谓的侮辱价，有应届生表示确实低了，拼多多这个价没必要去，也有网友表示这样的薪资其实
面试阿里露馅被怼了！面试官：这简历一看就是包装过的程序IT圈搜索引擎 java 面试编程语言 xhtml
点击上方“程序IT圈”，选择“星标”开发者技术前线出品编辑：可可整理互联网求职简历包装一直是个受争议的话题。最近某后端开发面试阿里巴巴被怼了，原因是简历被面试官发现了可疑之出，被怼了。“这简历一看就是包装过的”之后社区就有阿里员工发帖：“培训班果然帮忙造假简历，看来所言不虚”大家开始热烈讨论，有不少谴责简历造假的，也有一些求职者吐槽当前现状的。某一妹子感慨：简历不包装，面试机会都不给啊，我能怎么办
知名公司入职前的「背景调查」，到底在查什么？ DevolperFront
点击“开发者技术前线”，选择“星标????”在看|星标|留言,真爱来源：100offer说互联网求职者在接受某些中大型企业面试后，时常有人接到一通电话，电话那头的声音往往如此告知求职者：「你好，我们是某第三方雇前调查机构，正在依据招聘企业的委托，对您进行背景调查。」不少应聘者接到这通电话，会顿时产生被廉政公署请去喝茶的恐慌感。100offer的人才顾问Helen见过许多次类似的例子，候选人一听对方
为什么找不到合适的工作? itclanCoder
（点击即可收听）01知道的求职渠道太少找工作不一定要盯着某一个App或者网站,在如今,僧多粥少的环境下,一定要多渠道求职,拓展信息来源,甚至某些互联网大佬都会在朋友圈发招聘互联网求职平台:拉钩,boss直聘,牛客，猎聘,前程无忧,看准(看公司评价)，领英,国聘,各事业单位的官网,甚至技术交流qq,微信群等02不会写简历简历是hr对求职者的第一印象,真正取决于你进公司的,是业务负责人,怎么样写一封好
我的秋招总结：互联网求职必读古老的屋檐下互联网求职应届生互联网求职面试总结分享求职总结互联网求职总结 java总结 offer总结 offer面经
博主是19年7月毕业的应届生：985、A+学科硕士。2018年的秋招收获了：**百度、腾讯、头条、美团、猿辅导、度小满、猫眼、流利说**等offer。offer薪资最低30W，最高35W。2018.4-2018.9，秋招准备了整整半年。整个准备期间有过迷茫、沮丧、自我怀疑等一些负面情绪。现在回过头来看，这些负面情绪大多因为对自己的定位不准确造成的。从另外一个角度看，求职面试从某种层面讲其实也是一种
二、诊断：简历为什么被忽视？ Zero_Like
准备简历的第一个失误是关于样式的，传统行业或者初入职场的同学比较容易犯。有人求职互联网还用左边这种格子框样式的传统简历模版，虽然黑白分明，但是很像10年前用的模版，给hr的印象是不太有专业互联网求职者的样子。右边这种，有人说还可以啊，还算好看吧，为什么不行呢？深色背景。HR看简历的习惯，除了在电脑前刷简历，看见感兴趣的简历他是要打印出来的，这么深色的背景你想想打印出来是什么样子，像一块黑色的幕布；
就业形势不好？这里有60+企业专场招聘！程序员小灰
今年的就业形势，确实不容乐观。过了个年，仿佛跳水一般，整个讨论区哀鸿遍野！“19届真的没人要了吗？！”“18届被优化真的没有出路了吗？！”大家的“哀嚎”与“悲惨遭遇”牵动了每日潜伏于讨论区的牛客小哥哥小姐姐们的心，于是牛客决定：是时候为大家做点什么了！为了帮助大家度过“寒冬”牛客网特别联合60+家企业开启互联网求职暖春计划面向18届&19届拯救0offer！本次“暖春计划”放出数百职位参与企业包含
【推荐收藏】这份图解算法数据结构的材料太良心 Python数据开发机器学习算法数据结构
5年前发生的一件事，成为了我职业生涯的重要转折点。当时的我在交大读研，对互联网求职一无所知，但仍然硬着头皮申请了Microsoft实习生。面试官让我在白板上写出“快速排序”代码，我畏畏缩缩地写了一个“冒泡排序”，并且还写错了。从面试官的表情上，我知道失败了。此次失利倒逼我开始刷算法题。我采用“扫雷游戏”式的学习方法，两眼一抹黑刷题，扫到不会的“雷”就通过查资料把它“排掉”，配合周期性总结，幸运地，
python实战案例：采集招聘数据，知晓现今岗位要求搬砖python中~ python 爬虫小案例 python
前言嗨喽！大家好呀~今天我们来采集专业的互联网求职招聘网站致力于提供真实可靠的互联网岗位求职招聘找工作信息环境介绍：python3.8pycharm2021.2专业版激活码模块使用:内置模块:importpprint>>>格式化输入模块importcsv>>>保存csv文件importre>>>re正则表达式importtime>>>时间模块importjson>>>json第三方模块:impor
希望所有计算机学生都知道这些刷题网站程序员大彬算法计算机 leetcode 算法面试
非科班转码的大彬学长给计算机专业学生一些建议！刚开始自学编程的时候，我也是编程基础很薄弱的，在几个刷题网站“沉浸式”刷了几百道题目之后，编程能力才得以提升，达到能找工作的程度！话不多说，直接上干货！1、牛客网作为牛客红名大佬，来给牛客宣传一波！（牛客打钱！）牛客网拥有超级丰富的IT题库，题库+面试+学习+求职+讨论，基本涵盖所有面试笔试题型，堪称"互联网求职神器"。在这里不仅可以刷题，还可以跟其他
今年C++找工作这么这么难？程序员
本文首发自「慕课网」，想了解更多IT干货内容，程序员圈内热闻，欢迎关注！“金九银十”求职季到了，但一些细心的互联网求职者发现，今年的C++开发岗位好像不怎么多，甚至可以说是十分稀少。哪怕是2023年的秋招市场，C++后端开发岗也是寥寥数几。关于C++岗位的问题也一跃成为了知乎热议话题，Whathappened？其实，过去几年来，市场上C++后端开发岗位占比一直就就不高，今年经济形势紧张，加上缩招，
互联网求职卷中卷，应届生怎样才能杀出重围云原生工程师能力认证 C认证计算机行业程序员职场和发展大厂走近考生 C认证云原生
Hello～大家好！欢迎大家来到CSDN云原生计划「考生说」栏目。本期依旧是继续采访的是近期成功获得阿里巴巴暑假实习offer的CSDN云原生专业工程师计划学员的中南大学大三电子信息工程专业的刘贝同学和大家分享成功申请阿里巴巴暑假实习的经验以及面试经历～紧接上期的问题，阿里巴巴HR在面试的时候会询问的是什么类型的问题呢？刘贝同学：在我的面试中我印象最深刻的一个问题是：当你遇到一个问题是你会怎么去解
走在互联网求职的路上慵懒小书虫
文/慵懒小书虫走在互联网求职的路上“你的性格、经历明明很适合找运营岗的工作，为啥非要学编程呢？”“对啊，你都在百度的运营岗实习过呢？不好好干新媒体运营，非要瞎折腾”“你看，你好像又秃了一点！”“最近学得怎么样？还肝得动吗？”“这就是吃青春饭的职业，你年纪大的时候就搞不动的……”周围的声音此起彼伏，似乎都在告诉我，我不适合程序员的工作，脱发、熬夜肝代码、看年龄等等一系列问题，充斥着这个行业，也在充斥
当下互联网求职环境越来越差，作为初出茅庐的程序员感觉已凉，大厂面试成了炮灰... Android725 Android 程序人生移动开发学习程序员
Android又凉了？我们的故事是的，对于大多数刚入门Android的程序员来说，当下互联网求职环境越来越差，大批机械化的Android程序员生产大队，一波波涌进，底层越来越卷，大多人在“车间”培训三个月或者更少的时间，然后伪装一下上战场，期间也有真正的猛士，而大多数人并未习得真正的要领，成了炮灰。他们没有办法找到工作，一次又一次的打击，他们的心理防线被逐个击破，他们心想哪怕是外包公司也可以啊，然
python招聘-的python招聘 weixin_37988176
广告关闭腾讯云双11爆品提前享，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高满返5000元！前言拉勾招聘是专业的互联网求职招聘平台。致力于提供真实可靠的互联网招聘求职找工作信息。今天我们一起使用python采集拉钩的python招聘信息，分析一下找到高薪工作需要掌握哪些技术开发环境：解释器：python3.6.5|anaconda,inc.编辑器：pycharm社区版本文知识
【干货】微课总结，这次秋招就靠它了！叶落香
各位同学，大家好，很高兴能够在这里给大家分享一些关于互联网求职的经验，在这里也很感谢17拿offer的平台，这个平台是一个很好的平台，办得非常不错。先自我介绍一下，我叫channingbreeze，是07级北航学生，研究生也是保研北航，14年初研究生毕业。现在在阿里巴巴集团供职，码农一枚，业余时间也在慕课网讲课，主要讲前端方面的知识，上了三门课，听课人数都过万了。自己给自己的title是全栈工程师
2021届互联网秋招面试题目汇总项目--interview-question（持续更新中...） hdu_xiaoming 面试面试 java 字节跳动
近日在gayhub开了一个新项目，汇总实验室大佬的秋招面试题目。由于笔者找的是后端的工作，所以暂时汇总的题目也以后端题目为主。项目链接=>gayhub实验室（杭州电子科技大学云技术研究中心）约有20多为小伙伴找的后端/客户端的岗位，多位大佬已经到了头条的三面、招银网络的终面（真正的群除我佬…）。有互联网求职需要的同学可以关注下。当然了，仅仅背一个小小的题库一定是远远不够的，主要目的还是分析出大厂关
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj