Datawhale

树模型集成学习(Tree Embedding)

树模型集成学习

集成学习主要有两个思想，分别是bagging和boosting。树模型的集成模型都是使用树作为基模型，最常用的cart树，常见的集成模型有RandomForest、GBDT、Xgboost、Lightgbm、Catboost。

概要介绍

RandomForest

随机森林(Random Forest,RF)是Bagging的一个扩展变体。RF在以决策树为基学习器构建Bagging集成的基础上，进一步在决策树的训练过程中引入了随机属性选择。既然模型叫做随机森林，森林我们可以理解为是多棵树的集合就是森林，随机主要有两个点进行有放回的采样，

每次建树特征个数随机选择

每次建树样本个数随机选择

随机森林中基学习器的多样性不仅来自样本扰动，还来自属性扰动，这就使得最终集成得泛化性能可通过个体学习器之间差异度得增加而进一步提升。使得模型更加鲁棒。

GBDT

GBDT使用的是加法模型和前向分布算法，而AdaBoost算法是前向分布加法算法的特例，前向分布算法学习的是加法模型，当基函数为基本分类器时，该加法模型等价于Adaboost的最终分类器。
GBDT也是迭代，使用了前向分布算法，但是弱学习器限定了只能使用CART回归树模型，同时迭代思路和Adaboost也有所不同。在GBDT的迭代中，假设我们前一轮迭代得到的强学习器是, 损失函数是, 我们本轮迭代的目标是找到一个CART回归树模型的弱学习器，让本轮的损失函数最小。也就是说，本轮迭代找到决策树，要让样本的损失尽量变得更小。GBDT本轮迭代只需拟合当前模型的残差。

Xgboost

Xgboost是gbdt的改进或者说是梯度提升树的一种，Xgb可以说是工程上的最佳实践模型，简单的说xgb=gbdt+二阶梯度信息+随机特征和样本选择+特征百分位值加速+空值特征自动划分。还有必要的正则项和最优特征选择时的并行计算等。

Lightgbm

首先，GBDT是一个非常流行的机器学习算法，另外基于GBDT实现的XGBoost也被广泛使用。但是当面对高纬度和大数据量时，其效率和可扩展性很难满足要求。主要的原因是对于每个特征，我们需要浏览所有的数据去计算每个可能分裂点的信息增益，真是非常耗时的。基于此，提出了两大技术：Gradient-based One-Side Sampling (GOSS) and Exclusive Feature Bundling (EFB).

catboost

CatBoost = Category + Boosting.
2017年7月21日，俄罗斯Yandex开源CatBoost，亮点是在模型中可直接使用Categorical特征并减少了tuning的参数。

核心公式

gbdt的前向分布公式

gbdt的前向分布公式
$f_m(x)=f_{m-1}(x)+\beta_m b(x;\gamma_m) \tag{1}$
gbdt的第m轮的扶梯度公式
$-\left[ \frac{\partial L(y,f(x_i))}{\partial f(x_i)} \right]{f(x)=f{m-1}(x)} \tag{2}$
gbdt格式化损失函数
$L(y,f_m(x))=L(y,f_{m-1}(x)+\beta_m b(x;\gamma_m)) \tag{3}$
泰勒展开式
若函数f（x）在包含x0的某个闭区间[a,b]上具有n阶导数，且在开区间（a,b）上具有（n+1）阶导数，则对闭区间[a,b]上任意一点x，成立下式：
$f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac{f''(x0)}{2!}(x-x_0)^2+ ... + \frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+R_n(x) \tag{4}$ $f(x+\Delta x)=f(x)+f'(x)\Delta x + \frac{1}{2!}f''(x)\Delta x^2+...+\frac{1}{n!}f^{(n)}(x)\Delta x^n+R_n(x) \tag{5}$
其中， $R_n(x)$ 是 $x-x_0)^n$ 的高阶无穷小.
xgboost的目标公式(t轮迭代)
$obj^{(t)}=\sum_{i=1}^{n}l(y_i,\hat{y}_i^t)+\sum_{i=1}^{t}\Omega(f_i) \tag{6}$
$=\sum_{i=1}^{n}l(y,\hat y_{i}^{(t-1)}+f_t(x_i))+\Omega(f_t)+constant \tag{7}$
xgboost损失函数的泰勒二阶展开
$l^{(t)} \eqsim \sum_{i=1}^{n}[l(y_i,\hat y ^{(t-1)})+g_i f_t(x_i) + \frac{1}{2}h_i f_t^2(x_i)]+\Omega(f_t) \tag{8}$
其中，其中， $l(y_i,\hat y ^{(t-1)})$ 是常数， $g_i=\partial_{\hat{y}^{(t-1)}}l(y_i, \hat{y}^{(t-1)})$ , $h_i=\partial_{\hat{y}^{(t-1)}}^2l(y_i, \hat{y}^{(t-1)})$ . . 常数对目标函数的优化不相关，于是可以将目标函数转化为如下:
$l^{(t)} = \sum_{i=1}^{n}[g_i f_t(x_i) + \frac{1}{2}h_i f_t^2(x_i)]+\Omega(f_t) \tag{9}$
$=\sum_{i=1}^{n}[g_i f_t(x_i) + \frac{1}{2}h_i f_t^2(x_i)]+\lambda T+\frac{1}{2}\sum_{j=1}^{T}\omega_j^2 \tag{10}$
$=\sum_{j=1}^{T}[(\sum_{i \in I_j}g_i) \omega_j + \frac{1}{2}(\sum_{i \in I_j}h_i) \omega_j^2] + \lambda T + \frac{1}{2}\sum_{i=1}^{T} \omega_j^2 \tag{11}$
$=\sum_{i=1}^{n}[g_i f_t(x_i) + \frac{1}{2}h_i f_t^2(x_i)]+\lambda T+\frac{1}{2}\sum_{j=1}^{T}\omega_j^2 \tag{12}$
$=\sum_{j=1}^{T}[(\sum_{i \in I_j}g_i) \omega_j + \frac{1}{2}(\sum_{i \in I_j}h_i+\lambda) \omega_j^2] + \lambda T \tag{13}$
求上式最小化的参数，对\omega求导数并另其等于0，得到下式:
$\frac{\partial l^{(t)}}{\partial \omega_j}=0 \tag{14}$
$\sum_{i \in I_j}+(\sum_{i \in I_j}h_i + \lambda) \omega_j=0 \tag{15}$
$\omega_j^*=-\frac{\sum_{i \in I_j}g_i}{\sum_{i \in I_j}h_i + \lambda} \tag{16}$
将上式带入损失函数，得到最小损失：
$\hat{l}^{(t)}(q)=-\frac{1}{2}\sum_{j=1}^{T}\frac{(\sum_{i \in I_j}g_i)^2}{\sum_{i \in I_j}h_i+ \lambda}+\gamma T \tag{17}$
根据公式(17)可以作为特征分裂的指标.计算公式如下(这个值越大越好):
$L_{split}=\frac{1}{2} \left[ \frac{（\sum_{i \in I_L}g_i)^2}{\sum_{i \in I_L}h_i+\lambda} + \frac{（\sum_{i \in I_R}g_i)^2}{\sum_{i \in I_R}h_i+\lambda} - \frac{（\sum_{i \in I}g_i)^2}{\sum_{i \in I}h_i+\lambda} \right ] - \lambda \tag{18}$

算法十问

1.随机森林为什么能够更鲁棒？

由于随机森林使用了使用了行采样和列采样技术，是的每棵树不容易过拟合；并且是基于树的集成算法，由于使用了采用数据是的每棵树的差别较大，在进行embedding的时候可以更好的降低模型的方差，整体而言是的RF是一个鲁棒的模型。

2.RF分类和回归问题如何预测y值？

RF是一个加权平均的模型，是进行分类问题的时候，使用的个k个树的投票策略，多数服从少数。在回归的使用是使用的k个树的平均。可以看出来rf的训练和预测过程都可以进行并行处理。

3.相同数据量，训练RF和gbdt谁可以更快？谁对异常值不敏感？

gbdt是前向加法模型，由于第i棵树需要用到前i-1树的残差，所有在再整个建立过程是串行处理的，RF整体是bagging算法的一种，是k个树的加权平均，k棵树可以并行处理，因此可能得到更快的速度。需要指出在gbdt的原始算法中没有使用行列的随机采样，相反rf使用了随机采样。由于gbdt当前的误差会延续给下一棵树，而RF每次都是独立的随机采样，随机森林对异常值不敏感，GBDT对异常值非常敏感。

4.解释一个什么是gb，什么是dt，即为什么叫做gbdt？

gbdt(Gradient Boosting Decision Tree),dt是指Decision Tree表示使用决策树作为基学习器，使用的cart树，gb表示梯度提升，因为在传统的gbdt中在第i轮的迭代中，使用前i-1的梯度作为当前残差进行拟合。

5.gbdt为什么用负梯度代表残差？

上文公式(3)是gbdt的损失函数，对公式(3)进行在$f_{m-1}(x)处进行
泰勒的一阶展开:
$L(y,f_m(x))=L(y,f_{m-1}(x)+\beta_m b(x;\gamma_m))$
$=L(y,f_{m-1}(x))+\frac{\partial L(y, f_{m-1}(x))}{\partial f_{m-1}(x)}(f_{m}(x)-f_{m-1}(x))$
$=L(y,f_{m-1}(x))+\frac{\partial L(y, f_{m-1}(x))}{\partial f_{m-1}(x)}(\beta_m b(x;\gamma_m)) \tag{19}$
从我们的目标是损失函数最小化，使公式(19)最小化，由于是个常数，所以我们的损失函数最小化可以转化为:
$argmin_{(\beta_m,\gamma_m)}=min \frac{\partial L(y, f_{m-1}(x))}{\partial f_{m-1}(x)}(\beta_m b(x;\gamma_m)) \tag{20}$
将上述式子的两项都看做是向量，为了是相乘之后最小，一定是向量之间的异号,因此得到:
$(\beta_m b(x;\gamma_m)) = - \frac{\partial L(y, f_{m-1}(x))}{\partial f_{m-1}(x)} \tag{21}$
从公式(20)可以看出第m棵树使用前m-1的负梯度作为残差，所有每次都是拟合的负梯度.

6.gbdt是训练过程如何选择特征？

gbdt使用基学习器是CART树，CART树是二叉树，每次使用yes or no进行特征选择，数值连续特征使用的最小均方误差，离散值使用的gini指数。在每次划分特征的时候会遍历所有可能的划分点找到最有的特征分裂点，这是用为什么gbdt会比rf慢的主要原因之一。

7.gbdt应用在多分类问题？

对于多分类任务，GDBT的做法是采用一对多的策略也就是说，对每个类别训练M个分类器。假设有K个类别，那么训练完之后总共有M*K颗树。

两层循环的顺序不能改变。也就是说，K个类别都拟合完第一颗树之后才开始拟合第二颗树，不允许先把某一个类别的M颗树学习完，再学习另外一个类别。

8.RF和GBDT的区别？

GBDT是采用boosing方法，降低偏差；RF采用的是baggging方法，降低方差。其中GBDT中的核心是通过用分类器（如CART、RF）拟合损失函数梯度，而损失函数的定义就决定了在子区域内各个步长，其中就是期望输出与分类器预测输出的查，即bias；而RF的核心就是自采样（样本随机）和属性随机（所有样本中随机选择K个子样本选择最优属性来划分），样本数相同下的不同训练集产生的各个分类器，即数据的扰动导致模型学习性能的变化，即variance。

9.Xgboost相对gbdt做了哪些改进？

传统GBDT以CART作为基分类器，xgboost还支持线性分类器，这个时候xgboost相当于带L1和L2正则化项的逻辑斯蒂回归（分类问题）或者线性回归（回归问题）。

传统GBDT在优化时只用到一阶导数信息，xgboost则对代价函数进行了二阶泰勒展开，同时用到了一阶和二阶导数。顺便提一下，xgboost工具支持自定义代价函数，只要函数可一阶和二阶求导。

xgboost在代价函数里加入了正则项，用于控制模型的复杂度。正则项里包含了树的叶子节点个数、每个叶子节点上输出的score的L2模的平方和。从Bias-variance tradeoff角度来讲，正则项降低了模型的variance，使学习出来的模型更加简单，防止过拟合，这也是xgboost优于传统GBDT的一个特性。

列抽样（column subsampling）。xgboost借鉴了随机森林的做法，支持列抽样，不仅能降低过拟合，还能减少计算，这也是xgboost异于传统gbdt的一个特性。
对缺失值的处理。对于特征的值有缺失的样本，xgboost可以自动学习出它的分裂方向。

xgboost工具支持并行。boosting不是一种串行的结构吗?怎么并行的？注意xgboost的并行不是tree粒度的并行，xgboost也是一次迭代完才能进行下一次迭代的（第t次迭代的代价函数里包含了前面t-1次迭代的预测值）。xgboost的并行是在特征粒度上的。我们知道，决策树的学习最耗时的一个步骤就是对特征的值进行排序（因为要确定最佳分割点），xgboost在训练之前，预先对数据进行了排序，然后保存为block结构，后面的迭代中重复地使用这个结构，大大减小计算量。这个block结构也使得并行成为了可能，在进行节点的分裂时，需要计算每个特征的增益，最终选增益最大的那个特征去做分裂，那么各个特征的增益计算就可以开多线程进行。

可并行的近似直方图算法。树节点在进行分裂时，我们需要计算每个特征的每个分割点对应的增益，即用贪心法枚举所有可能的分割点。当数据无法一次载入内存或者在分布式情况下，贪心算法效率就会变得很低，所以xgboost还提出了一种可并行的近似直方图算法，用于高效地生成候选的分割点。

10.xgb如何在计算特征时加速的？

xgboost工具支持并行。boosting不是一种串行的结构吗?怎么并行的？注意xgboost的并行不是tree粒度的并行，xgboost也是一次迭代完才能进行下一次迭代的（第t次迭代的代价函数里包含了前面t-1次迭代的预测值）。xgboost的并行是在特征粒度上的。我们知道，决策树的学习最耗时的一个步骤就是对特征的值进行排序（因为要确定最佳分割点），xgboost在训练之前，预先对数据进行了排序，然后保存为block结构，后面的迭代中重复地使用这个结构，大大减小计算量。这个block结构也使得并行成为了可能，在进行节点的分裂时，需要计算每个特征的增益，最终选增益最大的那个特征去做分裂，那么各个特征的增益计算就可以开多线程进行。

可并行的近似直方图算法。树节点在进行分裂时，我们需要计算每个特征的每个分割点对应的增益，即用贪心法枚举所有可能的分割点。当数据无法一次载入内存或者在分布式情况下，贪心算法效率就会变得很低，所以xgboost还提出了一种可并行的近似直方图算法，用于高效地生成候选的分割点。

11.xgb为什么使用二阶梯度信息，为什么不使用三阶或者更高梯度信息？

xgb之所以使用二阶梯度信息，是因为从泰勒展开式来看，gbdt使用的一阶梯度的泰勒展开式，丢失了很多的信息，使用二阶可以使损失函数更加准确。从泰勒展开的角度来看展开的次数越多越能更精准的表示损失函数的值，但是如果我们使用二阶梯度就要要求损失函数二阶可导，如果使用n阶展开就要求损失函数n阶可导，但是有很多损失函数不是n阶可导的，比如均方误差，因此使用二阶梯度信息是一个泰勒展开和损失函数选择的折中。

12.lgb相对xgb做了哪些改进？

直方图算法，LightGBM提供一种数据类型的封装相对Numpy,Pandas,Array等数据对象而言节省了内存的使用，原因在于他只需要保存离散的直方图，LightGBM里默认的训练决策树时使用直方图算法，XGBoost里现在也提供了这一选项，不过默认的方法是对特征预排序，直方图算法是一种牺牲了一定的切分准确性而换取训练速度以及节省内存空间消耗的算法.

在训练决策树计算切分点的增益时，预排序需要对每个样本的切分位置计算，所以时间复杂度是O(#data)而LightGBM则是计算将样本离散化为直方图后的直方图切割位置的增益即可，时间复杂度为O(#bins),时间效率上大大提高了(初始构造直方图是需要一次O(#data)的时间复杂度，不过这里只涉及到加和操作).

直方图做差进一步提高效率，计算某一节点的叶节点的直方图可以通过将该节点的直方图与另一子节点的直方图做差得到，所以每次分裂只需计算分裂后样本数较少的子节点的直方图然后通过做差的方式获得另一个子节点的直方图，进一步提高效率

节省内存,将连续数据离散化为直方图的形式，对于数据量较小的情形可以使用小型的数据类型来保存训练数据
不必像预排序一样保留额外的对特征值进行预排序的信息
减少了并行训练的通信代价.

稀疏特征优化、直接支持类别特征、网络通信优化

13.比较一下catboost、lgb和xgb？

catboost自动采用特殊的方式处理类别型特征（categorical features）。首先对categorical features做一些统计，计算某个类别特征（category）出现的频率，之后加上超参数，生成新的数值型特征（numerical features）。这也是我在这里介绍这个算法最大的motivtion，有了catboost，再也不用手动处理类别型特征了。

catboost还使用了组合类别特征，可以利用到特征之间的联系，这极大的丰富了特征维度。

catboost的基模型采用的是对称树，同时计算leaf-value方式和传统的boosting算法也不一样，传统的boosting算法计算的是平均数，而catboost在这方面做了优化采用了其他的算法，这些改进都能防止模型过拟合。

14.如果将所有数据复制一倍放入训练数据集，RF和GBDT分别有什么表现？

RF可能出现过拟合? GBDT没有任何改变?(请思考)

15.gbdt如何防止过拟合？由于gbdt是前向加法模型，前面的树往往起到决定性的作用，如何改进这个问题？

一般使用缩减因子对每棵树进行降权，可以使用带有dropout的gbdt算法，dart树，随机丢弃生成的决策树，然后再从剩下的决策树集中迭代优化提升树。

16.RF/GBDT/XGB/lightGBM ?

面试真题

RF和GBDT能够并行吗?
写一个gbdt的损失函数?
为什么要拟合负梯度?
xgboost如何进行参数更新的?
xgboost为什么使用二阶梯度信息?
gbdt对异常值敏感吗?为什么?

参考

https://www.cnblogs.com/fujian-code/p/9018114.html
https://blog.csdn.net/u010398493/article/details/77587749
https://www.jianshu.com/p/49ab87122562
https://blog.csdn.net/qq_22238533/article/details/79199605

浪潮实施工程师岗员工们的娱乐生活也很丰富，可以享受到很多福利愤怒的小青春 java
快手机器学习算法工程师一面快手机器学习算法工程师面经2023暑期实习-快手广告算法面经百度实习测试开发岗一面面经凌云光毁约网上的摆烂言论谁信我笑水百度提前批Java后端二面百度测开应用产品质量效能部一面二面面经（凉）秋招第一个大厂offer快手offer速通秋招第一个大厂offer百度提前批一面二面加额外一面面经分享顶顶！百度一面面试问为什么hashMap用红黑树，不用平衡二叉树？【游戏行业科普·
2022阿里计算机视觉算法工程师面经 hdychi
内推投的简历，貌似是蚂蚁友宝的团队。一面电话面，只有15分钟，过了两天也没联系，可能凉了一面（电话面）1.自我介绍。说以往工作中的亮点2.问贡献点的想法、想解决什么问题、效果怎么样3.BatchNormalization的作用4.看你做系统有用到目标检测算法，说说fasterRCNN、Yolo、SSD的输出形式、相同和不同的点5.为什么会梯度消失和梯度爆炸？有没有碰到过？有什么办法解决？
算法工程师实习校招面经 (上篇) AI算法札记面经计算机视觉深度学习机器学习面试算法
公众号【面经1】算法工程师实习校招面经(上篇)知乎深度学习算法工程师面经(微软、阿里、商汤、滴滴、华为、海康、平安、陌陌等offer)之上篇-知乎一、引言“温故而知新，可以为师矣”，基于《公众号短期规划》一文，我将首先对过去在实验室及实习秋招过程中的工作进行总结，主要包括实习校招面经、目标检测、属性识别、人脸聚类、图卷积、不平衡问题等部分。由于21年已转推荐算法，时间原因，温故部分主要是对过去笔记
知乎推荐算法工程师面经分享智能推荐系统算法编程语言机器学习人工智能 java
前言曾三次迈进知乎的大门，面试算法工程师岗位。特整理了一些相关问题供大家研究，并附上了一些大佬的建议供大家参考。面试流程1、自我介绍balabala......2、介绍下协同过滤我大致介绍了下协同过滤的分类，以及每种分类的主要思想以及优缺点。其中提到了LFM，面试官又追问LFM用来解决什么问题，我从降维和回归两个角度来进行解释的。3、介绍下SVD与MF的区别我把SVD++的公式写下来并进行了解释，
算法工程师面经（搜狐、数旦、好未来）李德洋
算法工程师面经2018年3月13日搜狐一面主要问了我硕士期间做的新闻推荐系统是什么，我讲了大约20分钟balabala。然后针对于这个新闻推荐系统提出了一系列的问题：1.你用到了LDA，那么请讲一下LDA的原理是什么？我简单说了一下LDA生成文档的过程，但是根据什么生成没答上来2333（LDA是我的痛，看了几遍没看懂）2.你的新闻的备选集如何获取？选取当天新闻，挨个算一遍。3.也就是说你的计算是现
字节跳动2022年最新面试经验分享，2个部门6轮面试全复盘（算法岗）实训001 超级实习生面试名企实习 java 字节跳动
说起1、2月，绝对算得上求职者的黄金准备期。传说中的金三银四和校园春招都马上要到来了，相信有准备的朋友们已经开始刷题了，今天就为大家分享一篇字节跳动的真实面经：字节电商&垂直策略部nlp算法工程师面经分享第一次面的字节电商下的智能客服组，主要做对话生成，部门的技术涉及到知识图谱以及多轮对话生成。一二面面试官都问得比较深，懂的东西也很多，对单纯的背八股回答不感兴趣，喜欢应试者有自己的思考。三面面试官
非科班转行的2018秋招算法工程师面经：面试实录+人生经验普通网友数据网络技术方法代码
这是一篇不太专业的算法工程师面经，希望能给非科班想要从事机器学习工作的同学或学弟学妹一些建议，同时也回馈给予我很大帮助的咕泡学院。目前拿到的offer有：网易、三星、联想、vivo、斗鱼、拼多多、猎聘等等。面经分为两个部分：虐心面试实录和一点人生经验。先上干货再BB，大家可以针对性的选择自己需要的部分，祝大家最后都能拿到心仪的offer啦。虐心面试实录网易邮件事业部数据挖掘工程师offer整数翻转
Phillweston 自动驾驶决策规划算法面经 Phillweston 算法动态规划
By:Phillweston注：原创链接如下：详细！自动驾驶规划控制算法工程师面经（具体题目+回答思路）本人引用了此链接中的提问内容，并根据自己的想法写了部分回答，回答部分仅供参考。Case1路径规划算法类：Dijstra算法，算法流程初始化检验从所有已标记的点k到其他直接连接的未标记的点j的距离选取下一个点。从所有未标记的点中选取最小的点i，点i被选为最短路径中的一点，并设为已标记的。标记点i。
不平衡之钥: 重采样法何其多 AI算法札记不平衡机器学习深度学习
专栏系列文章-知乎一、职业规划篇职业规划与选择二、算法面经篇枫桦：深度学习算法工程师面经(微软、阿里、商汤、滴滴、华为、海康、平安、陌陌等offer)之上篇枫桦：深度学习算法工程师面经(微软、阿里、商汤、滴滴、华为、海康、…https://zhuanlan.zhihu.com/p/505017083?目录1.概述2.类别平衡重采样3.Scheme-orientedsampling4.参考资料1.概
顺丰科技视觉算法工程师面经分享 julyedu_7 算法深度学习人工智能机器学习 python
问题1：在原地即不使用任何额外的空间复杂度交换两个数。1、相加寄存：a=a+bb=a-ba=a-b2、位运算：b=a^b;a=a^b;b=a^b问题2：模型的方差和偏差是什么，怎么减少bias和var。偏差：描述的是预测值（估计值）的期望与真实值之间的差距。偏差越大，越偏离真实数据.方差：描述的是预测值的变化范围，离散程度，也就是离其期望值的距离。方差越大，数据的分布越分散。Baging减少方差，
科大讯飞提前批算法工程师面经（计算机视觉方向）七月在线大厂AI面试题人工智能机器学习深度学习计算机视觉
1、Pytorch和Tensorflow的区别？图创建创建和运行计算图可能是两个框架最不同的地方。在pyTorch中，图结构是动态的，这意味着图在运行时构建。而在TensorFlow中，图结构是静态的，这意味着图先被“编译”然后再运行。pyTorch中简单的图结构更容易理解，更重要的是，还更容易调试。调试pyTorch代码就像调试Python代码一样。你可以使用pdb并在任何地方设置断点。调试te
算法工程师面经 —— python 面试常问问题青年有志算法工程师面经 python
文章目录☆文章前言85道精品面试题1.什么是解释型语言，什么是编译型语言？2.python的运行过程？3.Python的作用域？4.python的数据结构？5.python可变与不可变类型？6.进程与线程？7.python中的多线程？8.python中的多进程？9.python互斥锁与死锁？10.Lambda?11.python的深拷贝与浅拷贝？12.python多线程是否能用多个CPU？13.p
WWW‘22 推荐系统论文之序列推荐篇 spectre7 推荐算法深度学习机器学习人工智能推荐算法
专栏系列文章-知乎一、算法面经篇枫桦：深度学习算法工程师面经(微软、阿里、商汤、滴滴、华为、海康、平安、陌陌等offer)之上篇枫桦：深度学习算法工程师面经(微软、阿里、商汤、滴滴、华为、海康、平安、陌陌等offer)之下篇二、…https://zhuanlan.zhihu.com/p/505017083WWW2022已公布录用论文，接收323篇/投稿1822篇，录用率为17.7%，完整录用论文列
不平衡之钥: 重加权法知几何 spectre7 不平衡算法人工智能深度学习
专栏系列文章-知乎一、算法面经篇枫桦：深度学习算法工程师面经(微软、阿里、商汤、滴滴、华为、海康、平安、陌陌等offer)之上篇枫桦：深度学习算法工程师面经(微软、阿里、商汤、滴滴、华为、海康、平安、陌陌等offer)之下篇二、…https://zhuanlan.zhihu.com/p/5050170831.概述在《不平衡问题:深度神经网络训练之殇》一文中，笔者已对缓解不平衡问题的方法进行梳理。限
动态权重之多任务不平衡论文 (一) spectre7 不平衡深度学习人工智能神经网络
专栏系列文章-知乎一、职业规划篇职业规划与选择二、算法面经篇枫桦：深度学习算法工程师面经(微软、阿里、商汤、滴滴、华为、海康、平安、陌陌等offer)之上篇枫桦：深度学习算法工程师面经(微软、阿里、商汤、滴滴、华为、海康、…https://zhuanlan.zhihu.com/p/505017083?论文标题:AdaptivelyWeightedMulti-taskDeepNetworkforPe
2022秋招计算机视觉算法工程师面经（旷视、字节、科大讯飞、大华、海康、网易、华为、小米、腾讯、百度、阿里、完美世界、美团、陌陌） lyyy. 算法深度学习计算机视觉人工智能华为
打个小广告~博主签了小米，面试小米请填写我的内推码！！DSYXkPF8可以私信我免费简历指导哈（不过我也比较菜不一定能提出有用的建议）~首先是小建议环节：如果你还有时间，尽量能写出一篇论文，面试的时候很占优势，实在没有时间，看看有没有国际型比赛，拿个前三。再没有时间，那就多刷题多看八股，感觉每个厂对手撕代码环节要求都很高。面了好多厂，好多都忘记写面经，只记录下来这些收到的offer比较少有，太菜了
字节跳动 | 推荐算法工程师面经文文学霸算法编程语言面试推荐系统字节跳动
写在前面作者是研二的学弟，和号主一样都为非科班，但是实力不容小觑，顶住压力早早地在提前批收割了大厂的offer，可以说是「神仙学弟」了，方向为机器学习/数据挖掘/NLP，同时也对推荐系统具有强烈的兴趣，如下仅为部分面经，墙裂欢迎各互联网大佬来撩！作者邮箱：[email protected]字节跳动|推荐算法岗7.2更新，晚上7点终于收到了意向书，不用再反复刷邮箱了～6.23一面面的是搜索
招聘公司提前批算法工程师面经 cigai4477
解优人才网记者风精分享：招聘公司提前批算法工程师面经一面：自我介绍实验室是做什么的？电力系统，跟机器学习没有关系。。怎么自学机器学习的？CS229、小蓝书、西瓜书、葫芦书balabala挑一个比赛介绍一下？C++用了多久？熟悉吗？虚函数和纯虚函数有什么区别？constfunction(const)const，这三个位置的const有什么区别？第三个忘了。。。C++学的太渣SVM熟悉吗？能推导为什么
知乎推荐算法工程师面经 m0_37586850
前言曾三次迈进知乎的大门，面试算法工程师岗位。特整理了一些相关问题供大家研究，并附上了一些大佬的建议供大家参考。面试流程1、自我介绍balabala......2、介绍下协同过滤我大致介绍了下协同过滤的分类，以及每种分类的主要思想以及优缺点。其中提到了LFM，面试官又追问LFM用来解决什么问题，我从降维和回归两个角度来进行解释的。3、介绍下SVD与MF的区别我把SVD++的公式写下来并进行了解释，
【机器学习】知识点汇总 heimu24 机器学习
资源：1、《统计学习方法》代码实现2、吴恩达机器学习课程笔记3、七月在线人工智能面试题4、Datawhale秋招机器学习算法工程师面经5、AI算法工程师手册—华校专6、机器学习十大算法系列—July专栏建议学习顺序：一、基础知识：建议阅读：《统计学习方法》第一章：统计学习方法概论KeyWords：经验风险、结构风险、L1与L2正则化、交叉验证、精确率、召回率ps：1、L1先验服从拉普拉斯分布，L2
360机器学习算法工程师面经那什
面试官是个很温柔的小哥哥，全程把话语权交给你，全程40min问：你能先自我介绍一下吗问：你能给我说说你的项目吗答：balabala问：恩，思路比较清晰，那你能给我说一下xgboost吗？答：xgboost的lossfunctionz加了L2正则以及限制叶子节点数，用到二阶求导，梯度下降更加准确，balabala。。。问：你随遍挑个分类算法原理仔细推导答：那我讲下支持向量机吧，此处省略一千字。。问：
2020春招后端|算法工程师面经 Ghost1898688 面经
@2020春招初探|面经2020春招后端|算法工程师面经由于本人有过一点实习工作经验，所以有一些自己择公司的喜好。坚决不海投，只投把握大的或者自己很喜欢的公司，每一个面试都会精心准备，节省时间成本。参与海外留学生第一次参加正式的招聘（由于留学生毕业时间与国内不同，不同公司对此间毕业招聘有不同政策），由于小壳即将进入毕业尾声，需要赶很多due，所以这一阶段经历过这一段春招之后就会暂停投简历。虽然目前
算法工程师面经整理笔记（一） edj_13 科研小技巧机器学习
整理一下最新的关于大厂算法工程师面试面经经验，主要考察的一般可以分为下面几个模块：数据结构与算法机器学习算法深度学习算法项目经验由于每个人根据自己的专业方向或者研究项目，项目比较丰富，所以主要的整理还是偏重于基础的部分，侧重数据结构与算法、机器学习算法、深度学习算法这些最基础的，对于一般大厂来说还是希望应届生基础扎实，可以根据自己所学的基础知识举一反三，解决未来的一些难题；同时基础扎实、解决能力强
校招面经 XindiOntheWay 秋招之战
某互联网风控部门算法实习生面试苏宁：算法一面非科班转行的2018秋招算法工程师面经：面试实录+人生经验机器学习/算法19家公司面试总结（内含薪资）
牛客网平均水平的算法工程师面经分享牛客网
记录下渣硕的秋招经历，粗略估算大约海投了59家，真正面了9家左右吧，笔试大概也做了几十家吧，目前的情况是拿到了苏宁(准备拒)、好未来(已拒)、百度、腾讯的offer，另外饿了么面了二面，美图面了一面，迅雷10月有面试(已拒)，以上滴滴二面挂第一面开始求职的第一次面试，视频面试，原定的3点45到下午4点30多开始面，一面中规中矩，面试小哥没有为难我，主要是先自我介绍，然后问了一个Java语言的问题(
非科班转行的2018秋招算法工程师面经：面试实录+人生经验 weixin_34167043
原文链接：https://juejin.im/post/59f6ec62f265da4335620afe这是一篇不太专业的算法工程师面经，希望能给非科班想要从事机器学习工作的同学或学弟学妹一些建议，同时也回馈给予我很大帮助的咕泡学院。目前拿到的offer有：网易、三星、联想、vivo、斗鱼、拼多多、猎聘等等。面经分为两个部分：虐心面试实录和一点人生经验。先上干货再BB，大家可以针对性的选择自己需要
网易杭州研发中心-算法工程师面经为什么昵称这么难取面试笔试
前一段看到网易有内推，瞧着这个算法工程师有语音方向，随便投了个，没抱多大期望来着。。毕竟听说网易要求也是很高哒。简历投了大概几天，17号接到短信预约18号面试，我也刚放假回来，而且也不知道算法工程师会问啥，也就没准备，18号11点半这样接到面试电话。一面开始了。上来都不用自我介绍，直接开始问我简历上的项目，问的也是比较细，包括MFCC具体步骤，每个步骤作用是什么，为了描述语音动态特性会做什么处理，
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

树模型集成学习(Tree Embedding)