百面机器学习和百面深度学习-测试1

11
1.特征归一化:
数据的量纲和大小不同会导致数据对模型的影响程度不同,每个特征对模型造成的影响不同。
2.怎么处理类别特征:
(类似于男女之类的类别)one-hot编码

3.什么是组合特征,怎么处理高维组合特征
多个特征组合到一起,高维组合特征进行特征降维为低维特征
4.怎么有效的找到组合特征:
构造决策树来寻找组合特征

5.如何缓解图像分类任务数据量不足?
数据增强,生成对抗网络生成数据
22
1.准确率的局限性:
正负样本数据比重不同时准确率会不准
2.精确率和召回率:
精确率:预测为正是正确的。召回率:预测为正是正确的总的。
PR曲线,以及F1分数

3.平方根误差的意外
RMSE能够很好地反应回归模型预测值与真实值的偏离程度,受到了异常值的影响。

4.在线A/B测试
离线和在线遇到的问题不同,处理可能离线遇不到的问题。
5.过拟合和欠拟合:
过拟合:模型复杂,在训练数据好测试数据不好
欠拟合:在训练和测试数据上都表现不好
6.ROC曲线
横坐标是假阳性率(假的阳性占真正假的),纵坐标是真阳性率(真的阳性占真正的真的)。
7.计算AUC
ROC的面积大小,该值能够量化地反应基于ROC曲线衡量出的模型的性能。
8.余弦相似度:
因为欧式距离在某些情况下不能正确的评判。
机器学习中特征使用向量表示。
余弦定理并不是一个真正的距离计算公式。
9.模型评估中的验证方法:
交叉验证:时间比较久
自助法

10.将低过拟合和欠拟合:
过拟合:降低模型的复杂度,数据增强,dropout,正则化
欠拟合:修改模型,数据增强
11.ROC和PR
ROC是假阳性率和真阳性率
PR是召回率和准确率。
12.超参数调优:
网格搜索,随机搜索,贝叶斯优化算法

33
1.逻辑回归和线性回归
一个是分类一个是回归。损失函数不一样逻辑回归是交叉熵损失,并且是线性回归后加了一个激活函数
2决策树的启发函数
ID3最大信息增益、C4.5最大信息增益比、CART最大基尼指数
4.使用逻辑回归处理多标签
可以使用多个分类器
5.决策树剪枝:
预剪枝和后剪枝

百面深度学习

1.简述卷积的基本操作,并分析其与全连接层的区别
卷积或的特征图的更高层的语义特征。全连接层输出单元和每个输入单元都相连接。卷积局部连接,用一个卷积核权值共享。
2.在卷积神经网络中如何计算各层的感受野的大小:
感受野的大小核步长与卷积核的大小有关。以及上一层的感受野的大小有关
3.分组卷积及其应用场景:
输出通道核输入通道全部相连接,但是分组卷积将它们分开了。在不同计算机上进行训练,对计算机的算力要求较低。
4.空洞卷积的设计思路
在卷积核中加几个空洞,但是增大了感受野。
5.转置卷积
转置卷积主要用于进行上采样
6.可变变形卷积
检测的物体的形状不够规整
7.批归一化。
解决神经网络在参数更新以后原有的数据特征不一致,一般放在激活函数之前或者之后没有一个明确的说法。
8.用于分类的网络的最后几层:
一般是全连接层,但是由于近几年全卷积,使得图片的输入大小可以不同
9.Alexnet第一CNN
Resnet加入了残差网络

66
1.强化学习?使用马尔可夫描述强化学习
强化学习主要是智能体和环境之间的关系。
策略,收益,动作,状态以及状态转移矩阵
2.时序差分和蒙特卡洛强化学习。
前者不是遍历所有状态才更新,是边走边更新后者要全部经历才能更新。
3.策略迭代是找到一个收益最大的策略,价值迭代是维护一个价值表,没有显式的策略
4.Q-learning
维护一个价值表

9
1.单步检测和双步检测
单步快,双步慢,双步对于box要进行对此回归校正,精度高
2.增强小物体的检测
图像增强,增大网络模型的深度,增大感受野
3.

你可能感兴趣的:(面试,面试)