大迷糊1204

【机器学习】某工19级智科专业机器学习期末复习资料

前言：本人是华工19级智科专业的一个小菜鸟，机器学习这门课从我们这一届开始才有考试，因为没有往年的试题可以参考，复习的时候有点摸不着头脑（主要还是因为上课摸鱼，考试前夕才得知老师划的重点；以及老师的PPT实在是太过凌乱，让人理不清逻辑）。
目录主要按照老师ppt的目录来，标有三角符号的为老师划的重点。考察内容侧重理解和把理论如何应用到课设中，so两个课设不能摸鱼……每一个要求都要落实。

19级机器学习试卷内容：

结合SVM课设：
- 监督/非监督
- 系统流程图
- 如何寻优调参（评估）
- 非线性如何处理
- 核函数选择，参数
结合神经网络课设：
- 人工神经网络模型，ReLU的定义
- 网络结构
- 使用什么算法，其流程
- 如何进行网络优化，正则化
其他
- 结合SVM与LR回归目标函数（尤其是损失函数），阐述它们的区别
- 推导 logistic 回归的目标函数
- 随机森林算法流程
- 机器学习三要素；监督学习，非监督学习，强化学习的区别

文章目录

chapter1
chapter2
- - 2.1 机器学习的整体过程
  - 2.2 误差与过拟合
  - - $\triangle$ 过拟合与欠拟合及其策略
  - 2.3 模型选择
  - 2.4 评估方法
  - - $\triangle$ K折交叉验证法
  - 2.5 性能度量
  - - $\triangle$ PR曲线，P和R是什么
    - $\triangle$ ROC曲线
    - $\triangle$ 敏感性，特异性
  - 2.6 比较检验*
  - 2.7 偏差与方差
  - - $\triangle$ 公式推导
chapter3
- - 3.1 基本形式及概念
  - 3.3 $\triangle$ 对数几率回归（Logistic）
  - 3.4 $\triangle$ 线性判别分析 (LDA)
  - 3.5 多分类学习
  - 3.6 $\triangle$ 类别不平衡问题
chapter4
- - - $\triangle$ 近似线性可分问题
    - $\triangle$ 核函数怎么选取
  - 请简述在线性不可分样本中SVM引入核函数的目的，常见的核函数以及它们的使用场景和效果。
  - - $\triangle$ SVM寻优调参
    - $\triangle$ 软间隔SVM
    - $\triangle$ 损失函数对比
    - $\triangle$ SVM 与 logistic 回归的区别
    - 习题
chapter5
- - - $\triangle$ 三要素
  - 5.1 人工神经元模型
  - - $\triangle$ MP神经模型
    - $\triangle$ sigmoid 函数
    - $\triangle$ 修正线性单元 ReLU
  - 5.2 网络结构
  - 5.3 $\triangle$ 前馈神经网络（多层感知机）
  - 5.4 $\triangle$ 反向传播算法（BP）
  - - $\triangle$ 如何跳出局部最小
  - 5.5 优化问题
chapter6
- - 6.1 深度学习初探
  - 6.2 卷积神经网络 CNN
  - - $\triangle$ 卷积层
    - $\triangle$ CNN的典型结构
    - $\triangle$ 残差网络
  - 6.3 循环神经网络 RNN
  - - $\triangle$ CNN与RNN的区别
  - 6.4 网络优化与正则化

chapter1

机器学习（Machine Learning，ML）是指从有限的观测数据中学习（或“猜测”）出具有一般性的规律，并将这些规律应用到未观测样本上的方法。

深度学习是机器学习的一个子问题，其主要目的是从数据中自动学习到有效的特征表示。

深度学习可以使用神经网络，也可以使用其他模型。神经网络的误差反向传播算法可以很好地解决贡献度分配问题（CAP）。

什么是机器学习？

机器学习任务本质上是根据特征判断性质，根据经验解决问题。基本流程是基于数据产生模型，利用模型预测输出。主要研究内容是模型（学习算法）。目标是让模型有较好泛化能力。

机器学习的目标是找到一个模型来近似真实映射函数g(x)或真实条件概率分布 p (y|x)。

由于我们不知道真实的映射函数 g(x) 或条件概率分布 p (y|x) 的具体形式，只能根据经验来确定一个假设函数集合F，称为假设空间(Hypothesis Space)。

然后通过观测其在训练集 D 上的特性，从中选择一个理想的假设(Hypothesis) f∗ ∈F。

假设空间 F 通常为一个参数化的函数族F = {f(x;θ)|θ ∈ Rm}, 其中 f (x; θ) 为假设空间中的模型，θ 为一组可学习参数，m 为参数的数量。

① 假设函数直观理解：对于数据开始是不知道特征的，假设其服从某个函数规律或者某种分布；

② 参数：假设函数中所含有的参数，本质就是学习器模型。学习的过程就是确定参数的过程。

③ 损失函数：为了求参数（确定学习器模型），找到的一个可以衡量模型好坏的度量函数。损失函数是一个非负实数函数，用来量化模型预测和真实标签之间的差异。

④ 最优化过程：让度量函数最大化或者最小化，设计算法，最终确定出参数的过程。最优化与机器学习的交汇点

chapter2

2.1 机器学习的整体过程

数据获取、特征工程、模型选择、模型训练、模型评估、超参数条件、预测

机器学习过程中,通过确定两方面的参数来找到泛化性能最好的函数:

函数参数：也就是我们通常所说的w和b，这类参数可以通过各种最优化算法自动求得;
模型参数：比如多项式回归中的多项式次数,规则化参数入等(即超参数)，一般在模型训练之前通过手工指定（当然也可以采用网格法等算法进行寻优)。

确定模型超参数的过程称为模型选择(从Algorithm选择Models)。

2.2 误差与过拟合

错误率

错误率即错分样本的占比：E = a/m
误差

① 误差：实际预测输出和样本真实输出之间的差异。

② 经验误差 / 训练误差：学习器在训练集上的误差。训练后已知。

③ 测试误差：测试集上的误差。

④ 泛化误差：在新样本上的误差（即未知样本上的，测试误差只是其中一部分）。
- 机器学习的目的是通过现有样本，学习到泛化误差小的预测模型；
- 由于事先并不知道新样本的特征，我们只能努力使经验误差最小化；
- 泛化误差越小越好，而经验误差不一定越小越好，有可能出现过拟合。

$\triangle$ 过拟合与欠拟合及其策略

过拟合与欠拟合
- 过拟合（训练集误差小，测试集误差大）“低偏差，高方差”
  
  学习器把训练样本学习的“太好”，将训练样本本身的特点当做所有样本的一般性质（不考虑数据噪声），导致泛化性能下降。
  
  解决：
  1. 增加训练样本数量
  2. 正则化
  3. 降维
  4. 集成学习方法
  5. 减少模型复杂度
- 欠拟合（训练集测试集误差均大）“高偏差，低方差”
  对训练样本的一般性质尚未学好。
  
  解决：
  1. 添加新特性
  2. 增加模型复杂度
  3. 减小正则化系数
  决策树:拓展分支
  神经网络:增加训练轮数

2.3 模型选择

多候选模型泛化误差进行评估，选择泛化误差最小的模型

2.4 评估方法

前提：假设测试样本是从样本真实分布中独立同分布采用得到。

原则：测试集与训练集互斥（互不含有共同样本）

留出法
- 直接将数据集划分为两个互斥集合
- 训练/测试集划分要尽可能保持数据分布的一致性
- 一般若干次随机划分、重复实验取平均值
- 训练/测试样本比例通常为2:1~4:1

$\triangle$ K折交叉验证法

k折交叉验证法

将数据集分层采样划分为k个大小相似的互斥子集，每次用k-1个子集的并集作为训练集，余下的一个子集作为测试集，最终返回k个测试结果的均值，k最常用的取值是10.

特例 - 留一法（每次只留下一个样本）
自助法
- 留出法和交叉验证法都是采用分层采样的方式进行采样
- 自助法使用有放回的重复采样的方式进行采样
- 从初始数据集中产生多个不同的训练集，对集成学习有很大的好处
- 对于那些数据集小、难以有效划分训练/测试集时很有用，但是由于该方法改变了数据的初始分布导致会引入估计偏差
总结
- 对于数据量充足的时候，通常采用留出法或者 k 折交叉验证法来进行训练/测试集的划分；
- 对于数据集小且难以有效划分训练/测试集时使用自助法；
- 对于数据集小且可有效划分的时候最好使用留一法来进行划分，因为这种方法最为准。

2.5 性能度量

性能度量是衡量模型泛化能力的评价标准，反映了任务需求；使用不同的性能度量往往会导致不同的评判结果

回归模型
- 均方误差
分类模型
- 错误率：分类错误的占总样本的比例
- 精度（准确率）：分类正确的占总样本的比例
- 查全率、查准率
  
  准确率是所有类别整体性能的平均，如果希望对每个类都进行性能估计，就需要计算查准率和查全率
  - 查准率（precision）：预测出来的正例中正确的比例。（竖）
  - 查全率（recall）：正例被预测出来的比例。（横）

$\triangle$ PR曲线，P和R是什么

PR曲线

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZAq1AkDL-1640596268110)(C:\Users\lenovo.LAPTOP-MVJJVS9E\AppData\Roaming\Typora\typora-user-images\image-20211225215844789.png)]$
两条曲线有交叉时难以判断面积大小，通过以下方法度量分类器性能：

BEP法

（0,0）到（1,1）直线与PR曲线的交点，即 “ 查全率 = 查准率 ” 时的取值。

F度量

$\triangle$ ROC曲线

ROC曲线 / AUC

横轴：假阳性率 $FPR=\dfrac{FP}{FP+TN}$ 纵轴：真阳性率（查全率） $TPR=\dfrac{TP}{TP+FN}$

理想点为（0,1）

若某个学习器的ROC曲线被另一个学习器的曲线“包住”，则后者性能优于前者；

否则如果曲线交叉，可以根据ROC曲线下面积大小进行比较，也即AUC值.

AUC衡量了样本预测的排序质量。

作用：(1) 选择最佳的学习器模型、舍弃次佳的模型。 (2) 在同一模型中设定最佳阈值。

在做决策时，ROC 分析能不受成本／效益的影响，给出客观中立的建议

$\triangle$ 敏感性，特异性

查准率 P：预测出来的正例中正确的比例。 $P=\dfrac{TP}{TP+FP}$
查全率 R：正例被预测出来的比例。 $R=\dfrac{TP}{TP+FN}$
真阳性率 TPR：正例被预测出来的比例。 $TPR=\dfrac{TP}{TP+FN}=R$
假阳性率 FPR：负例被检测错误的比例（误诊）。 $FPR=\dfrac{FP}{FP+TN}$
真阴性率 TNR：负例被预测出来的比例。 $TNR=\dfrac{TN}{TN+FP}$
假阴性率 FNR：正例被检测错误的比例（漏诊）。 $FNR=\dfrac{FN}{FN+TP}$
敏感性：正例被检测出来的比例 $Sn=\dfrac{TP}{TP+FN}=TPR=1-FNR$
特异性：负例被检测出来的比例 $Sp=\dfrac{TN}{TN+FP}=TNR=1-FPR$

2.6 比较检验*

PAC理论，归纳偏好，NFL理论（不懂老师为啥把这几个理论放在这个地方，我赌它不考嘿嘿，占个坑证明我知道有这玩意）
两个学习器比较
- 交叉验证 t 检验
- McNemar 检验
多个学习器比较
- Friedman检验 + Nemenyi检验（我堵它不考）

2.7 偏差与方差

偏差体现了学习器预测的准确度，而方差体现了学习器预测的稳定性。通过对泛化误差的进行分解，可以得到：

期望泛化误差 = 方差 + 偏差

$\triangle$ 公式推导

偏差度量了学习算法期望预测与真实结果的偏离程度；即刻画了学习算法本身的拟合能力；
方差度量了同样大小训练集的变动所导致的学习性能的变化；即刻画了数据扰动所造成的影响，体现学习器的稳定性。
噪声表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界；即刻画了学习问题本身的难度。

偏差（bias）可以看成模型预测与真实样本的差距，想要得到 low bias，就得复杂化模型，但是容易造成过拟合。方差（variance）可以看成模型在测试集上的表现，想要得到 low variance，就得简化模型，但是容易造成欠拟合。实际应用中，偏差和方差是需要权衡的。若模型在训练样本和测试集上都表现的不错，偏差和方差都会比较小，这也是模型比较理想的情况。

chapter3

3.1 基本形式及概念

基本形式： $f(x)=w_{1}x_{1}+w_{2}x_{2}+\dots+w_{d}x_{d}+b$

$x$ ：属性描述的示例， $x_{i}$ ：是 x 在第 i 个属性上的取值.

向量形式： $f(x)=w^{T}x+b$

$w=(w_{1},w_{2},\dots,w_{d})$
优点
- 形式简单、易于建模
- 可解释性
- 非线性模型的基础
- 引入层级结构或高维映射
目的

试图学得一个线性模型以尽可能准确地预测实值输出标记
模型求解

均方误差最小化：最小二乘法
- 假设只有一个属性
- 多元线性回归

3.3 $\triangle$ 对数几率回归（Logistic）

广义线性模型

逼近单调可微函数 g(·) ，则有：
$y=g^{-1}(w^Tx+b)$
二分类任务： $z=w^{T}x+b$

如何将分类标记与线性回归模型连接起来？
$y=\left\{ \begin{aligned} 0, z<0 \\ 0.5, z=0\\ 1, z>0 \end{aligned} \right.$
单位阶跃函数是一个不错的选择！

但是 – 阶跃函数不连续 -_- II 因此需要寻找一个单调可微的近似函数
Logistics 函数

是一种sigmoid 函数
$y=\dfrac{1}{1+e^{-z}}$
$ln\dfrac{y}{1-y}=w^T+b$
- 模型求解（占坑）
  - 最大似然法
  - 凸优化理论
  - 经典数值优化算法
    - 梯度下降法
    - 牛顿法
    - 共轭梯度法

3.4 $\triangle$ 线性判别分析 (LDA)

类内间距小，类间间距大

详见模式识别课本

3.5 多分类学习

一对多

C个判别函数
一对一

$\dfrac{C(C-1)}{2}$ 个判别函数

3.6 $\triangle$ 类别不平衡问题

chapter4

$\triangle$ 近似线性可分问题

$\triangle$ 核函数怎么选取

请简述在线性不可分样本中SVM引入核函数的目的，常见的核函数以及它们的使用场景和效果。

答： ① 我们遇到线性不可分的样例时，常用做法是把样本特征映射到高维空间中去。但是遇到线性不可分的样本，一律映射到高维空间，那么这个维度大小是会高到令人恐怖的。此时，核函数就体现出它的价值了，核函数的价值在于它虽然也是将特征进行从低维到高维的转换，但核函数好在它在低维上进行计算，而将实质上的分类效果（利用了内积）表现在了高维上，这样避免了直接在高维空间中的复杂计算，真正解决了SVM线性不可分的问题。

② 事实上，核函数的研究非常的早，要比SVM出现早得多，当然，将它引入SVM中是最近二十多年的事情。对于从低维到高维的映射，核函数不止一个。

1) **线性核函数（Linear Kernel）**适用于线性可分的样本集上，分类效果良好：

$\triangle$ SVM寻优调参

网格搜索
交叉验证
启发式算法

……

$\triangle$ 软间隔SVM

[【机器学习】支持向量机——软间隔（SVM中篇）_慕课手记 (imooc.com)](https://www.imooc.com/article/266377#:~:text=软间隔是相对于硬间隔定义的。上节中介绍的线性可分的SVM算法，属于硬间隔。硬间隔,，就是存在所有样本必须划分正确的约束条件，即所有样本必须严格满足：所以从这个角度分析，上篇介绍的算法，是在硬间隔定义的基础之上推导的。)

$\triangle$ 损失函数对比

$\triangle$ SVM 与 logistic 回归的区别

logistic
- 输出具有自然的概率意义，再给出预测标记的同时给出了概率意义
- 可以直接用于多分类任务
- 损失函数是光滑的单调函数，其解依赖于更多训练样本，预测开销更大。
- Logistic回归目标函数是最大化后验概率
SVM
- 输出不具概率意义，要得到概率输出需要进行特殊处理
- 不能直接用于多分类，需要进行推广
- hinge损失具有一块“平坦”的零区域，使得SVM的解具有稀疏性
- SVM可以实现结构风险最小化
- SVM可以有效避免模型过拟合

联系：
1、LR和SVM都可以处理分类问题，且一般都用于处理线性二分类问题（在改进的情况下可以处理多分类问题）
2、两个方法都可以增加不同的正则化项，如L1、L2等等。所以在很多实验中，两种算法的结果是很接近的。
区别：
1、LR是参数模型，SVM是非参数模型。
2、从目标函数来看，区别在于逻辑回归采用的是Logistical Loss，SVM采用的是hinge loss.这两个损失函数的目的都是增加对分类影响较大的数据点的权重，减少与分类关系较小的数据点的权重。
3、SVM的处理方法是只考虑Support Vectors，也就是和分类最相关的少数点，去学习分类器。而逻辑回归通过非线性映射，大大减小了离分类平面较远的点的权重，相对提升了与分类最相关的数据点的权重。
4、逻辑回归相对来说模型更简单，好理解，特别是大规模线性分类时比较方便。而SVM的理解和优化相对来说复杂一些，SVM转化为对偶问题后,分类只需要计算与少数几个支持向量的距离,这个在进行复杂核函数计算时优势很明显,能够大大简化模型和计算。
5、Logic 能做的 SVM能做，但可能在准确率上有问题，SVM能做的Logic有的做不了。

答案来源：机器学习常见面试问题（一）

10.LR与线性回归的区别与联系？

@nishizhen
个人感觉逻辑回归和线性回归首先都是广义的线性回归，
其次经典线性模型的优化目标函数是最小二乘，而逻辑回归则是似然函数，
另外线性回归在整个实数域范围内进行预测，敏感度一致，而分类范围，需要在[0,1]。逻辑回归就是一种减小预测范围，将预测值限定为[0,1]间的一种回归模型，因而对于这类问题来说，逻辑回归的鲁棒性比线性回归的要好。
@乖乖癞皮狗：逻辑回归的模型本质上是一个线性回归模型，逻辑回归都是以线性回归为理论支持的。但线性回归模型无法做到sigmoid的非线性形式，sigmoid可以轻松处理0/1分类问题。

svm 的损失函数折叶损失（hinge loss）是针对样本的标记类别之外的其他类别进行损失计算的，也就是说标记类别不计入损失，其他类别计算损失并累加作为某个样本的损失。而softmax的损失函数交叉熵损失（cross-entropy loss）只跟某个样本的标记类别相关，根据该标记类别的概率计算损失值，而不考虑标记类别之外的其他类别。从上面的公式就可以得出这个结论。

习题

1.简述svm原理：

svm是一种二分类模型，基本思想是寻找能够正确划分训练集数据并且间隔最大的分离超平面。（间隔最大是它有别于感知机）

（1）当训练样本线性可分时，通过硬间隔最大化，学习一个线性分类器，即线性可分支持向量机；

（2）当训练数据近似线性可分时，引入松弛变量，通过软间隔最大化，学习一个线性分类器，即线性支持向量机；

（3）当训练数据线性不可分时，通过使用核技巧及软间隔最大化，学习非线性支持向量机。

注：以上各SVM的数学推导应该熟悉：硬间隔最大化（几何间隔）—学习的对偶问题—软间隔最大化（引入松弛变量）—非线性支持向量机（核技巧）。

2.SVM为什么采用间隔最大化？

一方面，分离超平面有无穷个，但是间隔最大的分离超平面只有一个，因此解是唯一的；另一方面，间隔最大的分离超平面对于未知实例的泛化能力最强。

3.为什么引入核函数？

当样本在原始空间线性不可分的时候，可以将样本从原始空间映射到更高维的特征空间，使得样本在这个特征空间内线性可分。引入映射后的对偶问题：

在学习预测中，只定义核函数K(x,y)，而不是显式的定义映射函数ϕ。因为特征空间维数可能很高，甚至可能是无穷维，因此直接计算ϕ(x)·ϕ(y)是比较困难的。相反，直接计算K(x,y)比较容易（即直接在原来的低维空间中进行计算，而不需要显式地写出映射后的结果）。

核函数的定义：K(x,y)=<ϕ(x),ϕ(y)>，即在特征空间的内积等于它们在原始样本空间中通过核函数K计算的结果。

除了 SVM 之外，任何将计算表示为数据点的内积的方法，都可以使用核方法进行非线性扩展。

4、样本失衡会对SVM的结果产生影响吗？

答：会，超平面会靠近样本少的类别。因为使用的是软间隔分类，而如果对所有类别都是使用同样的惩罚系数，则由于优化目标里面有最小化惩罚量，所以靠近少数样本时，其惩罚量会少一些。比如：假设理想的分隔超平面是大样本中有很多数据到该超平面的函数距离是小于1的，而小样本中是只有少数样本的函数距离小于1的。但是由于惩罚系数相同，实际算法得到的超平面会往小样本数据靠近。

样本失衡的解决办法：

1)、对多数类和和少数类采用不同的惩罚因子，对正例和负例赋予不同的C值，例如正例远少于负例，则正例的C值取得较大，这种方法的缺点是可能会偏离原始数据的概率分布；

2)、对训练集的数据进行预处理即对数量少的样本以某种策略进行采样，增加其数量或者减少数量多的样本，典型的方法如：随机插入法，缺点是可能出现 overfitting，较好的是：Synthetic Minority Over-sampling TEchnique(SMOTE)，其缺点是只能应用在具体的特征空间中，不适合处理那些无法用特征向量表示的问题，当然增加样本也意味着训练时间可能增加；

3)、基于核函数的不平衡数据处理。

5.核函数如何选取？

在选用核函数的时候，如果我们对我们的数据有一定的先验知识，就利用先验来选择符合数据分布的核函数；如果不知道的话，通常使用交叉验证的方法，来试用不同的核函数，误差最小的即为效果最好的核函数，或者也可以将多个核函数结合起来，形成混合核函数。在吴恩达的课上，也曾经给出过一系列的选择核函数的方法：

如果特征的数量大到和样本数量差不多，则选用LR或者线性核的SVM；

如果特征的数量小，样本的数量正常，则选用SVM+高斯核函数；

如果特征的数量小，而样本的数量很大，则需要手工添加一些特征从而变成第一种情况（选用LR或者线性核的SVM是为了避免造成庞大的计算量）。

6.SVM怎么防止过拟合 ?

引入松弛变量：

7.svm优缺点？

优点：适用于高维数据；能够处理非线性特征之间的相互作用；无需依赖整个数据，只依赖于支持向量；

占用内存小，泛化能力好。

缺点：当观测样本很多时，效率并不是很高；有时候很难找到一个合适的核函数

chapter5

$\triangle$ 三要素

决定人工神经网络特性的三大要素：

• 激励函数：神经元不同数学模型主要区别在于不同的激励函数，反应输出与激活状态关系的函数

• 拓扑结构：分布式存储记忆、分布式信息处理、高度互连性、高度并行性和结构可塑性。

• 学习算法（学习规则，训练规则，训练算法）：通过学习训练，不断改变网络连接权值以及拓扑结构，使得网络输出接近期望输出。本质是：可变权值的动态调整

5.1 人工神经元模型

人工神经元（Artificial Neuron），简称神经元（Neuron），是构成神经网络的基本单元，其主要是模拟生物神经元的结构和特性，接受一组输入信号并产出输出。

$\triangle$ MP神经模型

结合M-P模型示意图来看，对于某一个神经元j，它可能接受同时接受了许多个输入信号，用χi表示。

由于生物神经元具有不同的突触性质和突触强度，所以对神经元的影响不同，我们用权值ωij来表示，其大小则代表了突出的不同连接强度。

θj表示为一个阈值（threshold），或称为偏置（bias），超过阈值为兴奋，低于是抑制。

由于累加性，我们对全部输入信号进行累加整合，相当于生物神经元中的膜电位（水的变化总量），其值就为：

激活函数
为了增强网络的表示能力和学习能力，激活函数需要具备以下几点性质：
1. 连续并可导（允许少数点上不可导）的非线性函数。可导的激活函数可以直接利用数值优化的方法来学习网络参数。
2. 激活函数及其导函数要尽可能的简单，有利于提高网络计算效率。
3. 激活函数的导函数的值域要在一个合适的区间内，不能太大也不能太小，否则会影响训练的效率和稳定性。

$\triangle$ sigmoid 函数

一类S型曲线函数，为两端饱和函数

Logistic
Tanh

Tanh函数可以看作是放大并平移的Logistic函数，其值域是(−1, 1)。

非零中心化的输出会使得其后一层的神经元的输入发生偏置偏移，并进一步使得梯度下降的收敛速度变慢。
Hard-Logistic 和 Hard-Tanh

这两个激活函数计算开销大，可以使用分段函数近似

$\triangle$ 修正线性单元 ReLU

斜坡函数

优点：计算更加高效；具有很好的稀疏性；在一定程度上缓解了神经网络的梯度消失问题，加速梯度下降的收敛速度。

缺点：输出是非零中心化的，给后一层的神经网络引入偏置偏移，会影响梯度下降的效率；

死亡ReLU问题。

带泄露的ReLU
带参数的ReLU
ELU
softplus
Swish函数
Maxout单元

5.2 网络结构

前馈网络
反馈网络（有记忆）
图网络

5.3 $\triangle$ 前馈神经网络（多层感知机）

前馈网络：神经元之间不存在同层连接也不存在跨层连接，即网络中无环或者回路。

每层神经元与下一层神经元之间完全互连

神经元之间不存在同层连接

神经元之间不存在跨层连接

多层前馈网络有强大的表示能力，只需一个包含足够多神经元的隐层 , 多层前馈神经网络就能以任意精度逼近任意复杂度的连续函数。

5.4 $\triangle$ 反向传播算法（BP）

推导过程见模式识别PPT

链式法则

$\triangle$ 如何跳出局部最小

以多组不同参数值初始化多个神经网络，按标准方法训练，迭代停止后，取其中误差最小的解作为最终参数。
模拟退火
使用随机梯度下降，即在计算梯度时加入了随机因素，使得在局部最小时，计算的梯度仍可能不为0，从而迭代可以继续进行。
遗传算法

5.5 优化问题

非凸优化问题
梯度消失问题

由于Sigmoid型函数的饱和性，饱和区的导数更是接近于0。这样，误差经过每一层传递都会不断衰减。当网络层数很深时，梯度就会不停的衰减，甚至消失，使得整个网络很难训练。这就是所谓的梯度消失问题（Vanishing Gradient Problem），也叫梯度弥散问题。

在深层神经网络中，减轻梯度消失问题的方法有很多种。一种简单有效的方式是使用导数比较大的激活函数，比如ReLU等。

其他

如何设置隐层神经元的个数仍然是个未决问题. 实际应用中通常使用“试错法”调整
深度学习

chapter6

6.1 深度学习初探

深度学习 ≠ 神经网络

深度学习是机器学习的一个子问题，其主要目的是从数据中自动学习到有效的特征表示。

深度学习可以使用神经网络，也可以使用其他模型。神经网络的误差反向传播算法可以很好地解决贡献度分配问题（CAP）。

6.2 卷积神经网络 CNN

全连接前馈神经网络
- 权重矩阵的参数多
- 很难提取局部不变特征（如缩放，平移，旋转等不影响其语义特征）
卷积神经网络
- 一种前馈神经网络
- 局部连接，权重共享，空间或时间上次采样
- 滑步步长 S , 零填充 P
- 类型
  
  卷积的结果按输出长度不同可以分为三类：
  窄卷积：步长 = 1 ，两端不补零 = 0 ，卷积后输出长度为 − + 1
  宽卷积：步长 = 1 ，两端补零 = − 1 ，卷积后输出长度 + − 1
  等宽卷积：步长 = 1 ，两端补零 =( − 1)/2 ，卷积后输出长度
- 卷积操作的目标：提取特征。
- 特征映射（Feature Map）：图像经过卷积后得到的特征。
- 卷积核看成一个特征提取器

$\triangle$ 卷积层

输入：D个特征映射 M×N×D
输出：P个特征映射 M′×N′×P

汇聚层
- 卷积层虽然可以显著减少连接的个数，但是每一个特征映射的神经元个数并没有显著减少。
- 汇聚层的作用是进行特征选择，降低特征数量，并从而减少参数数量。

$\triangle$ CNN的典型结构

一个卷积块为连续M 个卷积层和b个汇聚层（M通常设置为2 ∼ 5，b为0或1）。一个卷积网络中可以堆叠N 个连续的卷积块，然后在接着K 个全连接层（N 的取值区间比较大，比如1 ∼ 100或者更大；K一般为0 ∼ 2）。

$\triangle$ 残差网络

残差网络（ResNet）是通过给非线性的卷积层增加直连边的方式来提高信息的传播效率。

假设在一个深度网络中，我们期望一个非线性单元（可以为一层或多层的卷积层）f(x,θ)去逼近一个目标函数为h(x)。

残差单元由多个级联的（等长）卷积层和一个跨层的直连边组成，再经过ReLU激活后得到输出。
残差网络就是将很多个残差单元串联起来构成的一个非常深的网络。
残差网络与普通网络的区别

普通卷积网络：在网络层数加深的时候，会出现梯度消失问题，精度下降。

而残差网络：

假定某段神经网络的输入是x，期望输出是H(x)。

如果已经学习到较饱和的准确率（或者当发现下层的误差变大时），那么接下来的学习目标就转变为恒等映射的学习，也就是使输入x近似于输出H(x)，以保持在后面的层次中不会造成精度下降。

在上图的残差网络结构图中，通过“shortcut connections（捷径连接）”的方式，直接把输入x传到输出作为初始结果，输出结果为H(x)=F(x)+x，当F(x)=0时，那么H(x)=x，也就是上面所提到的恒等映射。

于是，ResNet相当于将学习目标改变了，不再是学习一个完整的输出，而是目标值H(X)和x的差值，也就是所谓的残差F(x) := H(x)-x，因此，后面的训练目标就是要将残差结果逼近于0，使到随着网络加深，准确率不下降。

这种残差跳跃式的结构，打破了传统的神经网络n-1层的输出只能给n层作为输入的惯例，使某一层的输出可以直接跨过几层作为后面某一层的输入，其意义在于为叠加多层网络而使得整个学习模型的错误率不降反升的难题提供了新的方向。

至此，神经网络的层数可以超越之前的约束，达到几十层、上百层甚至千层，为高级语义特征提取和分类提供了可行性。

6.3 循环神经网络 RNN

循环神经网络通过使用带自反馈的神经元，能够处理任意长度的时序数据

优点：
引入记忆
图灵完备
缺点：
长程依赖问题
记忆容量问题
并行能力

$\triangle$ CNN与RNN的区别

区别就在循环层上。

卷积神经网络没有时序性的概念，不考虑数据之间的关联性；每次的输入都是独立的，网络的输出只和当前时刻的输入有关；

循环神经网络具有时序性，当前决策跟前一次决策有关。

相同点：
传统神经网络的扩展；
前向计算产生结果，反向计算模型更新；
每层神经网络横向可以多个神经元共存，纵向可以有多层神经网络连接。

不同点：
CNN空间扩展，神经元与特征卷积；RNN时间扩展，神经元与多个时间输出计算；
RNN可以用于描述时间上连续状态的输出，有记忆功能，CNN用于静态输出；
CNN高级100+深度，RNN深度有限。

6.4 网络优化与正则化

优化：风险最小化正则化：降低模型复杂度

网络优化

难点：
- 结构差异大
- 非凸优化
- 梯度消失 / 爆炸
正则化

你可能感兴趣的:(专业课程学习,机器学习,人工智能)

python学习路线（从菜鸟到起飞）突突突然不会编了 python 学习开发语言
以下是基于2025年最新技术趋势的Python学习路线，综合多个权威资源整理而成，涵盖从零基础到进阶应用的全流程，适合不同学习目标（如Web开发、数据分析、人工智能等）的学习者。路线分为基础、进阶、实战、高级、方向拓展五个阶段，并附学习资源推荐：一、基础阶段（1-2个月）目标：掌握Python核心语法与编程思维，熟悉开发环境。环境搭建安装Python3.10+，配置PyCharm或VSCode开发
幻颜秀秀官方邀请口令131314，专注短视频变现平台！荟聚时刻
幻颜秀秀是一个专注短视频变现的平台，不管你有没有短视频的经验，注册幻颜秀秀以后就可以使用幻颜秀秀来赚佣金，幻颜秀秀是一个专业的短视频各种玩法变现工具。很多人第一次接触幻颜秀秀不知道幻颜秀秀邀请口令是什么，其实幻颜秀秀的官方邀请口令是131314，如何我们要制作各种视频玩法，我们打开幻颜秀秀APP输入幻颜秀秀口令，就可以轻松制作同款视频。幻颜秀秀注册步骤，扫描下方二维码注册幻颜秀秀官方邀请口令131
《IP思维》48 农牧学堂一付海涛
《IP思维》（第48节）＃学习《IP思维》助你躺赢未来＃用户对于某些品类的认知天生就很低、决策链路长且复杂，这时，就需要专家IP，向用户传递品类相关的专业知识。对于专业人士，用户天然容易产生信任感。在决策购买前，让用户觉得专家是可靠的，是专业的，是值得信赖的，进而将这份信任关系转移到品牌上，从而购买产品；在决策购买后，通过专业知识，增进私域价值感，延长用户留存率，拉长生命周期价值。农牧行业很多产品
单片机智能衣柜论文，仅供参考 Believe Y python
大连东软信息学院毕业设计（论文）论文题目：单片机智能衣柜学院：智能与电子工程学院专业：智能科学与技术学生姓名：周成彬学生学号：19003170203指导教师：王宏波韩媞导师职称：讲师副教授完成日期：2023年4月22日大连东软信息学院DalianNeusoftUniversityofInformation基于单片机的智能衣柜摘要尽管传统的衣橱能够很好地满足储藏衣物的需求，但是因为衣橱的作用很简单，
科普有关clean厂黑水鬼是不是最好的奢侈品总汇1
大家好，我是广城腕表，一个专注腕表知识的爱好者，不定时更新腕表真假对比，拆解评测以及视频解说，学会用专业知识了解腕表的好与坏，让您在玩表之路不入坑，本期给大家说说clean厂黑水鬼是不是最好的。重要提醒→买大厂手表联系方式看文章底部市面上做黑水鬼的厂家数不胜数，但是做的最好的目前还是clean厂，今天给大家带来的依旧是C厂的劳力士黑水鬼，关于这个厂前面文章都有介绍过，这里就不多说了，水鬼一直都是热
使用高精度IMU对无人机系统有何提升？ Yuroo zhou IMU 无人机机器学习嵌入式实时数据库算法嵌入式硬件
在无人机自主飞行的核心技术链条中，惯性测量单元（IMU）的精度与可靠性直接决定了整机的控制上限。高精度IMU对无人机系统的提升是全方位的，尤其在导航精度、稳定性、自主性和可靠性等关键性能方面。它通常是实现专业级和工业级无人机应用的核心传感器之一。**技术内核：高精度与小型化的完美平衡**ER-MIMU-063以38.6mm×44.8mm×25.5mm的超小尺寸和≤70g的轻量化设计，能完美适配各类
口红排行榜前十名是谁口红排行榜前10名高端品牌有哪些优惠券高省
经专业评测的2023年口红十大品牌名单发布啦！居前十的有：Dior迪奥、CHANEL香奈儿、YSL圣罗兰美妆、GIORGIOARMANI、TOMFORD汤姆福特、Givenchy纪梵希、ChristianLouboutin、M.A.C魅可、LANCOME兰蔻、EsteeLauder雅诗兰黛等，上榜口红十大品牌榜单和著名口红品牌名单的是口碑好或知名度高、有实力的品牌，排名不分先后，仅供借鉴参考，想知
洛阳16家亲子鉴定机构中心地址一览（附2024年鉴定中心地址）国医基因李主任
洛阳亲子鉴定机构中心地址在哪里？在洛阳做亲子鉴定肯定到自己所居住地区的亲子鉴定中心做比较好，出行方便。知识大有用，专家在身边，洛阳国医基因，为您提供专业的DNA亲子鉴定知识与咨询服务。地址位于：洛阳市涧西区景华路24号。其中个人亲子鉴定收费标准为2200-2600元左右一次，司法亲子鉴定收费标准为2400-3600元一次，无创亲子鉴定收费标准为4500-5000元一次；洛阳16家亲子鉴定机构中心地
长沙正规亲子鉴定办理-亲子鉴定中心地址大全（附2024年更新办理流程攻略）中量国鉴知识科普
在生活中，亲子鉴定有时成为解开疑惑、确认亲缘关系的关键需求。当身处长沙这座繁华都市，人们常常会困惑：长沙正规亲子鉴定在哪里可以办理呢？毕竟，亲子鉴定是一件严肃且重要的事情，需要专业、可靠的机构来进行操作。选择正规的亲子鉴定机构，不仅关乎结果的准确性，更涉及到个人隐私的保护和法律的权威性。那么，让我们一同来探寻长沙那些可以放心办理亲子鉴定的地方。长沙亲子鉴定在哪里可以办理？长沙亲子鉴定可以到“长沙中
丽江无创胎儿亲子鉴定机构大全共8家(附亲子鉴定细目) 中检国权有限公司
丽江地区的胎儿亲子鉴定服务，推荐选择正规且专业的鉴定机构，如丽江中量鉴证中心。虽然具体地址可能因机构更新或调整而有所变化，但一般而言，您可以通过官方渠道或联系丽江中量鉴证中心进行咨询以获取最新、最准确的机构地址信息。通常，丽江中量鉴证中心会提供专业的胎儿亲子鉴定服务，包括无创胎儿亲子鉴定。无创胎儿亲子鉴定适用于怀孕五周以上的孕妇，通过采集孕妇的15ml外周血作为胎儿的DNA样本，再与疑似父亲的血液
2023-05-27 花开生两面
投射我儿读书明理，修身做人，每天阳光快乐，情绪平和稳定，越来越会调节自己的情绪和压力。投射我儿对家人、他人、社会都常怀一颗感恩之心，是一个暖心的男子汉。投射我儿对自己未来人生规划清晰，建立学习中短期目标，并为此不断努力。投射我儿生活、学习自律，扎实打好各学科基础，大二下学期的期末总绩点能进入本专业年级前15名，拿到保研资格。投射我儿大学期间交到一两位充满正能量的知心好友。投射我儿和3位新舍友能互帮
Roslyn 的兴起 AI云栈
原文地址：https://msdn.microsoft.com/magazine/732ddd02-d67b-447e-a400-ec8c1e94b58c过去数年来，各类计算机专业人员、思想领导者和专家倡导将域特定语言(DSL)的概念作为研究软件问题解决方案的一种方法。如果“临时用户”可以使用DSL语法在系统中调整和修改业务规则，这种方法似乎尤其适用。这对许多开发人员来说是软件的“圣杯”—构建在业
2019-06-06 906bbbe1730f
尊敬的李老师，智慧的教授，亲爱的跃友们，大家晚上好！我是来自临沂永林木业的姜秀萍，今天是我日精进分享的第180天，给大家分享我今天的进步，每天进步一点点，距离成功便不远。比学习好好学好数学，计算，口算，培养孩子的同时，也锻炼了自己，会给自己的工作带来帮助。比改变我变了，世界就变了，虚心学习，从内而外，提高自身素养，和专业技能。比付出承担才会成长，付出才会杰出，只要努力付出，定会在将来的某一天收获成
营口市10家合法正规亲子鉴定中心地址大全（附2024年鉴定地址汇总）国医基因吴主任
营口市哪里能办理亲子鉴定？这是有亲子鉴定需求的营口市民比较关心的问题，为了方便快捷找到营口市亲子鉴定机构地址，小编专业整理了营口市亲子鉴定机构名单供您参考，共有10家正规鉴定机构，排名不分先后，内容仅供参考。另外，需注意并非所有正规鉴定所都可以做亲子鉴定，还要看其业务范围来决定。营口市正规亲子鉴定咨询机构地址1、营口国医基因亲子鉴定中心营口国医基因亲子鉴定咨询中心地址：营口市站前区建设街89号营口
一日二三事 _浅墨_
今天休息了一天，感觉还不错。因为连着加班一周，很累，今天就一直睡到上午十点半才自然醒。醒来后读了会儿电子书，然后做饭吃饭，午后看了一会儿YouTube上介绍月球的几个短视频，而后又小憩一会儿，直到下午四点脑袋才有彻底清醒过来。脑袋清醒后，读了一个小时多一点的专业书，感觉甚好，因为我发现以前理解不了的东西突然明了了。随着年龄增长，人的理解能力也会变强，这个时候再去学以前理解不了的东西就会容易一些。这
揭秘低调却成就富豪的行业奇迹高省飞智导师
在我们日常生活中，经常可以发现一些不起眼的行业，但它们却能够在悄无声息中赚取丰厚的利润。特别是这5个行业，看似不起眼，但利润很不错。一、药品销售。药品销售行业，是一个利润空间极大的领域。虽然药品销售行业竞争激烈，但只要具备一定实力和专业知识，就能够在市场中占据一席之地。此外，随着人们生活水平的提高，越来越多的人开始关注健康和保健，药品需求也日益增加。因此，药品销售行业仍然具有很大的发展潜力。二、有
京东零售重磅开源 | OxyGent：像搭乐高一样组装AI团队，实现群体智能京东零售技术零售开源人工智能
京东零售Oxygen团队正式开源发布多智能体协作框架——OxyGent。这一创新框架致力于帮助开发者高效组装多智能体协作系统，实现智能体间的无缝协作、弹性扩展与全链路可追溯。推动人工智能从“单点突破”迈向“群体智能”时代。OxyGent已在开源社区正式上线。开源地址：https://github.com/jd-opensource/OxyGent官网地址：https://oxygent.jd.co
具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
安全重于泰山任娟
为了促进我校班主任团队的专业成长，切实提高班主任管理工作的艺术水平，保障学生在校安全。6月11日下午6:20，我校德育处组织小学部全体班主任在阶梯教室召开会议。这次会议的主题是“班主任工作如何做”。各年级根据学段特点确定研讨主题:一年级研讨内容:学生课间玩耍安全。二年级研讨内容:学生离,返校安全。三年级研讨内容:学生发生安全事故应急处理方法。四年级研讨内容:学生就餐安全。五年级研讨内容:学生楼道玩
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
【无标题】Python --- Day5 函数的位置传参、关键词传参及其可变性和解包操作 AnAn__kang python 前端人工智能
系列文章目录前言今天小伙伴们跟我进入第五天的Python课程学习，主要是关于函数的位置传参，关键传参和可变性和解包传参这其中的具体定义以及它们的使用场景`一、调用传参函数调用时传递参数的方式有多种，包括位置传参、关键词传参、多个参数解包、参数默认值等。1.1位置传参最常见的传参方式，参数按定义的顺序依次传入函数。示例：defgreet(name,age):print(f"Hello,{name}.
相儒养老院-相儒养老价格、环境详询小李带你看养老
相儒养老：全方位照护，乐享金色年华在北京市丰台区葆台西路一号院这片充满温情的土地上，相儒养老以其专业的服务、温馨的环境和全面的照护体系，成为了众多老年人及其家庭信赖的养老之选。本文将详细介绍相儒养老的收费情况、地址位置、床位信息及收住的老人类别，并探讨其如何为老年人打造一个安心、快乐的晚年生活。电话：400-996-2290【北京相儒养老院】电话：400-996-2290（24小时热线）北京相儒养
生命3.0时代，面对人工智能时代的到来，我们可以做些什么笃定的沙丁鱼
生命的定义生命的定义有很多，最为人所熟知的是在生物学上的定义，即生命是蛋白质存在的一种形式。但是，这种定义可能不太适用于未来的智能机器和外星文明，我们不能将我们对未来生命的思考局限在过去遇到过的物种，所以需要将生命定义得更广阔一些：生命是一个能保持自身复杂性并能进行复制的过程。复制的对象并不是由原子组成的物质，而是能阐明原子是如何排列的信息，这种信息由比特组成。换句话说：我们可以将生命看作一种自我
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
不正规不靠谱：假摩根士丹利内部群推荐绿色低碳减排平台骗局揭露!送一万体验资金做慈善全是假的! 易星辰分享普法
关于曝光网上摩根士丹利何晓斌宝丰能源节能减排在炒股群推荐智慧农业中粮仓平台骗局的文章，其内容主要揭示了近期频发的一种投资诈骗手段。以下是该骗局的主要特点和步骤：为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”
车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默

【机器学习】某工19级智科专业机器学习期末复习资料

文章目录

chapter1

chapter2

2.1 机器学习的整体过程

2.2 误差与过拟合

△ \triangle △ 过拟合与欠拟合及其策略

2.3 模型选择

2.4 评估方法

△ \triangle △ K折交叉验证法

2.5 性能度量

△ \triangle △ PR曲线，P和R是什么

△ \triangle △ ROC曲线

△ \triangle △ 敏感性，特异性

2.6 比较检验*

2.7 偏差与方差

△ \triangle △ 公式推导

chapter3

3.1 基本形式及概念

3.3 △ \triangle △ 对数几率回归（Logistic）

3.4 △ \triangle △ 线性判别分析 (LDA)

3.5 多分类学习

3.6 △ \triangle △ 类别不平衡问题

chapter4

△ \triangle △ 近似线性可分问题

△ \triangle △ 核函数怎么选取

请简述在线性不可分样本中SVM引入核函数的目的，常见的核函数以及它们的使用场景和效果。

△ \triangle △ SVM寻优调参

△ \triangle △ 软间隔SVM

△ \triangle △ 损失函数对比

△ \triangle △ SVM 与 logistic 回归的区别

习题