静静的喝酒

机器学习笔记之线性分类——线性判别分析(一)模型构建思路

机器学习笔记之线性分类——线性判别分析之模型构建思路

引言
- 回顾：线性分类与硬分类
- 线性判别分析
- - 场景描述
  - 线性判别分析思想
  - 思想的符号化表示

引言

上一节介绍了线性分类中硬分类的代表方法——感知机算法(Perceptron)，本节将介绍硬分类中的另一种经典算法——线性判别分析(Linear Discriminant Analysis,LDA)。

回顾：线性分类与硬分类

线性分类与线性回归的模型形式是相同的——都是高维样本空间中的一条直线(超平面)。但由于任务性质不同，对应直线(超平面)使用的方式截然不同：

回归任务是模型拟合样本，回归任务中使用直线(超平面)的目的是基于给定的真实样本，如何最大程度地描述整个样本空间中样本的趋势。
分类任务是模型划分样本，分类任务中使用直线(超平面)的目的是直线(超平面)对样本空间划分后，样本空间中的样本在对应样本子空间中呈现分类效果。

给予上述思路，线性回归与线性分类的模型之间的核心区别是全局特征结果 $\mathcal W^{T}x^{(i)} + b$ 是否为线性特征。

线性回归模型表示如下：
$f(\mathcal W,b) = \mathcal W^{T}x^{(i)} + b$
线性分类模型表示如下：
$f(\mathcal W,b) = sign(\mathcal W^{T}x^{(i)} + b)$

其中 $s i g n$ 函数被称作激活函数，是一种非线性函数。硬分类中对于激活函数映射结果 $y_{pred}^{(i)}$ 所对应的特征空间与真实标签 $y^{(i)}$ 对应的特征空间相同。以 ${-1,1\}$ 二分类为例表示如下：
$y_{pred}^{(i)},y^{(i)} \in \{-1,1\}(i=1,2,\cdots,N)$
而这种性质映射在激活函数中，具体表现为 基于阈值的分段函数：
$\begin{cases}1 \quad if \quad y_{pred}^{(i)} > k \\ -1 \quad else \end{cases}$

线性判别分析

场景描述

数据集合 $Data=\{(x^{(i)},y^{(i)})\}_{i=1,2,\cdots,N}$ 由样本集合 $\mathcal X$ 和标签集合 $\mathcal Y$ 构成：
$\{\mathcal X,\mathcal Y\} \\ \mathcal X = \{x^{(1)},x^{(2)},\cdots,x^{(N)}\} \\ \mathcal Y = \{y^{(1)},y^{(2)},\cdots,y^{(N)}\}$
其中 $N$ 表示样本数量，任意一个样本 $x^{(i)}(i=1,2,\cdots,N)$ 均是 $p$ 维向量，对应 $y^{(i)}$ 是一个标量。 $\mathcal X,\mathcal Y$ 向量表示如下：
$\begin{aligned}\mathcal X & = (x^{(1)},x^{(2)}, \cdots,x^{(N)})^{T}=\begin{pmatrix}x_1^{(1)},x_2^{(1)},\cdots,x_p^{(1)} \\ x_1^{(2)},x_2^{(2)},\cdots,x_p^{(2)} \\ \vdots \\ x_1^{(N)},x_2^{(N)},\cdots,x_p^{(N)}\end{pmatrix}_{N \times p} \\ \mathcal Y & = (y^{(1)},y^{(2)},\cdots,y^{(N)})^{T} = \begin{pmatrix}y^{(1)} \\ y^{(2)} \\ \vdots \\ y^{(N)}\end{pmatrix}_{N \times 1}\end{aligned}$

设标签集合 $\mathcal Y$ 的空间分布为：
$y^{(i)} \in \{1,-1\}(i=1,2,\cdots,N)$
并假设标签集合中结果为1对应的样本集合为 $\mathcal X_{ C_1}$ ,结果为-1 对应的样本集合为 $\mathcal X_{C_2}$ 。即：
$\mathcal X_{C_1} = \{x^{(i)} \mid y^{(i)} = 1\} \\ \mathcal X_{C_2} = \{x^{(i)} \mid y^{(i)} = -1\}$
记集合 $\mathcal X_{C_1}$ 中样本数量为 $N_1$ ，集合 $\mathcal X_{C_2}$ 中样本数量为 $N_2$ ，那么集合 $\mathcal X_{C_1},\mathcal X_{C_2}$ 包含如下性质：
$\mathcal X_{C_1} \cup\mathcal X_{C_2} = \mathcal X \\ N_1+N_2 = N$

线性判别分析思想

由于线性判别分析的模型形式依然是样本空间中的一条直线，用最朴素的思想将线性判别分析理解为：高内聚、低耦合。

具体意思是指：以二分类为例，存在某条直线对样本空间进行划分从而得到两个样本子空间，如果该直线使被划分的每个样本子空间内部样本之间的距离足够小的同时，两个样本子空间的样本距离足够大，即可达到线性分类的目的。

但由于每个样本 $x^{(i)}(i=1,2,\cdots,N)$ 均是 $p$ 维向量，我们计算样本间距离是非常麻烦的——为了简化上述思想，使用降维：将 $p$ 维空间中的所有样本点全部映射到一维空间中。

在几何角度观察高斯分布中介绍过，将当前的 $p$ 维坐标系映射到另一个 $p$ 维坐标系中，本质上是将样本点的每一维度结果乘以对应维度的参考系向量，从而得到一个新的 $p$ 维向量：
$\begin{pmatrix}k_1 \\k_2 \\ \vdots \\ k_p\end{pmatrix},k_i = x^{T}u_i \quad(i=1,2,\cdots,p)$
其中， $u_i \in \mathbb R^p,x \in \mathbb R^p$ 。通过观察可以看出，基于新的特征空间向量 $k$ 中每个维度分量 $k_i$ 都需要原始向量 $x$ 乘以对应维度的参考系向量 $u_i$ 。那么整个参考系矩阵 $U$ 自然是 $\times p$ 维度：
$(u_1,u_2,\cdots,u_p)^{T}_{p \times p}$

线性判别分析中并不是将 $p$ 维空间映射到 $p$ 维空间，而只是将 $p$ 维空间映射到1维空间。基于上述逻辑，参考系矩阵 $U$ 只需要是一个 $p$ 维向量，从而将原始的 $p$ 维向量映射成一个标量(1维坐标系中的点)：
某一具体 $p$ 维样本点 $x^{(i)} = (x_1^{(i)},x_2^{(i)},\cdots,x_p^{(i)})^{T}$ ,被映射的1维参考系为 $\hat U = (\hat {u_1}, \hat {u_2},\cdots,\hat {u_p})^{T}_{p \times 1}$ ，它的映射结果 $k^{(i)}$ 表示如下：
$k^{(i)} = {x^{(i)}}^{T} \hat U = (x_1^{(i)},x_2^{(i)},\cdots,x_p^{(i)})\begin{pmatrix}\hat {u_1} \\ \hat{u_2} \\ \vdots \\ \hat{u_p}\end{pmatrix} = x_1^{(i)}\hat {u_1} + x_2^{(i)}\hat {u_2} + \cdots x_p^{(i)}\hat {u_p}$

我们发现：这种表现形式和 $\mathcal W^{T}x^{(i)}$ 殊途同归。此时，我们可以给 $\mathcal W$ 一个实际意义：

$\mathcal W$ 是 $p$ 维样本空间映射到1维空间的参考系。判定 $\mathcal W$ 优劣的标准是：对映射后的一维空间中的子空间内尽最大程度满足高内聚、低耦合条件。一旦找到最优参考系 $\hat {\mathcal W}$ ，通过最优参考系求解最优模型斜率 $\hat {\mathcal W}^{T}$ ，最后通过调整偏置项 $b$ (阈值)来确定最终模型。
由于参考系 $\mathcal W$ 与模型参数 $\mathcal W^{T}$ 之间属于垂直关系，一旦参考系被确定，那么模型直线的方向也自然被确定。

关键问题在于：如何确定最优 $\mathcal W$ ?这里需要一个策略(损失函数)。这个损失函数如何构建？此时就需要用数学符号表示“高内聚、低耦合”思想了。

思想的符号化表示

回到当前样本集合 $\{(x^{(i)},y^{(i)})\}_{i=1,2,\cdots,N}$ ，假设 $\mathcal W$ 是 $p$ 维样本空间映射到1维空间的参考系，并定义 映射后的特征结果为 $z^{(i)}$ 。 $z^{(i)}$ 的数学符号表示如下：
$z^{(i)} = \mathcal W^{T}x^{(i)}$
由于 $z^{(i)}$ 是一个标量，其实际意义可以理解为样本点 $x^{(i)}$ 在参考系 $\mathcal W$ 上投影的具体结果；
也可以直接理解成‘数轴’ $\mathcal W$ 上的一个实数点；
由于每一组数据都包含真实标签信息，按照真实标签结果进行划分。结合场景描述，分别将标签为 $1, - 1$ 的样本点使用参考系 $\mathcal W$ 进行投影，并将均值结果作为各分类标签对应样本点投影的综合考量：
令 $\bar {\mathcal Z_1},\bar {\mathcal Z_2}$ 分别为样本集合 $\mathcal X_{C_1},\mathcal X_{C_2}$ 内样本点投影后的均值结果。
$\bar {\mathcal Z_1} = \frac{1}{N_1}\sum_{i=1}^{N_1} \mathcal W^{T}x^{(i)} \\ \bar {\mathcal Z_2} = \frac{1}{N_2}\sum_{i=1}^{N_2} \mathcal W^{T}x^{(i)}$
至此，我们将 $\bar {\mathcal Z_1},\bar {\mathcal Z_2}$ 之间的差距 作为原始 $p$ 维空间被划分后的样本子空间的综合考量距离，由于 $\bar {\mathcal Z_1},\bar {\mathcal Z_2}$ 之间大小关系不确定，因此类间关系定义如下：
$\bar {\mathcal Z_1},\bar {\mathcal Z_2}$ 之间差距越大，类间关系越清晰，就越容易被模型划分；
$(\bar {\mathcal Z_1} - \bar {\mathcal Z_2})^2$

同理，分别计算 各类标签对应样本点投影的方差 作为各类标签对应样本点内部凝聚程度的综合考量：
令 $\mathcal S_1,\mathcal S_2$ 分别为样本集合 $\mathcal X_{C_1},\mathcal X_{C_2}$ 内部样本点投影的方差结果。
$\mathcal S_1 = \frac{1}{N_1} \sum_{j=1}^{N_1}(\mathcal W^{T}x^{(j)} - \bar {\mathcal Z_1})(\mathcal W^{T}x^{(j)} - \bar {\mathcal Z_1})^{T} \\ \mathcal S_2 = \frac{1}{N_2}\sum_{j=1}^{N_2}(\mathcal W^{T}x^{(j)} - \bar {\mathcal Z_2})(\mathcal W^{T}x^{(j)} - \bar {\mathcal Z_2})^{T}$
至此，分别得到了 两组标签对应样本点的凝聚程度信息，类内关系定义如下：
$\mathcal S_1,\mathcal S_2$ 越小，意味着各分类内部样本点的凝聚程度越高，越容易被模型划分；
$\mathcal S_1 + \mathcal S_2$

最终，结合类内、类间关系的性质，构建策略如下：
$\mathcal J(\mathcal W)$ 结果越大，样本更容易被模型划分；
$\mathcal J(\mathcal W) = \frac{(\bar {\mathcal Z_1} - \bar {\mathcal Z_2})^2}{\mathcal S_1 + \mathcal S_2}$

将上述公式化简为含变量 $\mathcal W$ 的结果：
观察分子，将分子展开：
$\begin{aligned}(\bar {\mathcal Z_1} - \bar {\mathcal Z_2})^2 & = \left(\frac{1}{N_1} \sum_{j=1}^{N_1} \mathcal W^{T}x^{(j)} - \frac{1}{N_2}\sum_{j=1}^{N_2}\mathcal W^{T}x^{(j)}\right)^2 \end{aligned}$
由于 $\mathcal W^{T}$ 中不含 $j$ ，视为常数，因此将 $\mathcal W^{T}$ 提出：
$\left[\mathcal W^{T}\left(\frac{1}{N_1}\sum_{j=1}^{N_1}x^{(j)} - \frac{1}{N_2}\sum_{j=1}^{N_2}x^{(j)}\right)\right]^2$
观察， $\frac{1}{N_1}\sum_{j=1}^{N_1}x^{(j)},\frac{1}{N_2}\sum_{j=1}^{N_2}x^{(j)}$ 包含实际意义，即 两组标签对应原始样本点的均值结果。具体定义如下：
$\bar {\mathcal X_{C_1}} = \frac{1}{N_1}\sum_{j=1}^{N_1}x^{(j)} \\ \bar {\mathcal X_{C_2}} = \frac{1}{N_2}\sum_{j=1}^{N_2}x^{(j)}$
最终分子可以表示为如下格式：
$\begin{aligned}(\bar {\mathcal Z_1} - \bar {\mathcal Z_2})^2 & = \left[\mathcal W^{T} \left(\bar {\mathcal X_{C_1}} - \bar {\mathcal X_{C_2}}\right)\right]^2 \\ & = \mathcal W^{T}(\bar {\mathcal X_{C_1}} - \bar {\mathcal X_{C_2}})(\bar {\mathcal X_{C_1}} - \bar {\mathcal X_{C_2}})^{T} \mathcal W\end{aligned}$

观察分母，观察其中一项： $\mathcal S_1$
$\begin{aligned}\mathcal S_1 & = \frac{1}{N_1}\sum_{j=1}^{N_1}(\mathcal W^{T}x^{(j)} - \bar {\mathcal Z_1})(\mathcal W^{T}x^{(j)} - \bar {\mathcal Z_1})^{T} \\ & = \frac{1}{N_1}\sum_{j=1}^{N_1}\left(\mathcal W^{T}x^{(j)} - \frac{1}{N_1}\sum_{i=1}^{N_1}\mathcal W^{T}x^{(i)}\right)\left(\mathcal W^{T}x^{(j)} - \frac{1}{N_1}\sum_{i=1}^{N_1}\mathcal W^{T}x^{(i)}\right)^{T} \end{aligned}$
同上， $\mathcal W^{T}$ 不含 $i, j$ ，视为常数；化简求得：
$\mathcal S_1 = \mathcal W^{T}\left[\frac{1}{N_1}\sum_{j=1}^{N_1}(x^{(j)} - \bar {\mathcal X_{C_1}})(x^{(j)} - \bar {\mathcal X_{C_1}})^{T}\right]\mathcal W$
观察中间项： $\frac{1}{N_1}\sum_{j=1}^{N_1}(x^{(j)} - \bar {\mathcal X_{C_1}})(x^{(j)} - \bar {\mathcal X_{C_1}})^{T}$ ，它同样具有实际意义，即： $\mathcal X_{C_1}$ 样本集合的方差结果。 同样适用一个符号定义该数值：
$\mathcal S_{C_1} = \frac{1}{N_1} \sum_{j=1}^{N_1}(x^{(j)} - \bar {\mathcal X_{C_1}})(x^{(j)} - \bar {\mathcal X_{C_1}})^{T}$

至此， $\mathcal S_1$ 可记作为如下格式：
$\mathcal S_1 = \mathcal W^{T}\mathcal S_{C_1}\mathcal W$
同理， $\mathcal S_2$ 可记作如下格式：
$\mathcal S_{C_2}$ 表示 $\mathcal X_{C_2}$ 样本集合的方差结果；
$\mathcal S_2 = \mathcal W^{T}\mathcal S_{C_2}\mathcal W$
分母结果可表示为：
$\mathcal W^{T}(\mathcal S_{C_1} + \mathcal S_{C_2})\mathcal W$

最终，基于高内聚、低耦合思想的关于模型参数 $\mathcal W$ 的策略 $\mathcal J(\mathcal W)$ 表示如下：
$\begin{aligned}\mathcal J(\mathcal W) & = \frac{(\bar {\mathcal Z_1} - \bar {\mathcal Z_2})^2}{\mathcal S_1 + \mathcal S_2} \\ & = \frac{\mathcal W^{T}(\bar {\mathcal X_{C_1}} - \bar {\mathcal X_{C_2}})(\bar {\mathcal X_{C_1}} - \bar {\mathcal X_{C_2}})^{T}\mathcal W}{\mathcal W^{T}(\mathcal S_{C_1} + \mathcal S_{C_2})\mathcal W}\end{aligned}$

观察最终结果，除了 $\mathcal W$ ，其他符号如 $\mathcal S_{C_1},\mathcal S_{C_2},\bar {\mathcal X_{C_1}},\bar {\mathcal X_{C_2}}$ 均可以通过样本集合 $\{(x^{(i)},y^{(i)})\}_{i=1,2,\cdots,N}$ 直接求解。均为已知项。

下一节针对策略 $\mathcal J(\mathcal W)$ 求解最优模型参数 $\hat {\mathcal W}$ .

相关参考：
机器学习-线性分类3-线性判别分析-模型定义

【Java学习日记6】：字面量的分类与使用小蛋6g Java学习日记 java 开发语言
一、字面量的定义与作用字面量是程序中直接书写的数据值，无需通过变量或计算获取。它用于表示固定的值，如数字、字符、布尔值等，例如：数字100、字符串"Hello"、字符'A'等。字面量告诉编译器数据的类型和值。字面量就是告诉程序员:数据在程序中的书写格式.---二、字面量的分类Java中的字面量按数据类型可分为以下六类：类型说明示例整数类型不带小数点的数字123,-456小数类型带小数点的数字3.1
什么是设计模式以及常见的例子（如单例、工厂、观察者等） python资深爱好者 c++设计模式单例模式
设计模式（DesignPattern）是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。使用设计模式的主要目的是为了可重用代码、让代码更容易被他人理解、提高代码的可靠性。设计模式一般包含模式名称、问题、目的、解决方案、效果等基本要素。设计模式根据目的（即模式是用来做什么的）可以分为三大类：创建型模式、结构型模式和行为型模式。下面分别给出几个常见的设计模式例子，包括单例模式、工厂模
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
Netty源码—3.Reactor线程模型四东阳马生架构 Netty应用与源码 Netty Reactor线程模型
大纲5.NioEventLoop的执行总体框架6.Reactor线程执行一次事件轮询7.Reactor线程处理产生IO事件的Channel8.Reactor线程处理任务队列之添加任务9.Reactor线程处理任务队列之执行任务10.NioEventLoop总结8.Reactor线程处理任务队列之添加任务(1)Reactor线程执行一次事件轮询的过程(2)任务的分类和添加说明(3)普通任务的添加(4
模拟退火算法：原理、应用与优化策略尹清雅算法
摘要模拟退火算法是一种基于物理退火过程的随机搜索算法，在解决复杂优化问题上表现出独特优势。本文详细阐述模拟退火算法的原理，深入分析其核心要素，通过案例展示在函数优化、旅行商问题中的应用，并探讨算法的优化策略与拓展方向，为解决复杂优化问题提供全面的理论与实践指导，助力该算法在多领域的高效应用与创新发展。一、引言在现代科学与工程领域，复杂优化问题无处不在，如资源分配、路径规划、机器学习模型参数调优等。
【猫狗分类】Pytorch VGG16 实现猫狗分类1-数据清洗+制作标签文件努力的小巴掌 pytorch分类项目 pytorch 分类人工智能
Pytorch猫狗分类用Pytorch框架，实现分类问题，好像是学习了一些基础知识后的一个小项目阶段，通过这个分类问题，可以知道整个pytorch的工作流程是什么，会了一个分类，那就可以解决其他的分类问题，当然了，其实最重要的还是，了解她的核心是怎么工作的。那首先，我们的第一个项目，就做猫狗的分类。声明：整个数据和代码来自于b站，链接：使用pytorch框架手把手教你利用VGG16网络编写猫狗分类
mysql总结 tianyunlinger 大数据 mysql 数据库
MySQL基础1.数据库基本介绍数据库定义：用于存储数据的仓库，通过SQL语句操作。数据库作用：存储应用程序中的数据，便于管理和查询。数据库分类：关系型数据库（如MySQL、Oracle、DB2）和非关系型数据库（如Redis、HBase）。关系型数据库：通过E-R图描述数据之间的关系，支持复杂查询。2.MySQL在Linux中的安装安装前准备：配置防火墙、创建统一的管理目录（如/export/s
区跨链密码学 NO如果密码学
1.哈希算法（Hash）❓1.1什么是哈希算法？区块链中为什么需要哈希？哈希算法是一种不可逆的、确定性的、固定长度的散列函数，用于将输入数据映射成固定长度的字符串。在区块链中的作用：数据完整性：确保区块内容未被篡改（MerkleTree）。唯一标识：区块哈希值用于唯一标识区块。密码学安全性：哈希值难以逆推，保证安全性。常见哈希算法：SHA-256（比特币）：固定256位输出，抗碰撞强。Keccak
Zynq PL端IP核之AXI DMA Mazy.v fpga开发嵌入式硬件 arm开发单片机
1.AXIDMA简介Zynq提供了两种DMA，一种是PS中的DMA控制器，通过GP口与PL端连接，另一种是PL中的AXIDMAIP核（软核），通过HP口与PS端连接。Zynq有4个HP接口，每一个HP接口都包含控制和数据FIFO，这些FIFO为大数据量突发传输提供缓冲，让HP接口成为理想的高速数据传输接口。AXIDMAIP内核在AXI4内存映射和AXI4StreamIP接口之间提供高带宽直接储存访
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
国外7个最佳大语言模型 (LLM) API推荐幂简集成 API新理念语言模型人工智能自然语言处理
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
路由交换技术——多私网下NAPT、FTP服务公网映射配置的实验「J1e」网络网络协议 tcp/ip
网络地址转换（NAT）技术概述1.定义与背景网络地址转换（NetworkAddressTranslation,NAT）是一种在IP数据包传输过程中修改源或目标IP地址及端口的技术，主要用于解决IPv4地址短缺问题。随着互联网设备激增，NAT通过允许多个设备共享单一公网IP地址，显著延缓了IPv4地址耗尽的速度。2.工作原理NAT的核心是通过中间设备（如路由器、防火墙）建立内网私有地址与外网公有地址
CSP-J备考冲刺必刷题（C++） | AcWing 11 背包问题求方案数热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】AcWing：11.背包问题求方案数-AcWi
c++ stl库有哪些技术 C++ 老炮儿的技术栈 c++算法学习笔记 c++
C++STL（标准模板库）包含以下一些重要技术：容器-序列容器：如vector（动态数组），支持快速随机访问和尾部插入/删除；list（双向链表），适合频繁的插入和删除操作；deque（双端队列），能在两端高效地进行插入和删除。-关联容器：像map（键值对映射），基于红黑树实现，提供快速的查找、插入和删除操作；set（集合），同样基于红黑树，元素唯一且有序。迭代器提供了一种统一的方式来访问容器中的
决策树算法及其python实例 m0_74831463 算法决策树 python
一、决策数的概念什么是决策树算法呢？决策树（DecisionTree）是一种基本的分类与回归方法，本文主要讨论分类决策树。决策树模型呈树形结构，在分类问题中，表示基于特征对数据进行分类的过程。它可以认为是if-then规则的集合。每个内部节点表示在属性上的一个测试，每个分支代表一个测试输出，每个叶节点代表一种类别二、决策树的构造1、决策树的构造步骤输入：训练集D={(21,11),(z2,32),
CCF CSP 历年真题 C语言版满分代码集合 (至2021.9 持续更新中 JY_0329 CCF c语言开发语言 csp ccf 算法
CCFCSP历年真题C语言版满分代码集合（全部原创）2021-9-1数组推导2021-9-2非零段划分2021-4-1灰度直方图2021-4-2领域均值2020-12-1期末预测之安全指数2020-12-2期末预测之最佳阈值2020-9-1称检测点查询2020-9-2风险人群筛查2020-6-1线性分类器2020-6-2稀疏向量2019-12-1报数2019-12-2回收站选址2019-9-1小明
python学智能算法（八）|决策树西猫雷婶人工智能 python学习笔记机器学习 python 决策树开发语言
【1】引言前序学习进程中，已经对KNN邻近算法有了探索，相关文章链接为：python学智能算法（七）|KNN邻近算法-CSDN博客但KNN邻近算法有一个特点是：它在分类的时候，不能知晓每个类别内事物的具体面貌，只能获得类别，停留在事物的表面。为了进一步探索事物的内在特征，就需要学习新的算法。本篇文章就是在KNN的基础上学习新算法：决策树。【2】原理分析在学习决策树执之前，需要先了解香农熵。本科学控
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
奇异值分解（SVD）文弱_书生乱七八糟神经网络人工智能
奇异值分解(SVD)介绍奇异值分解(SVD)，这是最强大的矩阵分解技术之一。SVD广泛应用于机器学习、数据科学和其他计算领域，用于降维、降噪和矩阵近似等应用。与仅适用于方阵的特征分解不同，SVD可以应用于任何矩阵，使其成为一种多功能工具。在这里煮啵将分解SVD背后的理论，通过手动计算示例进行分析，并展示如何在Python中实现SVD。在本节结束时，您将清楚地了解SVD的强大功能及其在机器学习中的应
C++ STL常用库的使用方法（一）小崔的技术博客算法 c++算法开发语言
文章目录（0）C++STL介绍（0）C++STL组件(一)Vector容器1）创建vector2）尾部元素扩张3）访问Vector元素4)元素的删除5)元素的排序6)向量的大小(二)String基本字符系列容器1）创建String对象2)给String赋值(三)set集合容器1）创建set集合对象2)元素的插入与中序遍历3)元素的反向遍历4)元素的删除5)元素的检索(四)map映射容器1）map创
Docker 存储 Psycho_MrZhang Docker docker java 容器
目录挂载在执行run时设置参数-v即可实现目录映射,实现原理会在宿主机器创建一个空文件夹#挂载宿主机的/data目录到容器的/app目录dockerrun-d-v/data:/app--namemy-appmy-image#挂载docker内的/usr/share/nginx/html目录到本地机的/app/nghtmldockerrun-d-v/app/nghtml:/usr/share/ngi
Scrum实施情况调查之案例分析 zhijie435 项目管理 thoughtworks 敏捷项目管理敏捷开发工作框架
导读：社区Agile主题敏捷实施,企业级敏捷标签Scrum作者李剑，在InfoQ中文站上发表了一篇"Scrum在中国——企业实施情况调查实录"。这份调查实录，分别调查了五个实施SCRUM的公司，其中三家公司实施成功，二家公司失败。我建议所有准备或者正在实施SCRUM的人们都能来读一下。在此，我们会对这篇文章中的案例分类进行分析、诊断。并探讨什么是敏捷开发方法、什么是SCRUM、使用敏捷方法需要什么
yum install locate出现Error: Unable to find match: locate解决方案爱编程的喵喵 Linux解决方案 linux locate yum 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了yuminstalllocate出现
【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理猿享天开人工智能数学基础专讲人工智能机器学习无监督学习降维
深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理在当今数据驱动的世界中，数据维度的增多带来了计算复杂性和存储挑战，同时也可能导致模型性能下降，这一现象被称为“维度诅咒”（CurseofDimensionality）。降维作为一种重要的特征提取和数据预处理技术，旨在通过减少数据的维度，保留其主要信息，从而简化数据处理过程，并提升模型的性能。本文将深入探讨两种广泛应用于无监督学习中的降
耦合与解耦：软件工程中的核心矛盾与破局之道以恒1 软件工程
耦合与解耦：软件工程中的核心矛盾与破局之道在软件开发领域，耦合与解耦是贯穿始终的核心矛盾。它们如同硬币的两面，既相互对立又紧密依存。本文将从概念解析、类型分类、解耦策略到实际应用，全面剖析这对矛盾体的本质与破局之道。一、耦合的本质：依赖关系的多维透视耦合（Coupling）指软件系统中不同模块、组件或服务之间的相互依赖程度。这种依赖可能表现为数据传递、控制流交互或资源共享。根据耦合强度，可分为七种
HarmonyOS实战开发-如何打造购物商城APP。码牛程序猿鸿蒙工程师 HarmonyOS 鸿蒙 harmonyos OpenHarmony 鸿蒙鸿蒙应用开发华为鸿蒙开发 HarmonyOS
今天给大家分享一个非常好的实战项目，购物商城，购物商城是一个集购物、娱乐、服务于一体的综合性平台，致力于为消费者提供一站式的购物体验。各种功能都有涉及，最适合实现学习。做好商城项目，肯定会把开发中遇到的百分之60的技术得到实战的经验。下面介绍一下商城的主要模块：首页1，搜索框，点击进入搜索页面2，顶部分类，通过不同分类查询对应信息3，广告轮播，自动切换图片，可以进行点击进入4，商品列表，展示每个项
Flink启动任务 swg321321 flink 大数据
Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
计算机专业毕业设计题目推荐（新颖选题）本科计算机人工智能专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计人工智能毕业设计毕设题目毕业设计题目 ai AI编程
文章目录前言最新毕设选题（建议收藏起来）本科计算机人工智能专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能
小科普《DNS服务器》 Hum8le 服务器运维
DNS服务器详解1.定义与核心作用DNS（域名系统）服务器是互联网的核心基础设施，负责将人类可读的域名（如www.example.com）转换为机器可识别的IP地址（如192.0.2.1），从而实现设备间的通信。其核心功能包括：域名解析：将域名转换为IP地址，简化用户访问网站的流程。负载均衡：通过将同一域名映射到多个IP地址，分配流量以提升服务稳定性和性能。缓存加速：存储近期查询结果，减少重复解析
【机器学习】建模流程 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能线性回归逻辑回归
1、数据获取1.1来源数据获取是机器学习建模的第一步，常见的数据来源包括数据库、API、网络爬虫等。数据库是企业内部常见的数据存储方式，例如：MySQL、Oracle等关系型数据库，以及MongoDB等非关系型数据库，它们能够存储大量的结构化和非结构化数据API（应用程序编程接口）提供了从外部获取数据的便捷方式，例如：社交媒体平台的API可以获取用户发布的内容和互动信息网络爬虫则适用于从网页中提取
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod