静静的喝酒

深度学习笔记之稀疏自编码器

引言
- 引子：题目描述
- - 正确答案： $\mathcal A \mathcal B \mathcal C \mathcal D$
  - 题目解析
- 介绍：自编码器
- 欠完备自编码器
- 正则自编码器
- - 从先验角度解释稀疏自编码器
  - 稀疏自编码器的构建

引言

本节以一道算法八股题为引，介绍稀疏自编码器。

引子：题目描述

下列方法中，可以用于特征降维的方法包括(多选) $(\quad)$

$\mathcal A \quad$ 主成分分析 $\text{PCA}$

$\mathcal B \quad$ 线性判别分析 $\text{LDA}$

$\mathcal C \quad$ 深度学习 $\text{SparseAutoEncoder}$

$\mathcal D \quad$ 矩阵奇异值分解 $\text{SVD}$

$\mathcal E \quad$ 最小二乘法 $\text{LeastSquares}$

正确答案： $\mathcal A \mathcal B \mathcal C \mathcal D$

题目解析

关于 $\mathcal A \quad \mathcal D \quad$ 选项，可以放在一起观察。关于主成分分析 $(\text{Principal Component Analysis,PCA})$ 的降维思想，这里不再过多赘述。这里重点描述从奇异值分解角度观察主成分分析：
详细推导过程见传送门

假设无监督任务下，样本集合 $\mathcal X$ 表示为：
$\mathcal X = (x^{(1)},x^{(2)},\cdots,x^{(N)})_{N \times p}^T \quad x^{(i)} \in \mathbb R^p$
对 $\mathcal X$ 进行中心化(将 $\mathcal X$ 分布平移至样本空间原点位置)，即乘以相应的中心矩阵 $\mathcal H$ ：
其中 $\mathcal E_N$ 表示 $N$ 维单位向量; $\mathcal I_{N}$ 表示元素值均为 $1$ 的 $N$ 维列向量。
$\begin{cases} \begin{aligned} \mathcal H = \mathcal E_{N} - \frac{1}{N} \mathcal I_N \cdot \mathcal I_N^T \end{aligned} \\ \mathcal H \cdot \mathcal X = \left[x^{(1)} - \bar {\mathcal X},x^{(2)} - \bar {\mathcal X},\cdots,x^{(N)} - \bar {\mathcal X}\right]_{N \times p}^T \end{cases}$
从奇异值分解 $(\text{Singular Value Decomposition,SVD})$ 的角度对 $\mathcal H \cdot \mathcal X$ 进行处理：
$\mathcal H \cdot \mathcal X = \mathcal U \Sigma \mathcal V^T$
其中 $\mathcal U$ 是列正交矩阵； $\mathcal V$ 是正交矩阵。对应 $\mathcal X$ 的协方差 $\mathcal S$ 使用奇异值分解表示如下：
其中 $\mathcal X,\mathcal H$ 对 $\mathcal S$ 的表达过程详见主成分分析——最大投影方差角度
$\begin{aligned} \mathcal S & = \frac{1}{N} \mathcal X^T \cdot \mathcal H \cdot \mathcal X \\ & = \frac{1}{N} (\mathcal H \mathcal X)^T \cdot (\mathcal H \mathcal X) \\ & = \frac{1}{N} (\mathcal U \Sigma \mathcal V^T)^T \cdot \mathcal U \Sigma\mathcal V^T \\ & = \frac{1}{N} \mathcal V(\Sigma^T\Sigma)\mathcal V^T \end{aligned}$
这里忽略掉 $\begin{aligned}\frac{1}{N}\end{aligned}$ 的影响(它不会影响正交基的方向)，这意味着不需要直接对 $\mathcal X$ 的协方差矩阵进行特征值分解，而是通过 $\mathcal H \cdot \mathcal X$ 进行奇异值分解即可。其特征向量就是 $\mathcal V$ 自身：
上式等号两侧右乘 $\mathcal V,\begin{aligned}\frac{1}{N}\end{aligned}$ 忽略。
$\begin{aligned} \mathcal S \cdot \mathcal V & = \mathcal V\Sigma^T\Sigma \underbrace{\mathcal V^T\mathcal V}_{\mathcal E} \\ & = \mathcal V (\Sigma^T\Sigma) \end{aligned}$
其中 $\Sigma^T\Sigma$ 是特征值矩阵，其对角线元素是特征值，从而根据特征值进行找出最优主成分，以此类推。因此， $\mathcal D \quad$ 选项正确。

关于 $\mathcal B \quad$ 选项：线性判别分析，这里不过多赘述，详见算法八股(十)——线性判别分析与核函数中关于线性判别分析的解释。
关于 $\mathcal E \quad$ 选项：最小二乘法：
$\mathcal L(\mathcal W) = \sum_{i=1}^N ||\mathcal W^Tx^{(i)} - y^{(i)}|| \quad (x^{(i)},y^{(i)}) \in \mathcal D$
我们仅从计算过程中观察，我们可以认为将 $x^{(i)}$ 所在的特征空间通过 $\mathcal W$ 映射到对应的标签空间。但整个过程 $x^{(i)}(i=1,2,\cdots,N)$ 的特征没有变化过。也就是说，我们并没有去修改特征空间，从而对 $x^{(i)}$ 提出新的表示。

下面主要关注 $\mathcal C \quad$ 选项：什么是稀疏自编码器( $\text{SparseAutoEncoder}$ )，它又是如何实现特征降维的。

介绍：自编码器

关于自编码器 $(\text{AutoEncoder})$ ，是神经网络的一种。它经过训练后能尝试将输入复制到输出。其模型结构可表示为如下形式：
节自《深度学习》(花书) P306。从该描述中可以发现，它是一个典型的概率生成模型

该模型中包含一个隐藏层 $h$ ，其作用是对输入特征 $x$ 进行抽象表示，也称作编码 $(\text{Code})$ 。通过 $h$ 将整个模型划分成两个部分：

编码器 $(\text{Encoder})$ 。由函数 $f(\cdot)$ 对输入特征 $x$ 进行描述，得到抽象特征 $h$ ：
$h = f (x)$
解码器 $(\text{Decoder})$ 。由函数 $g(\cdot)$ 对抽象特征 $h$ 进行重构，得到生成特征 $r$ ：
$r = g (h)$

既然是生成模型，从常规角度认为从模型中生成出的特征 $r$ 和 $x$ 越相似越好。但相反，如果仅仅得到一个 $g [f (x)] = x$ ，这个模型可能并没有什么意义。因此，我们需要对模型施加一些约束，从而：

生成的特征和输入特征相似；
施加的约束导致模型会优先选择代表性强的特征，从而学习到数据的有用特征。

如果从概率分布的角度认识这个过程，已知输入分布 $x$ ，那么编码器的输出分布可表示为：
也就是给定 $x$ ,在 $\text{Encoder}$ 的抽象描述下，输出编码 $h$ 的后验概率分布。
$\mathcal P_{encoder}(h \mid x)$
同理，假设编码 $h$ 给定的条件下，解码器的输出分布可表示为：
$\mathcal P_{decoder}(x \mid h)$

欠完备自编码器

基于我们想要输出分布 $\mathcal P_{model}(x \mid h)$ 与真实分布 $\mathcal P_{data}(x)$ 相同，但又不想单纯地将输入复制到输出。
看起来像是一个矛盾的事情。

也就是说，在训练自编码器对 $x$ 训练的过程中，使隐变量 $h$ 能够学习到有用的特性。一种做法是：通过人工设置，强行让 $h$ 的维度小于 $x$ 的维度：

这种编码维度小于输入维度的自编码器被称作欠完备自编码器 $(\text{Undercompleter AutoEncoder})$ 。编码维度的减小意味着学习到的分布 $\mathcal P_{model}(h \mid x)$ 相比真实分布 $\mathcal P_{data}(x)$ 确实出现了缺失，但强制自编码器捕捉 $x$ 中最显著的特征。
从 $\Rightarrow h$ 过程中学习到的特征信息被‘压缩’，信息丢失是不可避免的。但在 $x$ 分布确定的条件下， $h$ 中保留的必然是‘更具代表性、性质更加显著’的信息。

在后续解码器对压缩特征 $h$ 进行重构的过程中，由于 $h$ 特征的缺失已经达到了 不想单纯地将输入复制到输出 这个动机，导致后续即便重构出与 $x$ 大小相同的特征空间，它的信息相比真实分布 $x$ 依然是缺失的。因而我们需要一个损失函数来惩罚重构分布和真实分布 之间的差异：
$\mathcal L[x,g(f(x))]$
从降维的角度观察， $\Rightarrow h$ 可以被看作是一个降维过程， $h$ 中的各维度可看作特征值最大的若干主成分。在重构过程中，虽然无法将缺失的部分还原，但重构后的结果相比于真实分布其特征更具代表性。
也就是说， $\text{Undercompleter AutoEncoder}$ 这种独特的模型结构就已经存在了特征降维的思想。那么它与 $\text{Sparse AutoEncdoer}$ 之间的关联关系是什么？

正则自编码器

上面描述的欠完备自编码器是通过人为设置强制减小编码维数而产生的模型结构，这种结构能够使 $h$ 学习到 $x$ 更显著的特征信息。

相反呢？如果我们的自编码器容量过大，也就是说： $h$ 的编码维数与 $x$ 相等，甚至高于 $x$ ：

这种情况可能导致 $h$ 在编码过程中对 $x$ 的学习更加准确，我们不否认对应的解码结果会对 $x$ 重构的更加准确，但 $h$ 中学习不到任何有用的信息。
这种就是‘单纯地将输入复制到输出’的情况。

我们将这种情况称作过完备 $(\text{Overcomplete})$ 。那么类似于上述的情况，是否可以让 $h$ 学习到有用的信息？换句话说：能否不使用“限制” $h$ 维度的方式，理想情况下，任意大小的 $h$ 都能够在训练中学习出有用的信息。

正则自编码器提供了这样的能力。其思想在于利用稀疏表示、表示的小导数以及噪声或输入缺失的鲁棒性的方式，使非线性且过完备的正则自编码器仍然能够从数据中学到一些关于数据分布的有用信息。
节自《深度学习》(花书) P307 14.2 正则自编码器

从先验角度解释稀疏自编码器

稀疏自编码器 $(\text{Sparse AutoEncoder})$ 就是通过对 $h$ 进行稀疏表示达到上述目的。其具体做法是：在损失函数的基础上，增加对 $h$ 的稀疏惩罚：
再次强调，两个部分‘惩罚’的方向不一样。 $\mathcal L[x,g(f(x))]$ 惩罚的是真实分布 $x$ 和重构分布 $g (f (x))$ 之间的差异性; $\Omega(h)$ 惩罚的是 $h = f (x)$ 的稀疏性。
$\mathcal L[x,g(f(x))] + \Omega(h) \quad h=f(x)$

我们可以将 $\Omega(h)$ 视作关于 $h$ 的正则项，但实际上，该项并没有正则项的意义。在正则化——贝叶斯概率角度中介绍了正则项相当于参数的先验概率：
$\text{MAP : } \hat \theta = \mathop{\arg\max}\theta \left[ \log \mathcal P(\mathcal X \mid \theta) + \log \mathcal P(\theta)\right]$
而先验概率 $\log \mathcal P(\theta)$ 描述在训练过程之前，对参数 $\theta$ 特定值的偏好，并且 这个偏好取决于事件自身的性质。例如极大似然估计与最大后验概率估计中投掷硬币的例子。我们给出的分布 $\mathcal P(\theta)$ 是均值 $\mu = 0.5$ ，方差 $\sigma = 0.1$ 的高斯分布：
很明显，我们在给出先验分布时，连数据是什么都不知道。
$\mathcal P(\theta) = \frac{1}{0.1 \times \sqrt{2\pi}} \exp \left\{-\frac{(\theta - 0.5)^2}{0.02}\right\}$
但是隐变量 $h$ 是伴随模型存在的，它自身没有实际的物理意义。因而对应的先验分布 $\mathcal P_{model}(h)$ 也同样是没有实际意义的先验。因而它不能被直接视作正则项，但我们仍可以认为 $\mathcal P_{model}(h)$ 隐式地表达了对函数的偏好：
通常也将 $\mathcal P_{model}(h)$ 称作信念先验。节选自《深度学习》(花书) P308 14.2.1 稀疏自编码器。

关于解码器生成的样本分布 $\mathcal P_{model}(x)$ ，它的似然函数可分解为如下形式：
$\mathcal P_{model}(x) = \sum_{h} \mathcal P_{model}(h,x)$
关于联合概率分布 $\mathcal P_{model}(h,x)$ ，它的对数结果表示为：
$\begin{aligned} \log \mathcal P_{model}(h,x) & = \log \left[\mathcal P_{model}(x \mid h) \cdot \mathcal P_{model}(h)\right] \\ & = \log \mathcal P_{model}(x \mid h) + \log \mathcal P_{model}(h) \end{aligned}$
如果 $h$ ，也就是编码器各神经元的输出，假设它们之间是独立同分布的条件下，虽然 $\mathcal P_{model}(h)$ 不是真正意义上的先验，但是依然可以给其各个分量一个先验分布。如 $\text{Laplace}$ 先验：
其中 $h_j(j=1,2,\cdots,\mathcal K)$ 表示 $h$ 的各个分量，也就是编码器第 $j$ 个神经元的输出。
$\begin{aligned} \log \mathcal P_{model}(h) & = \log \prod_{j=1}^{\mathcal K} \mathcal P_{model}(h_j) \\ & = \sum_{j=1}^{\mathcal K} \log \mathcal P_{model}(h_j) \\ & = \sum_{j=1}^{\mathcal K} \log \left[\frac{\lambda}{2} \exp \{-\lambda |h_j|\}\right] \\ & =\underbrace{\sum_{j=1}^{\mathcal K} \log \frac{\lambda}{2}}_{\mathcal C} - \underbrace{\lambda \cdot \sum_{j=1}^{\mathcal K} |h_j|}_{\Omega(h)} \end{aligned}$

个人理解：从先验的角度解释了稀疏惩罚 $\Omega(h)$ 的作用。重点在于如何构建稀疏惩罚，也就是说，如何约束编码器神经元的输出 $h$ 。

花书中的介绍，个人没有理解它的精髓。在不是真正意义上的先验的基础上，用先验去解释它。这里欢迎小伙伴们批评指正。

稀疏自编码器的构建

上面的 $\text{Laplace}$ 分布是一种方式，也可以尝试其他的方式去约束编码器的输出 $h$ ：

通过前馈神经网络的描述，可以将 $h$ 的第 $j$ 个神经元 $h_j$ 表示为如下形式：
其中 $\sigma$ 表示激活函数。
$\begin{aligned} h_j & = \sigma \left(\mathcal W_{x_1 \Leftrightarrow j} \cdot x_1 + \mathcal W_{x_2 \Leftrightarrow j} \cdot x_2 + \cdots + \mathcal W_{x_p \Leftrightarrow j} \cdot x_p + b_j\right) \\ & = \sigma(\mathcal W_{x \Leftrightarrow j} \cdot x + b_j) \end{aligned}$
很明显， $h_j$ 可看作是一个关于样本特征 $x_1,x_2,\cdots,x_p$ 的函数 $h_j(x)$ 。将样本集合 $\mathcal D$ 内的所有样本 $x^{(i)}(i=1,2,\cdots,N)$ 带入到上式中，并取该结果的均值，结果记作 $\hat {\rho_j}$ ：
也称 $\hat {\rho_j}$ 为‘平均激活度’ $(\text{Average Activation})$
$\hat {\rho_j} = \frac{1}{N} \sum_{i=1}^N \left[h_j(x^{(i)})\right]$
在向下执行之前，我们有必要了解一下 $\hat {\rho_j}$ ，它的物理意义。为什么要这么设计它 $?$ 如果从蒙特卡洛方法的反方向去考虑该式子，那么他可以被看作是：真实分布 $\mathcal P_{data}(x)$ 下， $h_j(x)$ 的期望结果：
$\hat {\rho_j} \approx \mathbb E_{x^{(i)} \sim \mathcal P_{data}(x)} [h_j(x^{(i)})]$
这个期望的大小意味着什么：
- 如果这个期望值大，意味着第 $j$ 个神经元 $h_j$ 对于样本 $x^{(i)}(i=1,2,\cdots,N)$ 的综合映射结果是不低的。也就是说， $h_j$ 对于样本特征的描述更加完整，更加丰富；
  但这种特征描述方式违背了‘对其稀疏表示’的初衷，从而变成了单纯的复制。
- 相反，如果这个期望值小，这意味着可能存在部分神经元活性较低/失活了，导致一部分神经元的输出接近于 $0/$ 就是 $0$ 。从而只能利用少数神经元完成编码器对特征的压缩。而这些抗打的(未失活的)神经元对应的特征就是 $x$ 中最显著的信息。
- 但我们也不能让其无限的小，甚至为 $0$ 。如果是极限情况下让 $\hat {\rho_j} =0$ ，这些最显著信息对应的神经元也失活了，这个模型就没有意义了。
基于上述描述，我们可以设置一个目标值 $\rho$ ，也称作稀疏性常数。这个值很小，例如 $0.05$ (讲义中的例子)，我们希望 $\hat {\rho_j}$ 向目标值 $\rho$ 靠近，直至相等：
$\hat {\rho_j} = \rho$
如何对这个靠近进行描述 $?$ 我们将 $\hat {\rho_j}$ 和 $\rho$ 看做是两个概率分布，使用 $\mathcal K\mathcal L$ 散度对其进行描述：
$\mathcal K\mathcal L$ 散度可理解为两概率分布 $\rho,\hat {\rho_j}$ 之间的相似程度。有下界 $0$ ,意味着 $\rho=\hat {\rho_j}$
$\mathcal K\mathcal L(\rho || \hat {\rho_j}) = \rho \log \frac{\rho}{\hat {\rho_j}} + (1 - \rho) \log \frac{1 - \rho}{1 - \hat {\rho_j}}$
当然，这里仅描述了第 $j$ 个神经元 $h_j$ 的情况。对于完整稀疏惩罚 $\Omega(h)$ 可表示为：
因为 $\hat {\rho_j}$ 是 $h_j$ 的均值/期望，因此整个式子中只有 $h_j(j=1,2,\cdots,\mathcal K)$ 是变量，满足‘稀疏惩罚项’的要求。
$\Omega(h) = \sum_{j=1}^{\mathcal K} \mathcal K\mathcal L(\rho || \hat {\rho_j})$

最终，基于该方式的稀疏自编码器的策略可表示为：
$\begin{aligned} \mathcal J_{sparse}(\mathcal W,b) & = \mathcal L[x,g(f(x))] + \Omega(h) \\ & = \mathcal J(\mathcal W,b) + \beta \cdot \sum_{j=1}^{\mathcal K} \mathcal K\mathcal L(\rho || \hat {\rho_j}) \end{aligned}$
回到题目， $\mathcal C \quad$ 选项稀疏自编码器主要是针对编码器容量过完备情况下，对编码器神经元输出的稀疏惩罚。还是要和欠完备自编码器区分一下，正确。

相关参考：
《深度学习》(花书) P306 第14章自编码器
深度学习 - 深度生成网络

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
春季养肝正当时 dxn悟
重温快乐2023年2月4日立春。春天来了，春暖花开，小鸟欢唱，那在这样的季节我们如何养肝呢？自然界的春季对应中医五行的木，人体五脏肝属木，“木曰曲直”，是以树干曲曲直直地向上、向外伸长舒展的生发姿态，来形容具有生长、升发、条达、舒畅等特征的食物及现象。根据中医天人相应的理念，肝五行属木，喜条达，主疏泄，与春天相应，所以春天最适合养肝。养肝首先要少生气，因为肝喜条达恶抑郁。人体五志肝为怒，生气发怒最
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
为什么你总是对下属不满意? ZhaoWu1050
【ZhaoWu的听课笔记】大多数公司，都存在两种问题。我创业四年，更是体会深切。这两种问题就是：老板经常不满意下属的表现；下属总是不知道老板想要什么；虽然这两种问题普遍存在，其实解决方法并不复杂。这节课，我们再聊聊第一个问题：为什么老板经常不满意下属表现?其实，这背后也是一条管理常识。管理学家德鲁克先生早就说过：管理者的任务，不是去改变人。*来自《卓有成效的管理者》只是大多数老板和我一样，都是一边
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

深度学习笔记之稀疏自编码器