无始之始

从零点五开始的深度学习笔记——VAE(Variational AutoEncoder) （一）预备知识

VAE-Variational AutoEncoder 学习笔记

1. VAE变分自动编码器
- 1.1 Stacked AutoEncoder 回顾
- 1.2 Variational AutoEncoder 结构
2. 预备知识
- 2.1 概率
- - 2.1.1 概率分布
  - 2.1.2 条件概率
  - 2.1.3 贝叶斯定理（Baye's theorem）
  - 2.1.4 全概率定理（Theorem of total probability）
- 2.2 矩阵迹计算技巧
- 2.3 KL散度 (Kullback-Leibler Divergence)
- - 2.3.1 介绍
  - 2.3.2 KL散度的属性(properties)：
  - 2.3.3 多变量正态分布之间的KL散度计算
3. 总结

1. VAE变分自动编码器

变分自动编码器是生成模型（generative model）中常见的系列之一，常见的生成模型还有GAN。这篇博文主要参考了 Ahlad Kumar视频中对VAE核心公式的解释和推导，力图将完整的实现和推导过程整理成笔记。这篇笔记所整理的内容是2019年1月11日的一个Ahlad Kumar博主的VAE系列视频教程，除此之外还加入了一些个人的理解。我们将逐渐过渡到cVAE (conditional Variational AutoEncoder)。

视频参考链接：https://www.youtube.com/watch?v=w8F7_rQZxXk

1.1 Stacked AutoEncoder 回顾

下面的图片展示了Stacked AutoEncoder的结构图（来源为lilianweng github账号中的一张图片），主要包括一个编码器，一个bottleneck和一个解码器，任务目标是重建图像（看图中的Cost function），最终得到一个bottleneck，作为图像的低维表示。

1.2 Variational AutoEncoder 结构

VAE的主要结构与Stacked AutoEncoder的别无二致，区别在于，使用了概率论的相关知识去实现编码器，和解码器，而bottleneck部分则是通过才采样获得的。想要完全理解VAE，其核心在于理解Loss函数的构成。

2. 预备知识

废话不多说，我们先来充一下电，补充点预备知识，正如标题所说，是零点五起步的学习笔记，因此对某些内容将不做进一步的介绍。

2.1 概率

2.1.1 概率分布

$p (x)$ ：随机变量 $x$ 的概率。试想，如果一个变量是随机变化阴晴不定的，那我们应该如何描述和使用它？答案是期望，我们可以简单地认为一个随机变量的期望是确定的，具有统计学意义的（粗糙地理解为可被用于计算的）。一个随机变量的期望的计算公式可以有多种写法，离散的，连续的，还有各种简化的表示方法，下面我们将它用等号串起来：
$\mathbb{E}_p\left[x\right] = \mathbb{E}_{x\sim p}\left[x\right] = \int xp(x)dx = \sum_i^k x_ip(x_i)$
由上式，可以理解为一个随机变量的期望就是这个变量沿着概率分布的加权平均。其中，离散的概率分布函数简称pmf (probability mass function)，而连续的概率的分布函数简称pdf (probability density function)

2.1.2 条件概率

$p (x ∣ y)$ ：当 $y$ 事件发生（随机变量确定）时，随机变量 $x$ 的概率，也被称为条件概率。如下图不难理解，在不同事件发生的时候，x的概率是不同的。也就是说，由于引入了更多的信息（如哪个 $y$ 事件发生了）， $x$ 时间发生的概率也会随之更新，从而给出相对而言更加准确的预测。

2.1.3 贝叶斯定理（Baye’s theorem）

贝叶斯定理的公式如下，其中 $p (y ∣ x)$ 表示后验概率posterier probability， $p (y)$ 表示先验概率prior probability, $\frac{p(x|y)}{p(x)}$ 表示可能性比例likelihood ratio， $p (x, y)$ 叫联合概率分布joint probability distribution。
$\begin{equation} \begin{aligned} p(y|x) &= \frac{p(x|y)p(y)}{p(x)}= \frac{p(x, y)}{p(x)}\\ \end{aligned} \end{equation}$
那么贝叶斯定理具体是怎么应用于生活实践中的呢？总的来说就是模型求逆的过程。首先我们得到一堆有 $x$ 有 $y$ 的数据， $y$ 是天气类型，如晴天，阴天，多云，大雨，暴雨等， $x$ 为前一天的气象参数，如气压，温度，湿度，风速等相关的信息。我们采集到了今天的气象数据 $x$ ，明天应该是什么天气？这个问题在贝叶斯定理看来就是求解 $p (y ∣ x)$ 的问题。我们可以通过历史数据，统计出不同天气出现的概率 $p (y)$ ，以及出现不同天气时，前一天的气象参数出现的概率 $p (x ∣ y)$ 。这时候，距离获得 $p (y ∣ x)$ 仅仅一步之遥，也就是利用下面的全概率定理求解出不同气象参数出现的概率 $p (x)$ 。

2.1.4 全概率定理（Theorem of total probability）

假设 $y_i$ (i=1,…,N)为N个互斥事件，那么 $x$ 事件发生的概率为：
$p(x)=\sum_i^N p(x|y_i)p(y_i)$

因此，上面的贝叶斯公式也可以写为：
$\begin{equation} p(y|x) = \frac{p(x|y)p(y)}{\sum_i^N p(x|y_i)p(y_i)} \end{equation}$

2.2 矩阵迹计算技巧

如果 $x$ 是一个标量，那么他的期望等于他的迹， $\mathbb{E}[x]=\mathbb{E}[tr(x)]$
设 $A, B, C$ 维度兼容的矩阵，那么矩阵的运算满足，期望和迹可交换，迹中的三个连乘矩阵可按序循环交换：
$\begin{equation} \begin{aligned} tr(AB) =&~tr(BA)\\ tr(ABC) =&~tr(BCA) = tr(CAB) \\ \mathbb{E}[tr(x)] =&~tr(\mathbb{E}[x]) \end{aligned} \end{equation}$
期望计算的变换
$\mathbb{E}[x^TAx] =~\mathbb{E}[tr(x^TAx)] = \mathbb{E}[tr(Axx^T)] = tr(\mathbb{E}[Axx^T])$

2.3 KL散度 (Kullback-Leibler Divergence)

2.3.1 介绍

正常人看到KL都会想要问一句，什么是KL散度？从名字上面确实是看不出KL表达的是什么意思的，因为K->Kullback， L->Leibler是KL散度提出者名字的首字母，而散度divergence，可以理解为散开的程度。KL散度是计算两个概率分布之间的距离的度量。也就是说，两个概率分布相差约大，这个计算值因该越大，反之则越小，下面是计算公式：
$\begin{equation} \mathbb{D}_{KL}\left(P||Q\right) = \sum_x P(x)log\left(\frac{P(x)}{Q(x)}\right) \end{equation}$

例子：假设有离散事件 $x$ 的可能取值为{0, 1, 2}, 概率分布 $P (x)$ 中 $P (0) = 0.36, P (1) = 0.48, P (2) = 0.16$ , 概率分布 $Q (x)$ 中 $Q(0)=Q(1)=Q(2)=\frac{1}{3}$ . 则 $P$ 和 $Q$ 的KL散度是多少？
我们已经是有计算机且会简单写点Python的成年人了，当然编程安排一下：

'''
Author       : Dianye Huang
Date         : 2022-08-23 10:04:45
LastEditors  : Dianye Huang
LastEditTime : 2022-08-23 10:21:41
Description  : 
'''

import math 
class MetricZoo(object):
    def __init__(self) -> None:
        pass
    
    @staticmethod
    def D_KL(P:list, Q:list):
        '''
        Description: 
            Kullback-Leibler Divegence which computes the distance 
            between two probability distributions. 
        @ param : P{list}    -- list of distribution  
        @ param : Q{list}    -- list of distribution
        @ return: dkl{float} -- a scalar 
        '''        
        dkl = 0 
        for p, q in zip(P, Q):
            dkl += p*math.log(p/q) # in math module, log -> ln
        return dkl

if __name__ == '__main__':
    mz = MetricZoo()
    P = [0.36, 0.48, 0.16]
    Q = [1/3]*3
    KL_P_Q = round(mz.D_KL(P, Q), 5)
    KL_Q_P = round(mz.D_KL(Q, P), 5)
    print(f'D_KL(P||Q): {KL_P_Q}')
    print(f'D_KL(Q||P): {KL_Q_P}')

    ''' ----- output
    D_KL(P||Q): 0.0853
    D_KL(Q||P): 0.09746 
    '''

2.3.2 KL散度的属性(properties)：

$\mathbb{D}_{KL} (P||Q) \ge 0$ ， $\mathbb{D}_{KL} (Q||P) \ge 0$
$\mathbb{D}_{KL} (P||Q) \neq \mathbb{D}_{KL} (Q||P)$ , 不满足对称性, 如上面代码的例子

2.3.3 多变量正态分布之间的KL散度计算

条件：
计算两个多变量正态分布(multi-variate normal distributions) $p (x)$ 和 $q (x)$ 之间的KL散度。
$\begin{equation} \begin{aligned} p(x) &= \mathcal{N}(x; \mu_1, \Sigma_1) \\ q(x) &= \mathcal{N}(x; \mu_2, \Sigma_2) \\ \mathcal{N}(x;\mu, \Sigma) &= \frac{1}{\sqrt{(2\pi)^k|\Sigma|}}exp\left(-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu)\right) \end{aligned} \end{equation}$
其中， $\mu_1$ , $\mu_2$ 为均值， $\Sigma_1$ , $\Sigma_2$ 为协方差矩阵, $x\in\mathbb{R}^k$ 为满足分布的随机变量， $|\Sigma|$ 表示 $\Sigma$ 的行列式。
结论：
$p (x)$ 和 $q (x)$ 的KL散度为：
$\begin{equation} \begin{aligned} \mathbb{D}_{KL}\left(p(x)||q(x)\right) =\frac{1}{2}\left[log\left(\frac{|\Sigma_2|}{|\Sigma_1|}\right) - k + tr\left(\Sigma_2^{-1}\Sigma_1\right)+(\mu_2-\mu_1)^T\Sigma_2^{-1}(\mu_2-\mu_1)\right] \end{aligned} \end{equation}$
证明：
直接将两个概率分布的表达式套入KL散度的公式中，然后展开简化后即可得到结论的公式，这里需要应用到很多矩阵迹的运算技巧，在上一节的预备知识中可以查到。
$\begin{equation} \begin{aligned} log~P(x)=&-\frac{k}{2}log(2\pi)\ - \frac{1}{2}log(|\Sigma_1|)-\frac{1}{2}(x-\mu_1)^T\Sigma_1^{-1}(x-\mu_1)\\ log~Q(x)=&-\frac{k}{2}log(2\pi)\ - \frac{1}{2}log(|\Sigma_2|)-\frac{1}{2}(x-\mu_2)^T\Sigma_2^{-1}(x-\mu_2)\\ \mu_1 =& \mathbb{E}_p[x] = \sum_x P(x)x\\ \Sigma_1 = & \mathbb{E}_p[(x-\mu_1)(x-\mu_1)^T] \end{aligned} \end{equation}$
带入上式，可得：
$\begin{equation} \begin{aligned} \mathbb{D}_{KL}\left(P||Q\right) =& \sum_x P(x)log\left(\frac{P(x)}{Q(x)}\right) \\ =&\sum_x P(x)\left(log~P(x) - log~Q(x)\right)\\ =&\sum_x P(x)\bigg(-\frac{k}{2}log(2\pi)\ - \frac{1}{2}log(|\Sigma_1|)-\frac{1}{2}(x-\mu_1)^T\Sigma_1^{-1}(x-\mu_1) \\ &+\frac{k}{2}log(2\pi)\ + \frac{1}{2}log(|\Sigma_2|)+\frac{1}{2}(x-\mu_2)^T\Sigma_2^{-1}(x-\mu_2)) \bigg)\\ =&\sum_x P(x)\bigg(\frac{1}{2}log\left(\frac{|\Sigma_2|}{|\Sigma_1|}\right)-\frac{1}{2}(x-\mu_1)^T\Sigma_1^{-1}(x-\mu_1)+\frac{1}{2}(x-\mu_2)^T\Sigma_2^{-1}(x-\mu_2) \bigg)\\ \end{aligned} \end{equation}$
接下来的简化大法就需要用到矩阵迹的运算公式了，精华都在这张PPT中：

$\begin{equation} \begin{aligned} \mathbb{D}_{KL}\left(P||Q\right) =&\sum_x P(x)\bigg(\frac{1}{2}log\left(\frac{|\Sigma_2|}{|\Sigma_1|}\right)-\frac{1}{2}(x-\mu_1)^T\Sigma_1^{-1}(x-\mu_1)+\frac{1}{2}(x-\mu_2)^T\Sigma_2^{-1}(x-\mu_2) \bigg)\\ =&\frac{1}{2}log\left(\frac{|\Sigma_2|}{|\Sigma_1|}\right) - \frac{1}{2}\mathbb{E}_p\left[(x-\mu_1)^T\Sigma_1^{-1}(x-\mu_1)\right] + \frac{1}{2}\mathbb{E}_p\left[(x-\mu_2)^T\Sigma_2^{-1}(x-\mu_2)\right]\\ \end{aligned} \end{equation}$
其中，第一项期望展开后为：
$\begin{equation} \begin{aligned} &\mathbb{E}_p\left[- (x-\mu_1)^T\Sigma_1^{-1}(x-\mu_1)\right] \\ =& ~\mathbb{E}_p\left[tr\left((x-\mu_1) (x-\mu_1)^T\Sigma_1^{-1}\right)\right] \\ =& ~tr\left(\mathbb{E}_p\left[(x-\mu_1) (x-\mu_1)^T\right]\Sigma_1^{-1}\right)\\ =& ~tr\left(\Sigma_1\Sigma_1^{-1}\right)\\ =& ~tr(I_k)\\ =& ~k \end{aligned} \end{equation}$
第二项期望展开后为：
$\begin{equation} \begin{aligned} &\frac{1}{2}\mathbb{E}_p\left[(x-\mu_2)^T\Sigma_2^{-1}(x-\mu_2)\right] \\ =& \mathbb{E}_p\left\{ \frac{1}{2}\left[(x-\mu_1) + (\mu_1-\mu_2)\right]^T\Sigma_2^{-1}\left[(x-\mu_1) + (\mu_1-\mu_2)\right]\right\} \\ =& \mathbb{E}_p \left\{\frac{1}{2} (x-\mu_1) ^T\Sigma^{-1}_2(x-\mu_1) + (x-\mu_1)^T\Sigma_2^{-1}(\mu_1-\mu_2) + \frac{1}{2} (\mu_1-\mu_2)^T\Sigma^{-1}_2(\mu_1-\mu_2) \right\}\\ =&tr\left\{\mathbb{E}_p \left[\frac{1}{2}\Sigma^{-1}_2(x-\mu_1)(x-\mu_1) ^T\right]\right\} + tr\left\{\left(\mathbb{E}_p[x]-\mu_1\right)^T\Sigma_2^{-1}(\mu_1-\mu_2) \right\} + \frac{1}{2}(\mu_1-\mu_2)^T\Sigma^{-1}_2(\mu_1-\mu_2)\\ =& tr\left\{\frac{\Sigma_2^{-1}\Sigma_1}{2}\right\} + 0 + \frac{1}{2}(\mu_1-\mu_2)^T\Sigma^{-1}_2(\mu_1-\mu_2)\\ \end{aligned} \end{equation}$
带入上面所有的公式，最终可得：
$\begin{equation} \begin{aligned} \mathbb{D}_{KL}\left(P||Q\right) =& \frac{1}{2}log\left(\frac{|\Sigma_2|}{|\Sigma_1|}\right) - \frac{k}{2}+ tr\left\{\frac{\Sigma_1^{-1}\Sigma_2^{-1}}{2}\right\} + \frac{1}{2}(\mu_1-\mu_2)^T\Sigma^{-1}_2(\mu_1-\mu_2) \\ =&\frac{1}{2}\left[log\left(\frac{|\Sigma_2|}{|\Sigma_1|}\right) - k + tr\left(\Sigma_2^{-1}\Sigma_1\right) + (\mu_2-\mu_1)^T\Sigma^{-1}_2(\mu_2-\mu_1)\right] \end{aligned} \end{equation}$

3. 总结

这篇博客主要记录了如何VAE的一些预备知识，尤其是记录了两个多变量正态分布的KL散度的计算的详细推导。后面的笔记将主要关注VAE提出的动机和主要思想，VAE网络权值优化的公式推导，VAE的编程实现，最后再过渡到cVAE。

最后，祝诸君周中愉快！

2022年8月24日
Dianye Huang

你可能感兴趣的:(深度学习,深度学习,变分自编码器,VAE)

卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
什么是 QueryGPT？智能查询工具如何重塑信息检索的未来？镜舟科技 StarRocks QueryGPT 数据查询数据分析多模态交互
从客户行为数据到供应链信息，从市场趋势到内部运营指标，这些数据蕴含着巨大的商业价值。然而，数据量的激增也带来了前所未有的检索挑战：如何在海量信息中快速定位所需数据？如何确保查询结果的准确性和时效性？据统计，75%的企业正受困于低效的查询工具，这已成为阻碍企业数字化转型的关键痛点。传统的数据查询方式主要依赖SQL语句或特定的查询语言，这要求用户具备专业的编程知识和对数据结构的深入理解。即使对于数据分
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
[学习] PID算法原理与实践（代码示例）极客不孤独学习算法 c语言
PID算法原理与实践文章目录PID算法原理与实践一、PID算法原理1.1PID算法概述1.定义2.应用领域3.核心目标1.2基本原理1.3数学表达离散化实现（适用于数字控制）二、实践案例（C语言）1.电机转速控制2.温度控制系统3.时钟驯服系统三、常见问题与优化1.积分饱和（Windup）问题2.噪声干扰问题3.非线性系统适配问题四、扩展方向1.数字PID与模拟PID的差异2.变参数PID（如增益
洛谷木材加工二分查找自由随风飘算法练习算法数据结构 leetcode
题目背景要保护环境题目描述木材厂有n根原木，现在想把这些木头切割成k段长度均为l的小段木头（木头有可能有剩余）。当然，我们希望得到的小段木头越长越好，请求出l的最大值。木头长度的单位是cm，原木的长度都是正整数，我们要求切割得到的小段木头的长度也是正整数。例如有两根原木长度分别为11和21，要求切割成等长的6段，很明显能切割出来的小段木头长度最长为5。输入格式第一行是两个正整数n,k，分别表示原木
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
使用 pip 命令下载 whl离线安装包、安装三希 pip
使用pip命令直接从线上下载whl离线安装包并转存到离线环境的过程实际上是分两步进行的：第一步：在线环境下载whl包bash#在具有网络连接的环境中pipdownload--only-binary=:all:--wheel--platform--python-version这里的参数说明：：需要下载的Python包名称。--only-binary=:all:：只下载二进制包（即whl文件）。--w
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
WEB3合约开发以太坊中货币单位科普穗余 Web3 web3
1wei是以太坊中最小的货币单位，就像人民币里的“分”甚至“厘”。✅以太坊单位换算关系：单位数值（与1ether的换算）说明ether1ether=10¹⁸wei主单位（用于显示）gwei1gwei=10⁹wei常用于gasprice设置wei1wei最小单位（基础单位）举个例子：1ether=1,000,000,000,000,000,000wei（10的18次方）0.000000001ethe
Uniapp跟原生android插件交互发信息（二）飞露 uni-app android 交互
一、背景在uni-app开发过程中，有时候会遇到uni-app插件或者提供的api对硬件操作不太友好，需要使用原生Android开发对应模块，为了使得双方通信方便，特意封装了一个接口，可实现Android与Uni-app互相通讯。二、内容做完以下第一、第二部分，即可实现Android与uni-app互相通信，当然双方通信有不同方式，具体情况具体分析，我的采用的方案是写Android原生插件,在un
GEO引领品牌大模型种草：迈向Web3.0与元宇宙的认知新空间 GEO科技经验分享
在数字技术的演进历程中，我们正经历着从Web2.0到Web3.0、从平面互联网到沉浸式元宇宙的范式转变。这一转变不仅重塑了数字空间的形态和交互方式，更深刻改变了品牌与用户的连接模式和价值创造逻辑。而在这个新兴的数字疆域中，生成式引擎优化（GEO）正展现出前所未有的战略价值和应用潜力，成为品牌构建元宇宙和Web3.0存在的关键能力，特别是在“品牌大模型种草”场景下，品牌如何被理解、记住、推荐，正成为
HTML页面设计——动态照片环
#前端开发##html超文本标记语言结构学习他的标签##css美化页面其实一部分的网站首页应用了照片环的原理，使得页面看起来更加美观，这里为大家分享一个简单的照片环编写。一、准备好以下素材：二、新建一个HTML文件，这里就取名“01-照片环”好了。三、现在开始编写具体内容，照片环说白了就是几个照片构成的所以body只要写就可以了，编写的时候注意图片的格式是.jpg、.png还是.gif(动态图)。
鸿蒙开发：一文了解桌面卡片
前言本文基于Api13鸿蒙的桌面卡片功能，也就是服务卡片，和Android端的小部件以及iOS端的小组件功能是一样的，只是叫法不一样，都是将应用内比较核心的功能，或者用户关注度高的功能，通过触发桌面应用进行添加到服务卡片上，进而添加到桌面上，以此达到信息展示的及时性，相关功能直达应用内的便捷效果，可以说在用户体验上，是一个质的提升。触发方式也是十分的简单，无论你是Android、iOS还是Harm
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
力扣网C语言编程题：搜索二维矩阵（右上角-＞左下角解法）魏劭逻辑编程题 C语言算法 leetcode c语言
一.简介上一篇文章关于"在二维数组中查找某个元素"的问题，提供了两种解题思路，文章如下：力扣网C语言编程题：搜索二维矩阵的普通解法与二分查找法-CSDN博客本文提供第三种解题思路：从左下角->右上角，或者右上角->左下角。二.力扣网C语言编程题：搜索二维矩阵（右上角->左下角解法）解题思路三：（换行或换列）因为题目中，数组中元素是每行元素是递增的，同时，每一行的首元素比上一行最后一个元素大，那么，
基于SIP的视频会议系统研究 weixin_33921089 数据库
摘要根据IETFSIPPING工作组提出的集中式会议模型，设计并实现了基于SIP的视频会议系统。该系统各部分可分别设计，具有良好的可扩展性。详细介绍了此系统的结构和工作原理。关键词SIP视频会议会议控制服务器会场控制媒体服务器0前言近几年来，随着计算机技术、通信技术和互联网技术的飞速发展，视频会议的应用范围正逐渐从传统的专业领域、大型企业等高端用户向中小企业等普通用户和个人用户拓展。据有关机构的分
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
Linux 驱动开发详解：从入门到实践 Jay_515 Linux 学习 linux 驱动嵌入式
本文带你深入理解Linux内核驱动的核心机制，掌握从零编写字符设备驱动的完整流程一、Linux驱动概述：内核与硬件的桥梁Linux驱动是操作系统内核的一部分，负责管理硬件设备并向上层应用程序提供统一接口。其核心价值在于：抽象硬件细节：让应用程序无需关心硬件具体实现统一设备接口：通过标准接口（如字符设备、块设备）访问硬件内核级资源管理：直接操作硬件寄存器，管理中断、DMA等Linux驱动的类型：驱动
软件架构师论文_论基于架构(ABSD)的软件设计方法及应用 June_Xiao 软件架构师架构
2022年的论文题目是基于CBSD的软件设计方法及应用，本人写了基于ABSD的软件设计方法及应用，论文离题拿了3x分，悲催，这是我的第一次考架构师，是最后一次手写版考试，是最有可能通过的一次。下面是我的论文。论基于架构的软件设计方法及应用摘要2020年5月，我司中标了某省联网收费的省站直传项目，该项目将建设一套全省收费站与省中心相互通信传输数据的平台，主要分为上传、下发、监控三个子系统。，包括收费
HarmonyOS高效数据检索方案全解析：从原理到实战代码 harmonyos
摘要在开发鸿蒙（HarmonyOS）应用的过程中，数据检索是一个绕不开的重要环节。无论是小型本地存储的数据，还是大型缓存数据，检索的效率直接影响到用户体验。本文将介绍两种经典的数据检索方法——哈希表和二分查找，结合实际场景进行分析，并提供可以直接运行的示例代码。引言随着鸿蒙系统的发展，越来越多的开发者投身于原生应用开发。但在处理数据尤其是大量数据时，如何高效地定位目标值就显得非常关键。特别是在智能
PHP ADODB 1.99版手册中文翻译
PHPADODB1.99版手册中文翻译(Tripc)感谢记事PHPADODB1.99版手册中文翻译翻译作者：Tripc------------------ADODBPHP在资料库的支援上是很令人称道的，几乎所有的知名资料库系统都有对应的函数群支援，而且支援的很完整。但很不幸的，每一群资料库支援函数无论在名称或叁数结构上，都有很大的差异，这使得PHP的系统开发者在面临更换资料库时，总会觉得痛苦万分。
虚拟空间中的AI协作与任务 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
虚拟空间与AI概述在当今信息化和数字化的时代，虚拟空间（VirtualSpace）已成为人们生活和工作的重要一部分。虚拟空间是一种通过计算机技术构建的虚拟环境，它能够模拟和增强现实世界中的各种交互和体验。而人工智能（AI）作为计算机科学的一个分支，通过模拟人类的认知能力来实现自动化和智能化的决策。虚拟空间与AI的结合，不仅为人类带来了全新的交互方式，也为各行业的发展注入了强大的动力。虚拟空间的定义
xe-utils使用总结 WebCsDn_TDCode 前端前端 javascript
toNumber(num)的使用在使用toNumber(num)转数值时，测试开发环境正常，正式环境异常对于XEUtils.toNumber("2,234.00")在正式环境出现转换千位分隔符的字符串为2的情况（具体原因不清楚，有能人志士可以答疑解惑以下），开发测试转换2234正常，对于千位分隔符的字符串需要谨慎使用，可以使用parseFloat("2,234.00".replace(/,/g,"
Vue组件自动引入插件——unplugin-vue-components 快速接入教程前端77 vue.js 前端 javascript
1.简介unplugin-vue-components是一款功能十分强大的插件，旨在简化组件的自动导入和使用，可以帮助我们在Vue项目中自动导入并注册我们使用的任何Vue组件，从而提高开发效率。unplugin-vue-components使用RollupAPI作为各种bundler/ebuild`工具API的抽象层，将Rollup风格的构建hooks和调用函数转换为与目标构建打包工具兼容的形式。
NCSC发现针对FortiGate防火墙的隐蔽反向SSH与DoH后渗透工具 FreeBuf- ssh 运维
英国国家网络安全中心（NCSC）近日发现一款名为SHOERACK的新型恶意软件工具。这款后渗透恶意软件通过隐蔽的反向SSH隧道、自定义协议滥用和DNS-over-HTTPS（DoH）技术来维持远程访问并规避检测，引发了企业安全团队的高度警惕。恶意软件来源与功能该恶意软件最初在FortiGate100D系列防火墙上被发现，被认为是开源NHAS反向SSH工具的修改版本，但增加了显著的后渗透功能增强。分
Maven 多模块项目调试与问题排查总结
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
小米YU7 3分钟大定20万台东风日产高管吐槽米粉：愚忠财经三剑客人工智能汽车
6月27日，针对“小米YU73分钟大定20万台”，东风日产三电和动力开发负责人黄照昆今日发文称，这种数据的背后意味着用户交车时间要等待一年以上，并称“任何国家都没有这种愚忠的品牌粉丝”。他还表示，再次验证了“群体会降低智慧”，这种手机行业套路很容易拉动情绪。6月27日，小米在周四发布会上推出首款SUV车型YU7，开售三分钟内大定订单突破20万台。东风日产三电和动力开发负责人黄照昆微博全文如下：小米
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他