iwill323

CS231n 2022PPT笔记- 生成模型Generative Modeling

代码：Generative Adversarial Networks (GANs)_iwill323的博客-CSDN博客

概念

密度估计

什么是生成模型

生成模型分类

PixelRNN和PixelCNN

PixelRNN

PixelCNN

Variational Autoencoders (VAE)

自编码器

VAE思想

如何训练VAE

生成数据

总结

生成对抗网络GAN

GAN思路

目标函数

训练流程

GAN的探索

总结

概念

密度估计

估计数据的内在分布情况，如下面两张图分别是一维和二维情况。

什么是生成模型

给定训练数据，训练一个模型，从相同的数据分布中生成新的样本。即下图所示，假设训练集满足分布 pdata(x)，训练一个模型pmodel(x)，它学习到的分布近似于pdata(x) ，然后用pmodel(x) 生成新样本

生成模型可以解决密度估计问题，有两种方式：

显式密度模型会显式地给出一个和输入数据的分布pmodel(x)

隐式密度模型训练一个模型，从输入数据中采样，并直接输出样本，而不用显式地给出分布的表达式。

生成模型分类

PixelRNN和PixelCNN

PixelRNN和PixelCNN要做的是对图像像素概率分布进行建模。模型分解为像素值条件概率的乘积，其中每一项为给定前i-1个像素点后第i个像素点的条件概率分布，通过最大化该似然函数（认为输入的图片必然出现的概率应该是最大）来训练模型。显然，首先需要对像素进行排序

PixelRNN

可以使用LSTM。从左上角开始一个个地生成像素。一个明显的缺点是按照顺序逐元素地计算并训练网络是十分慢的，同时在测试阶段，也是按照逐元素地生成像素，所以也会很慢

PixelCNN

使用CNN来建模像素的依赖关系。如下图，灰色区域表示此时已经处理过的像素，当前正在处理黑色位置的像素。取待生成像素点周围的像素（下图黑色框），把它们传递给CNN用来生成下一个像素值，在每一个像素点上输出结果是像素的Softmax损失值，从而最大化输入图像的似然估计。训练的时候输入图片每个像素点的值都是ground truth，。确定了第一个像素，所有后面像素就基于它生成。

相比于pixelRNN，pixelCNN在训练时可以并行的求出公式中的每一项（因为上下文区域值从训练图像中已知），然后进行参数更新。然而，测试的时候仍然要逐一生成像素点，慢。

生成的图像：分别用CIFAR-10和ImageNet作为训练集生成

比较

Variational Autoencoders (VAE)

VAE方法中定义了附加的隐变量z，通过隐变量z对密度函数进行建模，对所有可能的z值取期望。该函数不易处理，优化的时候实际上是优化似然函数的下界（？）

自编码器

自编码器是为了从没有标注的数据中无监督地学习出样本的特征表示。

自编码器由编码器和解码器组成，编码、解码是对输入x的重构。

编码器将样本 x 映射到特征 z ，z的维度比x更低，因为z保留的是训练数据x中最重要的特征。

解码器使用特征 z 重构样本，输出跟 x 有相同维度的结果。解码器所用的网络一般和编码器一样。使用L2损失函数（输入的样本 x 与重构样本x^之间的 L2 损失），也就是尽量让重构后图像的像素值和输入图像一样。

训练完之后丢掉解码器，使用训练好的编码器提取出输入的特征映射，然后使用这些特征初始化并训练一个监督模型（比如分类器）。

自编码器具有重构数据、学习数据特征、初始化一个监督模型的能力。使用无标签数据训练自编码器提取特征，作为监督学习的输入是非常有效的（有些场景下监督学习可能只有很少的带标签的训练数据，少量的数据很难训练模型，可能会出现过拟合等其他一些问题）。

VAE思想

神经网络只学会了对输入图片提取特征，并将这些特征恢复回图片，即只学会了对特定编码的解码。在码空间z里取其他值，神经网络连学都没学过，不可能正确地进行解码。所以就需要变分自编码器VAE。

VAE不是直接输出隐变量 z 而是输出图像的概率分布（假定为高斯分布）。求得z的概率分布，经过解码网络后映射得到x的近似真实分布，再在此分布上采样来生成样本。

如何训练VAE

如何从中学习出解码网络的参数，使得在标准高斯分布上采样得到的z，经过解码后得到的x的分布，刚好近似于x的真实分布？

方案是最大化样本x的似然P(x)。

在已经给定隐变量z的情况下，写出x的分布p并对所有可能的z值取期望，因为z值是连续的所以表达式是一个积分，便得到上面p(x)公示。神经网络可以模拟任意函数，所以可以通过神经网络对p(x|z)建模。问题是对于每一个z值计算p(x|z)很困难，所以积分无法计算

过程推导

不直接求p(x)，而是求logp(x)。第一步logp(x)对z取期望，是因为p(x)不依赖于z（因为p(x)一旦求出来之后就和z无关了），这么做是为了后面方便地将log项转变为KL项（第5行）。

注意到这个式子的第三项中含有p(z|x)，而

关于KL散度

KL散度详解_码猿小菜鸡的博客-CSDN博客_kl散度：KL散度（Kullback-Leibler Divergence）一般用于度量两个概率分布函数之间的“距离”。KL散度的典型应用场景如下：假设某优化问题中P(X) 是真实分布（true distribution），Q(X)是一个用于拟合P(X) 的近似分布（approximate distribution），可以尝试通过修改 Q(X) 使得二者间的KL[P(X) || Q(X)]尽可能小,来实现用 Q(X) 拟合P(X)

训练框架

训练的目的是学习出编码器的映射函数和解码器的映射函数，训练过程实际上是在进行变分推断，即寻找出某一个函数来优化目标，因此取名为变分编码器VAE(Variational Auto-encoder).

编码网络求出给定z下的x的均值μ、（对数）协方差∑，就得到了q(z|x)；p(z)的分布是N(0,I)。于是DKL项的解析式就得到了

解码网络求出给定x下的z的均值μ、（对数）协方差∑，就得到了p(x|z)。为了得到给定x下的z和给定z下的x，我们会从这些分布（p和q）中采样，现在我们的编码器和解码器网络所给出的分别是z和x的条件概率分布，并从这些分布中采样从而获得值。

需要注意的是，“采样”这一行为无法包含在计算图内，计算完loss之后，梯度无法通过“采样”这个算子反向传播到编码器网络，因此使用一种叫做再参数化reparameterization的方法，将z采样的算子分解，这样梯度不需要经过采样算子就能回流到编码器网络中（图中的loss函数可能有点问题）

让小批量的数据传递经过编码器网络得到q(z|x)，通过q(z|x)来计算KL项，然后根据给定x的z分布对z进行采样，由此获得了隐变量的样本，这些样本可以根据x推断获得；然后把z传递给第二个解码器网络，通过解码器网络获得x在给定z的条件下的均值和协方差，最终可以在给定z的条件下从这个分布中采样得到x。
训练时损失项是给定z条件下对训练像素值取对数，损失函数要做的是最大化被重构的原始输入数据的似然。对于每一个小批量的输入我们都计算这一个前向传播过程，取得所有我们需要的项，他们都是可微分的，接下来把他们全部反向传播回去并获得梯度，不断更新我们的参数，包括生成器和解码器网络的参数Θ和Φ从而最大化训练数据的似然。

生成数据

训练好变分自编码器，当生成数据时只需要用解码器网络。先从设定好的先验分布中采样，接下来对数据x采样。
在本例中通过在MNIST数据集上训练VAE，我们可以生成这些手写数字样本，我们用z表示隐变量，因为是从先验分布的不同部分采样，所以我们可以通过改变z来获得不同的可解释的意义。这里可以看到一个关于二维z的数据流形。让z在某个区间内变化，比如该分布的百分比区间，接下来让z1和z2逐渐变化，从这幅图中可以看到z1和z2的组合所生成的图像，它会在所有这些不同的数字之间光滑地过渡变化。

我们对z的先验假设是对角的，这样做是为了促使它成为独立的隐变量，这样它才能编码具有可解释性的变量。因此我们就有了z的不同维度，他们编码了不同的具有可解释性的变量。
在人脸数据上训练的模型中，随着我们改变z1，从上往下看笑脸的程度在逐渐改变，从最上面的眉头紧锁到下面大的笑脸；接下来改变z2，从左往右看发现人脸的朝向在变化，从一个方向一直向另一个方向变化。

z同时也是很好的特征表示，因为z编码了这些不同的可解释语义的信息是多少。这样我们就可以利用q(z|x)也就是我们训练好的编码器，我们给他一个输入，将图像x映射到z，并把z用作下游任务的特征，比如监督学习，分类任务。

总结

在传统自编码器上加入了随机成分，输入不是确定的，而是随机采样

定义了一个难以计算的密度函数，推导出一个下边界并优化它

Pros:
- Principled approach to generative models
- Interpretable latent space.
- Allows inference of q(z|x), can be useful feature representation for other tasks
Cons:
- Maximizes lower bound of likelihood: okay, but not as good evaluation as
PixelRNN/PixelCNN
- Samples blurrier and lower quality compared to state-of-the-art (GANs)
Active areas of research:
- More flexible approximations, e.g. richer approximate posterior instead of diagonal
Gaussian, e.g., Gaussian Mixture Models (GMMs), Categorical Distributions.
- Learning disentangled representations.

生成对抗网络GAN

GAN思路

一种隐式密度估计模型，放弃显式地对密度函数建模，而是从分布中采样并获得质量良好的样本。它解决了训练样本的分布维度高，难以采样的问题。其解决方法类似VAE，从一个简单的分布（比如符合高斯分布的随机噪声）中采样，然后使用神经网络学习一种映射可以将其转变到训练样本的分布。

GAN定义了两个网络：生成器和判别器。

生成器负责利用随机噪声z生成假样本，它的职责是生成尽可能真的样本以骗过判别器。

判别器负责辨别哪些样本是生成器生成的假样本，哪些是从真实训练集中抽出来的真样本。

GAN的训练过程就是上面提到的两个玩家的博弈过程，即生成器网络和判别器网络。

将具有指定维度的随机噪声输入到生成器网络，生成器网络将会生成图片，即来自生成器的伪样本，然后从训练集中取一些真实图片，使用判别器网络对每个图片样本做出正确的区分，这是真实样本还是伪样本。训练过程就是让生成器不断提高“造假”能力，让判别器不断提高“鉴赏”能力。如果生成器骗过了判别器，那么我们就有了很好的生成模型

目标函数

mini max博弈公式

G表示生成网络，D 表示判别网络，θd是判别器参数，θg是生成器的参数，训练目标是让目标函数在θg上取得最小值，同时在 θd上取得最大值。

第一项：pdata 表示数据的分布。Dθd(x)是判别器网络对真实数据（训练数据）x的判别结果，输出一个 0-1 的概率（0表示假，1表示真）。E表示我们考虑的是整个训练集中所有样本的一个期望，而不是具体某个样本的概率。

第二项：p(z)表示噪声的分布。使用 Gθg(z) 可以生成一个样本，Dθd(Gθg(z))代表了判别器网路对生成的伪数据的判别结果。

θd的目标：整个表达式越大越好。希望E...logDθd(x) 越大越好，即判别器对于真实样本的判别为真的期望越大越好；希望 E...log(1−Dθd(Gθg(z)))越大越好，也就是希望判别器对假的样本判别为真的概率越小越好。因此如果能最大化这一结果，就意味着判别器能够很好的区别真实数据和伪造数据。

θg的目标：整个式子越小越好。想要整个式子越小，也就是让Dθd(Gθg(z))越大越好，也就是说希望生成器判别伪造样本为真的概率越大越好。最小化这一结果意味着生成器在生成与真实样本非常相似的数据

训练流程

首先对判别器进行梯度上升，学习到θd来最大化该目标函数，假设训练集中有1000张图片，那么我们就可以随机生成1000张图片，然后训练判别器使其能够区分这2000张图片即可；对生成器进行梯度下降，θg进行梯度下降最小化目标函数，此时目标函数只取右边这一项，因为只有这一项与θg有关。交替训练生成器和判别器，每次迭代生成器都试图骗过判别器。

实际训练时，对于生成器的训练不会使用梯度下降和最小化的目标函数，如上图的蓝色曲线为 log(1−Dθd(Gθg(z)))。当生成器效果不好（D(G(z)接近0）时，梯度非常平缓，模型训练很慢；当生成器效果好（D(G(z)接近1）时，梯度很陡峭，模型更新地会过快，这也不是我们想看到的。这就与我们期望的相反了，我们希望在生成器效果不好的时候梯度更陡峭，这样能学到更多，在即将收敛的时候应该放缓更新步伐。

因此我们使用下面的目标函数来替代原来的生成器损失：

其图像如下图绿色曲线所示，它就有很好的特性，即初始时梯度大，最后梯度小，符合训练的需要，实际训练中基本都用这个式子。

完整的训练过程：在每一个训练迭代期都先训练判别器网络，然后训练生成器网络。
对于判别器网络的k个训练步，先从噪声先验分布z中采样得到一个小批量样本，接着从训练数据x中采样获得小批量的真实样本，将噪声样本传给生成器网络，并在生成器的输出端获得生成的图像。此时我们有了一个小批量伪造图像和小批量真实图像，在判别器生进行一次梯度计算，利用梯度信息更新判别器参数，按照以上步骤迭代几次来训练判别器。
之后训练生成器，采样获得一个小批量噪声样本，将它传入生成器，对生成器进行反向传播，优化目标函数。

交替进行上述两个步骤。

训练完之后，将噪声图像传给生成网络，就能生成伪造图像

GAN的探索

传统的GAN生成的样本还不是很好，这篇论文在GAN中使用了CNN架构，取得了惊艳的生成效果： Radford et al, “Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks”, ICLR 2016

联合训练两个网络很有挑战。Wasserstein GAN 一定程度解决了GAN训练中两个网络如何平衡的问题

https://github.com/soumith/ganhacks
https://github.com/hindupuravinash/the-gan-zoo

总结

Don’t work with an explicit density function
Take game-theoretic approach: learn to generate from training distribution through 2-player
game
Pros:
- Beautiful, state-of-the-art samples!
Cons:
- Trickier / more unstable to train
- Can’t solve inference queries such as p(x), p(z|x)
Active areas of research:
- Better loss functions, more stable training (Wasserstein GAN, LSGAN, many others)
- Conditional GANs, GANs for all kinds of applications

GAN不使用显式的密度函数，而是利用样本来隐式表达该函数，GAN通过一种博弈的方法来训练，通过两个玩家的博弈从训练数据的分布中学会生成数据。

GAN可以生成目前最好的样本，还可以做很多其他的事情。但是不好训练且不稳定，我们并不是直接优化目标函数，我们要努力地平衡两个网络。

GAN：简单理解与实验生成对抗网络GAN_on2way的博客-CSDN博客_生成对抗网络

参考 cs231n---生成模型 - coldyan - 博客园

https://blog.csdn.net/qq_41533576/article/details/119717790【2017CS231n】第十三讲：生成模型（PixelRNN/PixelCNN，变分自编码器，生成对抗网络）_金刚哥葫芦娃的博客-CSDN博客https://blog.csdn.net/qq_41533576/article/details/119717790

CS231n：11 生成模型 - 腾讯云开发者社区-腾讯云

简化版奇异值分解（SVD）方法详解 DuHz 数理统计学知识机器学习人工智能算法信息与通信信号处理
简化版奇异值分解（SVD）方法详解奇异值分解（SVD）是一个强大的矩阵分解工具，广泛应用于数据降维、图像压缩、机器学习等领域。然而，对于大规模数据或高维矩阵，计算和存储的开销非常大，因此提出了多种简化版的SVD方法。这些简化版方法在保证解的精度的同时，能够显著减少计算量和内存占用。本文将详细介绍几种简化版SVD方法，包括经济型SVD、随机化SVD、增量SVD、分块SVD和偏最小二乘法（PLS），并
Python爬虫——网站基本信息 IT·小灰灰 python 爬虫开发语言网络
在智能时代，数据是新的石油。Python爬虫技术赋予了我们成为数据猎人的能力，让我们能够在网络的广袤土地上狩猎，为机器学习和人工智能的发展提供燃料目录一、介绍——Python二、介绍——Python爬虫1.请求库2.解析库3.数据存储4.多线程/多进程5.异步编程6.代理和反爬虫7.爬虫框架8.爬虫的法律和道德问题9.异常处理10.日志记录三、爬虫示例代码一、介绍——PythonPython是一种
Python 自动排班表格（代码分享）趣享先生 Python案例分享专栏 python 开发语言
✅作者简介：2022年博客新星第八。热爱国学的Java后端开发者，修心和技术同步精进。个人主页：JavaFans的博客个人信条：不迁怒，不贰过。小知识，大智慧。当前专栏：Java案例分享专栏✨特色专栏：国学周更-心性养成之路本文内容：Python自动排班表格（代码分享）前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章目录前言问题描述解决步骤1
理论一、大模型—概念伯牙碎琴大模型自然语言处理 ai
一、总述大模型通常指的是参数规模庞大、训练难度较高的人工智能模型。随着深度学习技术的发展，研究人员和企业越来越倾向于构建更大的模型，以提高模型的性能和泛化能力。这些大模型往往需要大量的数据和计算资源来训练，并且在实际应用中通常表现出色。大模型全称是大型语言模型（LLM，LargeLanguageModel），这个“大”主要指模型结构容量大，结构中的参数多，用于预训练大模型的数据量大。一个大模型可以
Python：第三方库衍生星球 python 第三方库
1.第三方Python库库名用途pip安装指令NumPy矩阵运算pipinstallnumpyMatplotlib产品级2D图形绘制pipinstallmatplotlibPIL图像处理pipinstallpillowsklearn机器学习和数据挖掘pipinstallsklearnRequestsHTTP协议访问pipinstallrequestsJieba中文分词pipinstalljieba
自动驾驶系列—颠覆未来驾驶：深入解析自动驾驶线控转向系统技术学步_技术自动驾驶自动驾驶人工智能机器学习线控系统
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
Java 实现拖拽列表更新排序架构师成长进阶空间 Java spring cloud spring boot java 后端
拖拽列表更新排序，接口提供给前端这个功能主要是需要的算法逻辑很多图解：如在前端页面上想把id=5拖拽到id=3上拖拽之后的效果：解析图例：代码示例：DevToCoding｜Java面试指南、学习笔记/***拖拽数据更新排序*@paramcurrentId当前数据id*@paramtargetId目标数据id*@return*/@RequestMapping("/sort/{currentId}/{
工作计划进度表怎么做？探索主流的8款软件
本文介绍了八款主流的工作计划软件，包括：1.Worktile，2.PingCode，3.腾讯文档，4.钉钉，5.滴答清单，6.有道云笔记，7.Trello，8.Monday.com。制作工作计划进度表是确保项目按时完成的重要步骤，一个好的进度表不仅能清晰显示任务分配和截止日期，还能帮助团队成员理解自己的责任和优先级。随着项目管理工具的不断发展，市场上出现了多种软件，专门设计来帮助制作和管理工作计划
python编程入门学习（3）——自用笔记徐少19 python入门 python
目录第五章：if语句一个简单的示例条件测试if语句使用if语句处理列表第六章：字典一个简单的字典使用字典遍历字典嵌套在列表中存储字典在字典中存储列表在字典中存储字典第五章：if语句一个简单的示例#if语句示例cars=['bmw','audi','toyota','subaru']forcarincars:ifcar=='bmw':print(car.upper())else:print(car.
《一文吃透！NLTK与SpaCy，自然语言处理的神兵利器》人工智能深度学习
在人工智能的璀璨星空中，自然语言处理（NLP）无疑是最为耀眼的领域之一。它让机器能够理解、处理和生成人类语言，极大地推动了智能交互的发展。而在Python的NLP工具库中，NLTK和SpaCy就像两把锋利的宝剑，各自散发着独特的光芒。今天，就让我们深入探究这两款工具的使用技巧与优势，为你的NLP之旅增添强大助力。一、NLTK：自然语言处理的瑞士军刀NLTK（NaturalLanguageToolk
Flux架构：构建可预测的Web应用状态管理体系阿珊和她的猫架构前端
前端开发工程师、技术日更博主、已过CET6阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1牛客高级专题作者、打造专栏《前端面试必备》、《2024面试高频手撕题》蓝桥云课签约作者、上架课程《Vue.js和Egg.js开发企业级健康管理项目》、《带你从入门到实战全面掌握uni-app》前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章
”人货场”模型搞懂没？数据分析大部分场景都能用！接地气的陈老师人工智能数据分析大数据机器学习推荐系统
做数据分析的同学，很多都听过：人、货、场的分析模型。然而，这东西又是个只闻其名，不见真身的东西。到底该怎么结合实际分析？今天我们系统讲解下。问题场景：某生鲜电商，用户复购率较低，60%的用户在30天内无二次购买行为，运营领导非常着急，要求通过数据分析提升复购率，请问你作为数据分析师该怎么做？建立人工智能精准推荐算法（40%概率用协同过滤，60%用关联分析）把过往6个月月初复购率做成折线图，然后写下
Forrester发布2024年五大网络安全新威胁岛屿旅人网络安全 web安全网络安全网络安全
文章目录前言一、大选年的叙事（舆论）操控攻击二、深度伪造引发身份安全危机三、生成式人工智能数据泄露四、人工智能软件供应链攻击五、太空成为安全战略高点数据泄露平均成本高达218万美元前言人工智能正重塑网络安全格局，武器化大语言模型正成为首选攻击工具，安全团队在应对武器化人工智能攻击方面将面临日益严峻的挑战。Forrester近日发布《2024年网络安全威胁预测报告》指出，人工智能正重塑网络安全格局，
人工智能的本质解构：从二进制桎梏到造物主悖论 Somnolence.·.·.·. 人工智能人工智能 ai
一、数学牢笼中的困兽：人工智能的0-1本质人工智能的底层逻辑是数学暴力的具象化演绎。晶体管开关的物理震荡被抽象为布尔代数的0-1序列，冯·诺依曼架构将思维简化为存储器与运算器的机械对话。即使深度神经网络看似模拟人脑突触，其本质仍是矩阵乘法的迭代游戏——波士顿动力机器人的空翻动作不过是微分方程求解的物理引擎呈现，AlphaGo的围棋神话只是蒙特卡洛树搜索的概率统计。这种基于有限离散数学的架构，注定人
YOLOv11 火焰识别：智能时代的火灾预警新利器星际编程喵 Python探索之旅 YOLO python 目标检测机器学习人工智能开发语言
前言随着人工智能（AI）在各个领域如火如荼发展，图像识别技术也跟着飞速进步。从最初的传统算法到如今的深度学习模型，图像识别在准确性和效率上提升令人惊叹。而在这场技术革命中，YOLO（YouOnlyLookOnce）系列模型无疑扮演举足轻重的角色。今天，我们将目光聚焦在最新的版本——YOLOv11。别误会，YOLOv11可不是什么随便升级。它远不止数字上多了个“1”那么简单。YOLOv11集成许多先
从AI发展史看DeepSeek的崛起：技术革新与生态重构的范式突破 AI软件改变生活 AI资料人工智能 deepseek
Deepseek-R1最新可用网址整理推荐、Deepseek干货资料分享https://blog.csdn.net/ifree_code/article/details/145626999[>>>>>>>>>DeepSeek最新资料包汇总<<<<<<<<]DeepSeek最新资料包汇总https://www.kdocs.cn/l/cq8nbKQzguhC?R=L1MvNDE=人工智能（AI）的发展
【AI中的数学-人工智能的数学基石】AI的心脏：探索人工智能的算法与核心技术云博士的AI课堂 AI中的数学人工智能算法数学 AI数学大模型
第一章人工智能的数学基石第二节AI的心脏：探索人工智能的算法与核心技术人工智能（AI）的迅猛发展离不开其背后的复杂算法与核心技术。这些算法不仅决定了AI系统的性能和能力，也构成了AI应用的基础。从基础的机器学习算法到先进的深度学习模型，AI的算法生态系统丰富多样，涵盖了广泛的数学原理和计算方法。本节将深入探讨驱动AI进步的关键算法与技术，揭示其工作机制及在实际应用中的重要性。一、机器学习：智能的基
农业机器人综述：技术现状、应用场景及未来展望橙蜂智能机器人
农业机器人综述：技术现状、应用场景及未来展望引言一、农业机器人的技术现状1.感知模块2.导航与定位模块3.控制与执行模块4.通信与数据传输模块5.决策与人工智能模块6.电源管理与能源模块二、农业机器人的应用场景1.播种与施肥2.植保与除草3.采摘与收获4.土壤和作物监测5.温室管理与环境控制6.多机器人协作三、农业机器人面临的挑战1.成本较高2.环境适应性差3.技术成熟度有待提高4.数据安全和隐私
文本生成型人工智能：逻辑算法与文字组合的重构艺术 Somnolence.·.·.·. 人工智能人工智能算法重构人机交互 ai chatgpt
引言在数字化浪潮的推动下，文本生成型人工智能（如GPT系列、Claude、Deepseek等）正逐步从技术工具演化为人类社会的"数字镜像"。其本质并非简单的文字堆砌，而是基于算法逻辑对海量语言数据的学习与重组。这一过程既模仿了人类的思维模式，又受制于技术基础设施的物理边界。以下从三个维度解析其运行逻辑与技术哲学。一、数据训练：从概率统计到仿生逻辑的跨越文本生成型AI的核心在于通过神经网络模型对语言
DeepSeek正重构具身大模型和人形机器人赛道！ Robot251 重构机器人人工智能科技自动驾驶
中国人工智能公司DeepSeek（深度求索）以“低成本、高效率、强开放”的研发范式横空出世，火遍并震撼全球科技圈；DeepSeek展现出来的核心竞争力，除了低成本及推理能力，更重要的是开源模型能力追赶上了最新的闭源模型；而对具身智能领域影响最大的当属于其开源大模型DeepSeek-R1。2024年1月20日，公司发布全球首个完全通过强化学习训练的专注于推理任务的高性能语言模型DeepSeek-R1
预测股票走势的ai模型 roxxo AI模型人工智能深度学习金融
AI股票走势预测模型用深度学习+时间序列分析来构建一个股票预测AI，基于历史数据预测未来走势。1.关键功能✅AI选股（基于财务数据+技术指标）✅股票走势预测（LSTM/Transformer）✅智能筛选高增长潜力股✅可视化分析2.关键技术数据来源：YahooFinance/AlphaVantage财务分析：PE、EPS、ROE、PB、成交量机器学习选股：随机森林/XGBoost深度学习预测：LST
Java算法字母异位词分组、最长连续序列小王的Java刷题日记 java 算法开发语言数据结构 leetcode 哈希表
小王的Java刷题日记Day5记录刷题过程，作为笔记和分享，坚持每天刷题，每天进步，编程语言为Java。题目一：字母异位词分组给你一个字符串数组，请你将字母异位词组合在一起。可以按任意顺序返回结果列表。字母异位词是由重新排列源单词的所有字母得到的一个新单词。例如：输入:strs=["see","ese","say","ees","asy","baa"]输出:[["baa"],["say","asy
SoC 架构设计全面详解：从基础到实战嵌入式Jerry 面试架构系统架构 AI编程 ai 学习
一、SoC是什么？为什么重要？SoC(SystemonChip,片上系统)是一种将计算核心、存储系统、通信接口以及各种外设集成到一个单一芯片上的高度集成解决方案。它在智能手机、汽车电子、人工智能、工业控制等领域扮演着至关重要的角色。为什么SoC如此重要？高集成度：将多个功能模块集成到单个芯片上，减少了PCB板空间，提高了可靠性。高性能低功耗：相比传统多个芯片组合的方式，SoC通过优化设计大幅降低功
Spring Boot中使用RabbitMQ(2) D1561691 程序员 java-rabbitmq spring boot rabbitmq
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》，点击传送门，即可获取！MessageBroker与AMQP简介MessageBroker是一种消息验证、传输、路由的架构模式，其设计目标主要应用于下面这些场景：消息路由到一个或多个目的地消息转化为其他的表现方式执行消息的聚集、消息的分解，并将结果发送到他们的目的地，然后重新组合相应返回给消息用户调用Web服务来检索数据响
清华大学：DeepSeek 如何赋能职场应用（35 页 PDF）伟贤AI之路 AI应用 pdf
原来已经分享过清华大学的DeepSeek：从入门到精通（100页PDF）现在又来第二弹：《DeepSeek如何赋能职场应用？从提示语技巧到多场景应用》PDF里介绍了DeepSeek这一人工智能工具及其在职场中的应用，从基础模型到深度思考模型，再到联网搜索模型，展示了其在不同情境下的强大功能。通过提示语技巧和多场景应用，DeepSeek能够实现人机高效协同，提高工作效率和创作质量。文章不仅讲述了De
Acwing-基础算法课笔记之搜索与图论（spfa算法）不会敲代码的狗 Acwing基础算法课笔记图论算法笔记
Acwing-基础算法课笔记之搜索与图论（spfa算法）一、spfa算法1、概述2、模拟过程3、spfa算法模板（队列优化的Bellman-Ford算法）4、spfa算法模板（判断图中是否存在负环）一、spfa算法1、概述单源最短路径算法，处理负权边的spfa算法，一般时间复杂度为O(m)O(m)O(m)，最坏为O(nm)O(nm)O(nm)。1、建立一个队列，初始化队列里只有起始点（源点）；2、
pandas的导出csv文件的函数是_Pandas笔记2-导出csv文件爱健身的煜妹
1本文适合读者刚开始学习Pandas的新手2to_csv方法和主要参数to_csv方法可以将Series和DataFrame对象输出成逗号分隔的csv文件df.to_csv(path_or_buf,sep,na_rep,float_format,columns,header,index,index_label,mode,encoding,line_terminator,quoting,quotec
2020徐涛背诵笔记电子版pdf_徐涛、腿姐背诵笔记使用指南、汤家凤、张宇10月复习规划... 想要未知的疯狂
1.徐涛：《背诵笔记》使用指南冲刺背诵笔记只有《核心考案》30%的内容，却包含着100%的考点，后期主要用来进行知识点的巩固和强化。(1)仔细阅读书的前言，各种标示的意思，里面都写的非常清楚！(2)该背的段落文字，都用阴影标出来了，要背，至少十月底，保证自己有两个月的背书时间，每天大概40分钟，背下政治。(3)都用阴影标出来了，要背，至少十月底，保证自己有两个月的背书时间，每天大概40分钟，背下政
DeepSeek推荐未来好就业的十大专业东锋1.3 人工智能 deepseek推荐就业
一、人工智能与数据科学专业聚焦人工智能、大数据技术、计算机科学与技术、机器学习、数据科学与大数据技术等专业，构成了这一前沿领域的核心。这些专业旨在培养学生掌握从数据收集、处理到模型构建、算法优化的全流程能力。就业前景洞察人工智能已广泛渗透到医疗、金融、制造、交通等众多领域。在医疗领域，AI辅助诊断系统帮助医生更精准地识别疾病；金融行业里，智能风控模型有效防范风险。未来，算法工程师负责开发和优化各种
算法学习笔记之数学基础 threesevens 算法与数据结构算法
例1（最小公倍数与最大公约数）计算最小公倍数公式：LCM(A,B)=A*B/GCD(A,B)A与B的最小公倍数等于A*B除以A与B的最大公约数计算最大公约数：辗转相除法原理：设A与B的最大公约数为x，则A是x的倍数，B也是x的倍数，令A=ax，B=bx，A/B取整为c，则A-cB=(a-bc)x。即A与B的余数也是x的倍数 intgcd(inta,intb) { inttemp; whil
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

CS231n 2022PPT笔记- 生成模型Generative Modeling

概念

密度估计

什么是生成模型

生成模型分类

PixelRNN和PixelCNN

PixelRNN

PixelCNN

Variational Autoencoders (VAE)

自编码器

VAE思想

如何训练VAE

生成数据

总结

生成对抗网络GAN

GAN思路

目标函数

训练流程

GAN的探索

总结

你可能感兴趣的:(CS231n笔记,机器学习,深度学习,人工智能)