Hellespontus

【Image】GAN的超详细解释（以及奇怪的问题）

GAN原理

工作流程

下面是生成对抗网络（GAN）的基本工作原理

在GAN的架构中，有两个关键的组件：生成器（Generator）和鉴别器（Discriminator）。

生成器（Generator）：其功能是从随机噪声生成数据。在这个上下文中，它试图生成类似于真实数据的新数据。目的是创建足够真实的数据以欺骗鉴别器。
鉴别器（Discriminator）：它的任务是鉴别输入数据是真实的还是由生成器生成的假数据。简言之，它需要决定输入数据是“真”还是“假”。

工作过程：

真实数据会被输入到鉴别器中。
同时，生成器产生的数据也会被送入鉴别器。
鉴别器会对这两种数据进行分类，将其标记为“真”或“假”。

学习方式：生成器和鉴别器是以对抗的方式进行学习的。生成器试图生成越来越真实的数据来欺骗鉴别器，而鉴别器则试图变得更加精确以区分真实数据和生成的数据。这个过程会不断循环，随着时间的推移，生成器产生的数据会越来越接近真实数据，而鉴别器的判断能力也会越来越强（有点类似于左脚踩右脚原地起飞）。

数学解释

当然，上面的解释只是语言层面的，GAN的原理同样可以从数学上进行解释
$\min_{G} \max_{D} V(D, G) = \mathbb{E}_{x \sim p_{\text{data}}(x)}[\log D(x)] + \mathbb{E}_{z \sim p_{z}(z)}[\log(1 - D(G(z)))]$
这是生成对抗网络（GAN）的价值函数，它形式化了生成器 G 和鉴别器 D 之间的对抗游戏。其中 z 指的是上图中的 random noise（虽然这里写的是随机噪声，但是这种噪声往往也是符合某种分布的，一般来说我们认为是高斯分布，最终我们希望这个高斯分布会变成符合真实图像分布的某种分布）。

接下来，我们要非常详细地来解释这个公式

Value函数跟强化学习中的定义一样

一般来说，”真“用1表示；”假“用0表示。所以，当输入是一张”真“图时，我们希望D的值为1；当输入是一张”假“图时，我们希望D的值为0。即D(r) = 1，D(f) = 0。

看图中④的部分，loss = log(D(r))——如果输入是“真”图，这个loss值是0（也就是说如果D(r)能被准确地判断为1，那么“真”图就没有产生任何loss）；

看图中⑤的部分，loss = log(1-D(f))——如果输入是“假”图，这个loss值也是0（也就是说如果D(f)能被准确地判断为0，那么“假”图就没有产生任何loss）。

根据log函数特性，在0~1区间内函数最大值为0，所以上式的最大值就是0，在两种情况同时满足时取等。

这也就是为什么，我们希望找到一个很强的D，能够精准分出r和f，并且在这个条件下最大化V。

接下来看到G，我们知道G的目标是要愚弄D，具体就是让D(f) = D(G(z))尽可能被判断为1，这样loss = log(1-D(f)) = -∞.

这就解释了为什么一个是max_D，一个是min_G。

⑦ z~p(z)是噪声分布，即高斯分布

这里计算了期望。

综上所述，上面的公式可以表示为
$\begin{align} V(D, G) &= \int_{x} p_{\text{data}}(x) \log(D(x)) \, dx + \int_{x} p_{g}(x) \log(1 - D(x)) \, dx \\ &= \int_{x} p_{\text{data}}(x) \log(D(x)) + p_{g}(x) \log(1 - D(x)) \, dx \end{align}$
这个变换除了带入了期望公式，还做了一个变换——将真实图像与噪声统一成了x，在取值时分别取真实图像和噪声各自对应的分布——在积分中统一了形式，并减少了G。

要求积分最大值，两边求导：
$\max_D V(D) = \int_{x} p_{\text{data}}(x) \log(D(x)) + p_{g}(x) \log(1 - D(x)) \, dx \\\Leftrightarrow \\ \max_D f(D) = a\log(D) + b\log(1 - D) \\$
求偏导，解出了D的值使偏导为0，这个D也被称为D*，即最优判别器（Optimal Discriminator）
$\frac{\partial f}{\partial D} = \frac{a}{D} - \frac{b}{1 - D} = 0 \Rightarrow D^* = \frac{a}{a + b} = \frac{p_{\text{data}}(x)}{p_{\text{data}}(x) + p_{g}(x)}$
然后我们把这个最优判别器带回原式
$\min_G f(G) = \int_{x} p_{\text{data}}(x) \log \left( \frac{2p_{\text{data}}(x)}{p_{\text{data}}(x) + p_g(x)} \right) - \log 2 \, dx + \int_{x} p_g(x) \log \left( \frac{2p_g(x)}{p_{\text{data}}(x) + p_g(x)} \right) - \log 2 \, dx\\ = -\log 2 \int_{x} p_{\text{data}} + p_g \, dx + \int_{x} p_{\text{data}} \log \left( \frac{2p_{\text{data}}}{p_{\text{data}} + p_g} \right) \, dx + \int_{x} p_g \log \left( \frac{2p_g}{p_{\text{data}} + p_g} \right) \, dx$
其中
$-\log 2 \int_{x} p_{\text{data}} + p_g \, dx = -2\log2 = -\log4$

散度 Divergence

讲到这里我们穿插一下散度 (Divergence) 的概念："Divergence"是一种度量或评估两个概率分布差异的方法，它被用来比较两个分布之间的不同程度，可以帮助我们了解一个分布如何或在何种程度上不同于另一个分布。

KL散度（Kullback-Leibler Divergence）

$\text{KL - Divergence:} \quad D_{KL}(P \parallel Q) = \sum_i P(i)\log\left(\frac{P(i)}{Q(i)}\right) = \int_{x} P(x)\log\left(\frac{P(x)}{Q(x)}\right) dx$

KL散度是衡量两个概率分布P和Q差异的非对称度量。具体来说，它衡量的是，当使用概率分布Q来近似真实分布P时，所损失的信息量。
它是从信息论的视角出发的，基于信息熵的概念，其中P是真实分布，Q是模型的预测分布。
一个重要的特性是非对称性，即
$D_{KL}(P \parallel Q) \neq D_{KL}(Q \parallel P)$
这也是KL散度的一个明显的缺陷，因为分布是没有方向性的。

JS散度（Jensen-Shannon Divergence）

$\text{JS - Divergence:} \quad JSD(P \parallel Q) = \frac{1}{2}D_{KL}\left(P \parallel \frac{P+Q}{2}\right) + \frac{1}{2}D_{KL}\left(Q \parallel \frac{P+Q}{2}\right)$

JS散度是KL散度的对称版本，它衡量两个概率分布P和Q的相似性，并且总是有界的（在0和1之间）。
它的计算方式是取两个分布P和Q相对于它们的平均值的KL散度的平均值。
因为JS散度是对称的，所以它通常被认为是两个分布之间距离的更好的度量。

如此一来，我们用JS散度对上面的公式进行替换，得到

$\min_G f(G) = \int_{x} p_{\text{data}}(x) \log \left( \frac{2p_{\text{data}}(x)}{p_{\text{data}}(x) + p_g(x)} \right) - \log 2 \, dx + p_g(x) \log \left( \frac{2p_g(x)}{p_{\text{data}}(x) + p_g(x)} \right) - \log 2 \, dx\\ = -\log 2 \int_{x} p_{\text{data}} + p_g \, dx + 2JSD(p_{\text{data}} \parallel p_g)\\ = -\log 4 + 2JSD(p_{\text{data}} \parallel p_g)\\ \geq -\log 4, \quad \text{where } [p_{data} = p_g]$

这就是上面的minmax函数的最简表达形式。

Summary

Generate a discriminator (D) & a generator (G) step by step
The target of the D is to try its best to discriminate real and fake images while the target of the G is to try its best to generate fake images to fool the D.
It seems we can get a global optimality (equilibrium) by dragging →

奇怪的问题

但是，现在我们这个公式有一个很大的问题。

下面先给出一个mnist生成数字的GAN代码

# dataset: mnist
import argparse
import os
import numpy as np
import math

import torchvision.transforms as transforms
from torchvision.utils import save_image

from torch.utils.data import DataLoader
from torchvision import datasets
from torch.autograd import Variable

import torch.nn as nn
import torch

from generator import Generator
from discriminator import Discriminator

os.makedirs("images", exist_ok=True)

parser = argparse.ArgumentParser()
parser.add_argument("--n_epochs", type=int, default=200, help="number of epochs of training")
parser.add_argument("--batch_size", type=int, default=64, help="size of the batches")
parser.add_argument("--lr", type=float, default=0.0002, help="adam: learning rate")
parser.add_argument("--b1", type=float, default=0.5, help="adam: decay of first order momentum of gradient")
parser.add_argument("--b2", type=float, default=0.999, help="adam: decay of first order momentum of gradient")
parser.add_argument("--n_cpu", type=int, default=8, help="number of cpu threads to use during batch generation")
parser.add_argument("--latent_dim", type=int, default=100, help="dimensionality of the latent space")
parser.add_argument("--img_size", type=int, default=28, help="size of each image dimension")
parser.add_argument("--channels", type=int, default=1, help="number of image channels")
parser.add_argument("--sample_interval", type=int, default=400, help="interval betwen image samples")
opt = parser.parse_args()
print(opt)

# 图像的形状参数
img_shape = (opt.channels, opt.img_size, opt.img_size)
# 定义损失函数为二元交叉熵损失
adversarial_loss = torch.nn.BCELoss()

# 初始化生成器和鉴别器
generator = Generator()
discriminator = Discriminator()

# 如果CUDA可用，将网络和损失函数移动到GPU
cuda = True if torch.cuda.is_available() else False
if cuda:
    generator.cuda()
    discriminator.cuda()
    adversarial_loss.cuda()

# 配置数据加载器
os.makedirs("./data/mnist", exist_ok=True)
dataloader = torch.utils.data.DataLoader(
    datasets.MNIST(
        "./data/mnist",
        train=True,
        download=True,
        # 数据预处理：调整大小、转换为张量、标准化
        transform=transforms.Compose(
            [transforms.Resize(opt.img_size),
             transforms.ToTensor(),
             transforms.Normalize([0.5], [0.5])]
        ),
    ),
    batch_size=opt.batch_size,
    shuffle=True,
)

# 配置优化器，使用Adam优化器
optimizer_G = torch.optim.Adam(generator.parameters(), lr=opt.lr, betas=(opt.b1, opt.b2))
optimizer_D = torch.optim.Adam(discriminator.parameters(), lr=opt.lr, betas=(opt.b1, opt.b2))

# 根据CUDA环境选择数据类型
Tensor = torch.cuda.FloatTensor if cuda else torch.FloatTensor

# 开始训练
for epoch in range(opt.n_epochs):
    for i, (imgs, _) in enumerate(dataloader):
        # Adversarial ground truths
        # 创建标签数据：真实图片的标签为1，生成图片的标签为0
        valid = Tensor(imgs.size(0), 1).fill_(1.0).detach()
        fake = Tensor(imgs.size(0), 1).fill_(0.0).detach()

        # 配置输入
        real_imgs = imgs.type(Tensor)

        # -----------------
        #  Train Generator
        # -----------------
        optimizer_G.zero_grad()  # 对已有的gradient清零(因为来了新的batch_size的image)
        z = Tensor(np.random.normal(0, 1, (imgs.shape[0], opt.latent_dim)))  # 随机生成输入噪声
        gen_imgs = generator(z)  # 生成一个batch的假图片
        # Loss measures generator's ability to fool the discriminator
        g_loss = adversarial_loss(discriminator(gen_imgs),  # D(G(z))
                                  valid)                    # label = 1, 这里将假图的label置为1的原因下一篇文章会说
        g_loss.backward()  # bp, 算gradient， x.grad += dloss/dx
        optimizer_G.step()  # 更新x， x -= lr * x.grad

        # ---------------------
        #  Train Discriminator
        # ---------------------
        optimizer_D.zero_grad()
        real_loss = adversarial_loss(discriminator(real_imgs),  # D(x)
                                     valid)                     # lable = 1
        fake_loss = adversarial_loss(discriminator(gen_imgs.detach()),  # D(G(z)), 这里用到detach的原因是：gen_imgs后面带着generator的参数，而这里训练的是discriminator的参数
                                     fake)                              # lable = 0
        d_loss = (real_loss + fake_loss) / 2  # 计算鉴别器的总损失
        d_loss.backward()  # bp, 算gradient， x.grad += dloss/dx
        optimizer_D.step()  # 更新x， x -= lr * x.grad

        print(
            "[Epoch %d/%d] [Batch %d/%d] [D loss: %f] [G loss: %f]"
            % (epoch, opt.n_epochs, i, len(dataloader), d_loss.item(), g_loss.item())
        )

        # 每隔一定的间隔保存生成的图片
        batches_done = epoch * len(dataloader) + i
        if batches_done % opt.sample_interval == 0:
            save_image(gen_imgs.data[:25], "images/%d.png" % batches_done, nrow=5, normalize=True)

generator.py

import torch.nn as nn
import numpy as np

# 定义生成器输入的噪声向量的维度和生成图像的形状
latent_dim = 100
img_shape = (1, 28, 28)

# 定义Generator类，继承自nn.Module
class Generator(nn.Module):
    # 初始化函数
    def __init__(self):
        super(Generator, self).__init__()  # 调用父类的构造函数

        # 定义一个block函数用于构建神经网络的层，其中包含线性层，可选的批标准化层和LeakyReLU激活函数
        def block(in_feat, out_feat, normalize=True):
            layers = [nn.Linear(in_feat, out_feat)]  # 线性层
            if normalize:
                # 如果normalize为True，则添加批标准化层
                layers.append(nn.BatchNorm1d(out_feat, 0.8))
            # 添加LeakyReLU激活函数，其中negative_slope（斜率）设置为0.2
            layers.append(nn.LeakyReLU(0.2, inplace=True))
            return layers  # 返回构建的层列表

        # 使用Sequential模块将所有层堆叠成一个完整的模型
        self.model = nn.Sequential(
            *block(latent_dim, 128, normalize=False),  # 第一层不进行批标准化
            *block(128, 256),  # 后续层逐渐增加输出特征的维度
            *block(256, 512),
            *block(512, 1024),
            # 最后一层是一个线性层，它的输出大小与图像大小的乘积相同
            nn.Linear(1024, int(np.prod(img_shape))),
            nn.Tanh()  # 使用Tanh激活函数将输出值限制在[-1,1]之间，因为图像数据通常归一化到这个范围
        )

    # 前向传播函数定义了模型如何从输入产生输出
    def forward(self, z):
        img = self.model(z)  # 使用model生成图像数据
        # 调整输出的形状，使其与目标图像形状一致
        img = img.view(img.size(0), *img_shape)
        return img  # 返回生成的图像

discriminator.py

import torch.nn as nn
import numpy as np

# 图像的形状参数
img_shape = (1, 28, 28)

# 定义Discriminator类，继承自nn.Module
class Discriminator(nn.Module):
    # 初始化函数
    def __init__(self):
        super(Discriminator, self).__init__()  # 调用父类的构造函数

        # 构建鉴别器的神经网络模型，使用Sequential容器
        self.model = nn.Sequential(
            # 输入层，将输入向量的维度从图像形状展平为一维向量
            nn.Linear(int(np.prod(img_shape)), 512),
            # 使用LeakyReLU作为激活函数，其斜率设置为0.2
            nn.LeakyReLU(0.2, inplace=True),
            # 中间层，继续减少特征的维度
            nn.Linear(512, 256),
            # 同样使用LeakyReLU激活函数
            nn.LeakyReLU(0.2, inplace=True),
            # 输出层，将特征压缩为一个单一的预测值
            nn.Linear(256, 1),
            # 使用Sigmoid激活函数将输出值压缩到[0,1]之间，作为真假图像的概率
            nn.Sigmoid(),
        )

    # 前向传播函数定义了模型如何从输入产生输出
    def forward(self, img): # img.shape = torch.Size([64, 1, 28, 28]) = 64 * 1 * 28 * 28
        # 将输入图像展平为一维向量
        img_flat = img.view(img.size(0), -1)  # (64, -1 = 1 * 28 * 28)
        # 将展平的图像向量传递给模型，并得到有效性预测
        validity = self.model(img_flat)
        return validity  # 返回预测的有效性（即图像为真实图像的概率）

然而，看看最后生成的结果

我们初始的噪声其实是很不一样的，但是一个非常奇怪的现象是——我们最后确实又生成了很多一样的东西。甚至，二行四列和三行四列（或者二行二列和五行三列）的两个明显是生成错了，但即便是错也是错得十分相似。

这其中的问题还是挺严重的。欲知后事如何，且听下回分解~

Qt—QLabel 使用总结王宪笙 Qt常用控件使用总结 qt 数据库开发语言
参考链接：Qt—QLabel使用总结一、简述QLabel(标签控件)提供了一个文本或图像的显示，没有提供用户交互功能。一个QLabel可以包含以下任意内容类型：-纯文本：使用setText()设置一个QString富文本：使用setText()设置一个富文本的QString图像：使用setPixmap()设置一个图像动画：使用setMovie()设置一个动画数字：使用setNum()设置int或d
探索Labelbox：打造自定义标注应用的利器！孔旭澜Renata
探索Labelbox：打造自定义标注应用的利器！去发现同类优质开源项目:https://gitcode.com/项目介绍Labelbox是一款专为企业级客户设计的高级数据标注工具。它允许用户构建自己的定制标注界面（编辑器），提供强大的API和SDK，以适应各种复杂的数据标注需求。无论你是人工智能研究者、数据科学家还是软件开发者，Labelbox都能帮助你高效、精准地处理你的数据。技术分析Label
2025美赛数学建模F题：网络安全强大——思路+代码+模型灿灿数模分号 web安全安全网络
详细思路更新见文末名片2025ICM问题F:网络安全强大？背景：我们世界的更多部分已经通过现代技术的奇迹互联起来。尽管这种在线连接性提高了全球生产力，并使世界变得更小，但它也增加了我们个人和集体在网络犯罪方面的脆弱性。网络犯罪之所以难以应对，原因有很多。许多网络安全事件跨越国界，使得调查和起诉这些犯罪时的管辖问题变得复杂。此外，许多机构，如投资公司，宁愿支付赎金而不报告被黑客攻击，避免让客户和潜在
2025美赛数学建模MCM/ICM选题建议与分析，思路+模型+代码灿灿数模分号数学建模
2025美赛数学建模MCM/ICM选题建议与分析,思路+模型+代码，详细更新见文末名片一、问题A：测试时间：楼梯的恒定磨损（ArchaeologicalModeling）适合专业：考古学、历史学、数学、机械工程难度：中等开放度：中等问题A让学生探索如何根据楼梯的磨损情况推断楼梯的使用情况。这个问题涉及到对磨损的定量分析，并通过历史记录推测使用模式。该题目适合对历史、考古以及机械磨损有兴趣的学生，尤
chatgpt赋能python：如何配置Python中的NumPy？ yakuchrisfor ChatGpt chatgpt python numpy 计算机
如何配置Python中的NumPy？如果您是一名Python程序员，那么您可能已经听说过NumPy。NumPy是一个强大的Python库，可用于处理大型多维数组和矩阵，以及用于数值计算和科学计算。因此，NumPy是数据科学中的黄金库，而它的安装是Python编程环境必不可少的一部分。什么是NumPy？NumPy是Python语言的一个扩展程序库，它支持大量的高级数学函数，以及可以高效地操作大型数组
集群部署时的分布式 Session 如何实现？码农小旋风后端
面试题集群部署时的分布式Session如何实现？面试官心理分析面试官问了你一堆Dubbo是怎么玩儿的，你会玩儿Dubbo就可以把单块系统弄成分布式系统，然后分布式之后接踵而来的就是一堆问题，最大的问题就是分布式事务、接口幂等性、分布式锁，还有最后一个就是分布式Session。当然了，分布式系统中的问题何止这么一点，非常之多，复杂度很高，这里只是说一下常见的几个问题，也是面试的时候常问的几个。面试题
海思媒体处理平台架构分析海思平台记录 linux 嵌入式
1.系统架构编辑2.海思媒体处理平台架构编辑主要分为：视频输入（VI）：VI模块捕获视频图像，可对其做剪切、去噪等处理，并输出多路不同分辨率的图像数据。视频处理（VPSS）：VPSS模块接收VI和解码模块发送过来的图像，可对图像进行图像增强、锐化等处理，并实现同源输出多路不同分辨率的图像数据用于编码、预览或抓拍。视频编码（VENC）：编码模块接收VI捕获并经VPSS处理后输出的图像数据，可叠加用户
C++蓝桥杯入门训练之Fibonacci数列 Lurkerhunter 蓝桥杯算法 c++
C++蓝桥杯题目讲解汇总(持续更新)Fibonacci数列资源限制时间限制：1.0s内存限制：256.0MB问题描述Fibonacci数列的递推公式为：Fn=Fn−1+Fn−2F_n=F_{n-1}+F_{n-2}Fn=Fn−1+Fn−2，其中F1=F2=1F_1=F_2=1F1=F2=1当n比较大时，FnF_nFn也非常大，现在我们想知道，FnF_nFn除以10007的余数是多少。输入格式输入包
遥感中的反演 ximenchuixuezijin 工作农业算法金山网络 io
反演在遥感中是什么意思？按楼主的需求回答：一句话--遥感的本质是反演。具体解释：遥感的本质是反演，而从反演的数学来源讲，反演研究所针对的首先是数学模型。因此，遥感反演的基础是描述遥感信号或遥感数据与地表应用之间的关系模型，也就是说，遥感模型是遥感反演研究的对象。要进行遥感反演研究，首先要解决的问题是对地表遥感像元信息的地学描述。遥感像元尺度上的地学描述是十分有意义的课题，由于地球表面是一个复杂的系
1.Introduction to Spring Web MVC framework Freeking1024 Spring MVC 前端 mvc spring
WebMVCframework文档：22.WebMVCframework(spring.io)概述WebMVC框架（WebModel-View-ControllerFramework）是一种用于构建Web应用程序的软件架构模式。MVC模式将应用程序分为三个主要组件：模型（Model）、视图（View）和控制器（Controller）。这种分离有助于组织代码和简化开发和维护过程。以下是MVC框架的三
ARM Cortex-A(armV8)编程手册V1.0：指令集与源码应用指南 AWS云计算
本文还有配套的精品资源，点击获取简介：ARMCortex-A(armV8)编程手册V1.0详细介绍了ARM架构的V8版本，提供了对armV8指令集的深入理解，强调了C和C++源码在实际开发中的应用。手册涵盖了armV8指令集增强，包括向量处理、浮点运算和内存访问优化等，以及新的安全特性如硬件虚拟化。通过C/C++示例，指导开发者如何编写高效代码，利用armV8架构的优势，并解释了内存一致性模型和并
matlab神经网络遥感反演,基于BP神经网络的盐渍土盐分遥感反演模型研究老许的花开 matlab神经网络遥感反演
采用遥感技术和BP神经网络技术,结合野外实测的盐渍土光谱特征和实验室化验的土壤含盐数据,对盐渍土盐分的遥感反演进行了模型的设计与编程实现。BP神经网络模型的预测精度在62.5%,明显高于传统统计模型的预测精度,表明BP神经网络能较好地模拟土壤含盐量与光谱数据之间的关系,可用于建立土壤盐分遥感反演模型。更多还原【Abstract】Theresearchonsalinityinversionfromr
《DirectX 12 3D游戏开发实战》读书笔记1：数学基础 tikris 3d 游戏 c++矩阵线性代数
文章目录学习内容内容关于浮点类型误差解决方案参数与D3D数据结构向量类型XMVECTOR与XMFLOATn：XMVECTOR与XMFLOATn的相互转化：取得某个分量或者将某个分量转换为XMVECTOR类型：参数向量特点：表示方法：运算求模：单位化(规范化、标准化等同义)：正交化：加(减)法：乘法：其他函数杂项点常向量矩阵矩阵的传参矩阵的初始化XMMATRIX和XMFLOAT4X4的转换运算矩阵的
【Python报错】已解决NameError: name ‘Image‘ is not defined 云天徽上 python 开发语言 numpy pandas 机器学习
解决Python报错：NameError:name‘Image’isnotdefined在使用Python进行图像处理时，我们经常使用Pillow库（PIL的一个分支）。如果你在尝试创建或处理图像时遇到了NameError:name'Image'isnotdefined的错误，这通常意味着你的代码中存在一些问题。本文将介绍这种错误的原因和解决办法。错误原因NameError:name'Image'
Aligner：自动修正AI的生成结果，北大推出残差修正模型对齐技术蚝油菜花每日 AI 项目与应用实例人工智能人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发非常感兴趣，我会每日分享大模型与AI领域的最新开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术，欢迎关注我哦！微信公众号｜搜一搜：蚝油菜花快速阅读技术背景：Aligner是北京大学团队提出的大语言模型对齐技术，通过学习对齐答案与未对齐答案之间的修正残差来提升模型性能。核心优势：作为即插即用的模块，可以直接应用于各种开源和基于API的模型
cruise软件模型，混动仿真模型，IMMD架构混联混动仿真模型，Cruise混动仿真模型，混联混动汽车动力性经济性仿真「已注销」汽车 matlab 开发语言
cruise软件模型，混动仿真模型，IMMD架构混联混动仿真模型，Cruise混动仿真模型，混联混动汽车动力性经济性仿真。关于模型1.本模型是基于IMMD架构搭载的混联混动仿真模型，关于IMMD架构详细信息请自行查询。模型是基于cruise/simulink搭建的base模型，策略模型基于MATLAB/Simulink平台搭建完成，通过C++编译器编译成dll文件给CRUISE引用，实现联合仿真。
2025 AI行业变革：从DeepSeek V3到o3-mini的技术演进 Light60 AI应用产业篇人工智能 DeepSeek-V3 o3-mini
【核心要点】DeepSeekV3引领算力革命，成本降至1/20o3-mini以精准优化回应市场挑战AI技术迈向真正意义的民主化行业生态正在深刻重构一、市场格局演变发展脉络2025年初，AI行业迎来重要转折。DeepSeek率先发布V3模型，通过革命性的架构创新和算力优化，将AI应用成本降至历史新低。这一突破引发广泛关注，推动AI技术加速走向普及。随后，OpenAI推出o3-mini作为战略性回应，
cruise软件模型，混动仿真模型，IMMD架构混联混动仿真模型，Cruise混动仿真模型 fguynpx 程序人生
cruise软件模型，混动仿真模型，IMMD架构混联混动仿真模型，Cruise混动仿真模型，混联混动汽车动力性经济性仿真。关于模型1.本模型是基于IMMD架构搭载的混联混动仿真模型，关于IMMD架构详细信息请自行查询。模型是基于cruisesimulink搭建的base模型，策略模型基于MATLABSimulink平台搭建完成，通过C++编译器编译成dll文件给CRUISE引用，实现联合仿真。2.
ArcGIS土地利用数据制备、分析及基于FLUS模型土地利用预测（数据采集、处理、分析、制图）赵钰老师 ArcGIS 生态系统遥感 arcgis 数据分析
FLUS（FlexibleLandUseSimulation）模型是一个用于模拟土地利用变化的模型，它结合了经济理论、土地利用和土地覆盖变化的动态过程。FLUS模型由美国农业部农业经济研究服务局（ERS）开发，旨在提供对美国及全球土地利用变化的预测。以下是FLUS模型的一些关键特点：土地利用变化：模拟不同土地利用类型之间的转换，如从农田到城市用地或森林。经济驱动：模型基于经济原则，模拟土地所有者如
大语言模型丨ChatGPT-4o深度科研应用、论文与项目撰写、数据分析、机器学习、深度学习及AI绘图（BP神经网络、支持向量机、决策树、随机森林、变量降维与特征选择、群优化算法等）赵钰老师 ChatGPT python 人工智能语言模型深度学习数据分析 chatgpt 机器学习随机森林
目录第一章、2024大语言模型最新进展与ChatGPT各模型第二章、ChatGPT-4o提示词使用方法与高级技巧（最新加入思维链及逆向工程及GPTs）第三章、ChatGPT4-4o助力日常生活、学习与工作第四章、基于ChatGPT-4o课题申报、论文选题及实验方案设计第五章、基于ChatGPT-4o信息检索、总结分析、论文写作与投稿、专利idea构思与交底书的撰写第六章、ChatGPT-4o编程入
基于IMMD架构的Cruise混动仿真模型及策略详解 ExhNGUa 程序人生
cruise软件模型，混动仿真模型，IMMD架构混联混动仿真模型，Cruise混动仿真模型，混联混动汽车动力性经济性仿真。关于模型1.本模型是基于IMMD架构搭载的混联混动仿真模型，关于IMMD架构详细信息请自行查询。模型是基于cruisesimulink搭建的base模型，策略模型基于MATLABSimulink平台搭建完成，通过C++编译器编译成dll文件给CRUISE引用，实现联合仿真。2.
微服务02：如何解决或者说降低架构复杂度？爆炸糖_Alex 微服务架构微服务云原生
1.什么是CAPCAP定理，也被称为Brewer定理，是分布式计算中的一个重要概念。它由计算机科学家EricBrewer于2000年提出，并由SethGilbert和NancyLynch于2002年正式证明。CAP定理强调了分布式系统中三个关键属性之间的固有权衡，这三个属性分别是：一致性（Consistency）可用性（Availability）分区容忍性（PartitionTolerance）以
Django 模型 wjs2024 开发语言
Django模型Django模型是Django框架的核心组件之一，它用于定义应用程序的数据结构。在Django中，模型是Python类，通常继承自django.db.models.Model。每个模型类代表数据库中的一个表，模型类的属性对应表中的字段。1.创建模型创建Django模型非常简单。首先，你需要定义一个继承自django.db.models.Model的类，然后在类中定义模型字段。例如，
本地部署DeepSeek-R1 1.5B 狂笑韦恩大模型 deepseek
第一步，下载ollama:ollama然后安装ollama然后打开windowspowershell然后输入ollamarundeepseek-r1:1.5b等待ollama下载完模型，就是可以使用了ollamarundeepseek-r1:1.5bpullingmanifestpullingaabd4debf0c8…89%▕████████████████████████████████████
MVC 模式与javaEE三层架构剥包谷 java javaWeb-mvc 三层架构
MVC设计模式mvc这种设计模式，不光运用于Web领域，而且也能用于非Web领域；可以特指一种表现层设计模式，不限于Java语言；JavaWeb应用中应用的最广泛的设计模式便是MVC模式，目前的主流Web框架大多也是基于MVC设计模式所编写的。MVC模式主要分为以下三个基础模块：Model模型：主要负责、javaBean封装数据、业务逻辑以及数据库的交互View视图：主要用于显示数据和提交数据Co
DeepSeek R1 Ollama本地化部署全攻略：三步实现企业级私有化大模型部署 Coderabo DeepSeek R1 Ollama
前言Ollama作为当前最受欢迎的本地大模型运行框架，为DeepSeekR1的私有化部署提供了便捷高效的解决方案。本文将深入讲解如何将HuggingFace格式的DeepSeekR1模型转换为Ollama支持的GGUF格式，并实现企业级的高可用部署方案。文章包含完整的量化配置、API服务集成和性能优化技巧。—一、基础环境搭建1.1系统环境要求操作系统：Ubuntu22.04LTS或CentOS8+
Spark 任务与 Spark Streaming 任务的差异详解 goTsHgo spark-streaming 分布式大数据 spark streaming 大数据分布式
Spark任务与SparkStreaming任务的主要差异源自于两者的应用场景不同：Spark主要处理静态的大数据集，而SparkStreaming处理的是实时流数据。这些差异体现在任务的调度、执行、容错、数据处理模式等方面。接下来，我们将从底层原理和源代码的角度详细解析Spark任务和SparkStreaming任务的差别。1.任务调度模型差异1.1Spark任务的调度模型Spark的任务调度基
C语言：整型提升南玖yy c语言开发语言
一，整型提升C语⾔中整型算术运算总是⾄少以缺省（默认）整型类型的精度来进⾏的。为了获得这个精度，表达式中的字符和短整型操作数在使⽤之前被转换为普通整型，这种转换称为整型提升。整型提升的意义：表达式的整型运算要在CPU的相应运算器件内执⾏，CPU内整型运算器(ALU)的操作数的字节⻓度⼀般就是int的字节⻓度，同时也是CPU的通⽤寄存器的⻓度。因此，即使两个char类型的相加，在CPU执⾏时实际上也
【python】在【机器学习】与【数据挖掘】中的应用：从基础到【AI大模型】小李很执着杂乱无章机器学习数据挖掘 python 人工智能语言模型
目录一、Python在数据挖掘中的应用1.1数据预处理数据清洗数据变换数据归一化高级预处理技术1.2特征工程特征选择特征提取特征构造二、Python在机器学习中的应用2.1监督学习分类回归2.2非监督学习聚类降维三、Python在深度学习中的应用3.1深度学习框架TensorFlowPyTorch四、Python在AI大模型中的应用4.1大模型简介4.2GPT-4o实例五、实例验证5.1数据集介绍
DeepSeek点燃国产大模型斗志，RAG等核心技术被重估量子位
原创关注前沿科技量子位黑马DeepSeek-R1的崛起，给外国网友上演了一场来自东方的震撼。一边，OpenAI和Claude都破了大防，一个声讨“窃取”，一个嘲讽“落后”，两家水火不容的对手竟然以这种戏剧性的方式，鲜有地达成了一致。另一边，微软、亚马逊等云服务厂商，甚至英伟达都开启了“真香”模式，你追我赶地在自家云平台上线DeepSeek-R1。但不管破防还是真香，DeepSeek-R1都已经成为
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>