milu_ELK

【AI绘图学习笔记】Probabilistic Diffusion Model概率扩散模型

参考：Probabilistic Diffusion Model概率扩散模型理论与完整PyTorch代码详细解读
由浅入深了解Diffusion Model

文章目录

回顾VAE
Diffusion Model
- 扩散过程forward
- 逆扩散过程reverse
- Diffusion训练
总结
加速Diffusion采样和方差的选择(DDIM)

回顾VAE

在上节我们了解了VAE的原理，总体来说可以分为两个过程，一个是使用 $q (z ∣ x)$ 给Encoder进行前向学习的过程，另一个是使用 $p (x ∣ z)$ 给Decoder进行逆向推理的过程。

多层VAE模型和单层VAE实际上是类似的，只不过在单层基础上，我们将其视为一个马尔科夫链，因此每一个概率只与前一个概率有关，

上面是我们利用詹森不等式得到的置信下界。

上面是概率的链式法则（马尔科夫链下的），我们把这个代入上面的最大似然，可以得到下界可以写为这种形式：

这就是多层VAE的目标函数。

Diffusion Model

之所以要先介绍VAE，是因为实际上多层VAE的过程和Diffusion Model很像。

Diffusion Model的原理是先对目标 $x_0$ 逐步正向加噪得到最终的分布 $x_T$ ,然后再用逆向推理的过程逐步去噪,由 $x_T$ 得到 $x_0$ 。

上图就是Diffusion Model的可视化过程，总的来说就是加噪的扩散过程（熵增过程） $q(x_t|x_{t-1})$ ，也就是上图第一行，我们可以看到随着加噪图像逐渐变得无序。
而对于一张给定的噪声图片 $x_T$ ，Diffusion Model在学习了去噪的逆向推理过程 $p(x_{t-1}|x_t)$ 后，就可以产生一个新的图片，也就是上图的第二行，（从T时刻到0时刻）可以看到我们生产了新的样本，它和原来我们用于加噪的训练图片大致是相似的。
第三行是漂移量，从中我们可以看到上一时刻和下一时刻的图像像素运动方向。

扩散过程forward

1.给定初始数据分布 $x_0 \sim q(x)$ ，可以不断地向原始分布中添加高斯噪声（仿射变换），该噪声的标准差是以固定值 $\beta_t$ 确定的，均值（期望）以固定值 $\beta_t$ 和当前 $t$ 时刻的数据 $x_t$ 决定。这个过程是一个马尔科夫链。

2.随着 $t$ 的不断增大，最终的数据分布 $x_T$ 就变成了一个各向独立的高斯分布

关于 $x_t$ 服从的高斯分布的算法，其实就是我们上节讲过的重采样技巧，我们从正态分布中取样一个 $z$ ，然后计算 $x=\sigma z+\mu$ 得到 $x$ 的采样值。利用重采样技巧对 $x_{t-1}$ 迭代就能求得 $x_t$ 的高斯分布。并且 $q(x_t|x_0)$ 满足马尔科夫链。

注意： $\beta_t \in (0,1)$ ，并且随着时间推移会越来越大。

3.任意时刻的 $q(x_t)$ 推导也可以完全基于 $x_0$ 和 $\beta_t$ 来计算，而不需要迭代，下面是计算过程：

这里我们需要用到参数重整化技巧，我们令 $\alpha_t=1-\beta_t，\overline \alpha_t=\displaystyle\prod^{T}_{t=1} \alpha_i$ ，接下来将上式 $q(x_t|x_{t-1})$ 代入重采样技巧 $x_t=\sigma z_{t-1}+\mu=\sqrt{\beta}z_{t-1}+\sqrt{1-\beta}x_{t-1}$ 得到：

$x_t=\sqrt{\alpha_t}x_{t-1}+\sqrt{1-\alpha_t}z_{t-1} ~~~~~z_{t-1},z_{t-2}均...\sim N(0,I)$

我们将上式中的 $x_{t-1}$ 用关于 $x_{t-2}$ 的式子替换：
$x_t=\sqrt{\alpha_t}(\sqrt{\alpha_{t-1}}x_{t-2}+\sqrt{1-\alpha_{t-1}}z_{t-2})+\sqrt{1-\alpha_t}z_{t-1}\\ =\sqrt{\alpha_t \alpha_{t-1}}x_{t-2}+\sqrt{\alpha_t-\alpha_t\alpha_{t-1}}z_{t-2}+\sqrt{1-\alpha_t}z_{t-1}$

给出一个基本结论(独立分布可加性）：两个正态分布 $\sim N(\mu_1,\sigma_1^2)和Y \sim N(\mu_2,\sigma_2^2)$ 得到的叠加分布 $a X + bY$ 的均值为 $a\mu_1+b\mu_2$ ，方差为 $a^2\sigma_1^2+b^2\sigma_2^2$ ，所以 $\sqrt{\alpha_t-\alpha_t\alpha_{t-1}}z_{t-2}+\sqrt{1-\alpha_t}z_{t-1}$ 由于 $\sim N(0,I)$ ，所以对应的叠加分布均值就是 $\mu=0+0=0$ ，方差 $\sigma^2=a^2+b^2=\alpha_t-\alpha_t\alpha_{t-1}+1-\alpha_t=1-\alpha_t\alpha_{t-1},$ 因此代入重采样公式即为 ${\sigma}z+\mu=\sqrt{1-\alpha_t\alpha_{t-1}}z$

$x_t=\sqrt{\alpha_t \alpha_{t-1}}x_{t-2}+\sqrt{1-\alpha_t\alpha_{t-1}}\overline z_{t-2}~~(\overline z_{t-2}是混合高斯，但仍是标准正态分布)\\ =...\\ =\sqrt{\overline\alpha_t}x_0+\sqrt{1-\overline\alpha_t}z$

结论：
$x_t=\sqrt{\overline\alpha_t}x_0+\sqrt{1-\overline\alpha_t}z~~~~~(3)$

因此任意时刻的 $q(x_t)$ 都可以基于 $x_0$ 和 $\beta_t$ 来计算而不需要迭代：

$q(x_t|x_0)=N(x_t;\sqrt{\overline\alpha_t}x_0,({1-\overline\alpha_t})I)$ ，这样我们就能以这个高斯分布采样出 $x_t$ 而不需要t次迭代了。

所以 $\alpha$ 更像是类似学习率的参数，因为 $\beta$ 会越来越大，所以 $\alpha$ 会越来越小，因此足够多的时刻之后 $\sqrt{\alpha} \to 0,\sqrt{1-\alpha} \to 1$ ，因此当到达 t 时刻， $q(x_t|x_0)=N(x_t;0,I)$ 会收敛于一个标准的正态分布，这样我们就能求出这个最大的时刻 $t$ 了。从学习率上表现的性质就是如果用 $x_t$ 预测 $x_0$ ，前面阶段的生成会很快显示出图像的底样，而越往后越慢，越是需要生成更多的细节。

（上图表示了 $\bar \alpha_t$ 和扩散步骤的关系)

从这里我们可以看到Diffusion Model 和VAE的一些区别，
首先在VAE中参数是通过前向逆向过程预测出来的，但diffusion里是给出一个固定参数后进行训练。
其次在VAE中采样的隐变量 $z$ 和 $x$ 是有一定关联的，而diffusion中的 $x_t$ 最终是一个标准正态分布，和 $x$ 无关了。
此外在VAE中 $x$ 和 $z$ 的维度不一定一样，而diffusion中 $x_0....x_t$ 的维度始终是一样的。

逆扩散过程reverse

如果说前向过程是一个加噪的过程，那么逆向过程就说去噪推断的过程，如果我们能够逐步得到逆转后的分布 $q(x_{t-1}|x_t)$ ，就可以从标准正态分布 $x_t \sim N(0,I)$ 还原出原图分布 $x_0$ ，文献¹中证明了如果 $q(x_{t-1}|x_t)$ 满足高斯分布且 $\beta_t$ 足够小，那么 $q(x_{t-1}|x_t)$ 仍然是高斯分布，如果逐步地对 $x_t...x_0$ 进行拟合来找到其服从的高斯分布参数，实在难以计算。所以我们需要构建一个参数分布来去做估计，逆向扩散过程仍然是一个马尔科夫链。

我们使用深度学习模型（参数为 $\theta$ ,目前主流是U-Net+attention的结构）去预测这样的一个逆向的分布 $p_\theta$ 。（类似VAE）:

虽然我们无法得到逆转后的分布 $q(x_{t-1}|x_t)$ ,但是如果我们知道 $x_0$ ，可以通过以下的公式进行计算:

$q(x_{t-1}|x_t,x_0)=N(x_{t-1};\tilde\mu(x_t,x_0),\tilde\beta_tI)~~~~(6)$

推理如下：

我们用贝叶斯公式推理下(7-1):
$q(a|b,c)=\frac{q(a,b,c)}{q(b,c)}$
其中链式法则 $q (a, b, c) = q (b ∣ a, c) q (a ∣ c) q (c)$ ， $q (b, c) = q (b ∣ c) q (c)$
因此代入原式 $=\frac{q(b|a,c)q(a|c)q(c)}{q(b|c)q(c)}=\frac{q(b|a,c)q(a|c)}{q(b|c)}$ ，由于是马尔科夫链，上式还等价于 $q(b|c)\frac{q(a|c)}{q(b|c)}$

我们可以看到在(7-1)式子中，我们使用贝叶斯公式，将这个逆向过程转化为了前向过程，(7-2)为其对应的高斯分布概率密度函数。我们将其展开得到式子(7-3),其中与 $x_{t-1}$ 无关的项例如只包含了 $x_t \& x_0$ 的项都被归入了 $C(x_t,x_0)$

（高斯分布的概率密度函数是 $f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$ )

我们之前说过 $q(x_{t-1}|x_t)$ 仍然是高斯分布，也就意味着上式可以被整理为高斯分布的式子，对应的一般高斯概率密度函数的指数部分为 $exp(-\frac{(x-\mu)^2}{2\sigma^2})=exp(-\frac{1}{2}(\frac{1}{\sigma^2}x^2-\frac{2\mu}{\sigma^2}x+\frac{\mu^2}{\sigma^2}))$ ，和(7-3)整理出来的形式是对应的，因此：

用前向时讲到的 $\beta$ 代替方差 $\sigma^2$ ，得到：

由于扩散过程讲过的推断3，我们得知任意时刻的 $x_t$ 可以由 $x_0$ 和 $\beta$ 表示。因此:

$x_0=\frac{1}{\sqrt{\bar\alpha_t}}(x_t-\frac{\beta_t}{\sqrt{1-\bar\alpha_t}}\bar z_t)~~~$ ( $x_t$ 式子变形）

将其代入到（8-2）得到

其中的高斯分布 $\bar z_t$ 为深度模型所预测的噪声（用于去噪），可看做为 $z_\theta(x_t,t),$ 得到：

我们经过了一连串的计算，先得到 $q(x_{t-1}|x_t)$ 的高斯分布概率密度函数，然后将其整理为高斯分布指数部分的一般形式，由此得到对应的均值和方差，其中方差 $\beta$ 是定值，而均值 $\mu$ 再表示为由 $x_t,t$ 为参数的函数形式

这样一来,DDPM的每一步的推断可以总结为：

1) 每个时间步通过 $x_t$ 和 $t$ 来预测高斯噪声 $z_\theta(x_t,t)$ ,随后根据(9)得到均值 $\mu_\theta(x_t,t)$

2) 得到方差 $\Sigma_\theta(x_t,t)$ ,DDPM中使用untrained $\Sigma_\theta(x_t,t)=\tilde \beta_t$ （也就是不训练方差作为固定参数），且认为 $\tilde \beta_t=\beta_t$ 和 $\tilde \beta_t=\frac{1-\bar \alpha_{t-1}}{1-\bar \alpha_t} \cdot \beta_t$ 结果近似

3) 根据(5-2)得到 $q(x_{t-1}|x_t)$ ,利用重参数技巧得到 $x_{t-1}$

重复上述步骤逐步去噪，直到计算出 $x_0$ ,去噪过程完毕。

Diffusion训练

讲完了前向加噪的扩散过程和逆向去噪的推断过程（虽然文字上来看原理很简单，但是公式好繁杂）。现在我们讲讲如何训练diffusion model以得到靠谱的参数 $\mu_\theta(x_t,t)和\Sigma_\theta(x_t,t)$ ，方法还是最大对数似然（此处用的最小化负对数似然）。

由于整个Diffusion模型和VAE很相似，训练过程也是，由于KL散度恒大于0，因此我们在负对数似然上加上一个KL散度就构成了它的上界（和VAE最大对数似然的时候正好相反，那时是减去一个KL散度是下界)：

利用詹森不等式，我们就能得到（这块看的不太细，记住结论就好)：

我们进一步对 $L_{VLB}$ 进行推导，可以得到熵与多个KL散度的累加²，其中分母是扩散过程，分子是逆扩散过程：

（上式【从 $L_{VLB}$ 开始为第一行】第四行到第五行又是应用了贝叶斯公式，先逆向马尔科夫链补上了一个 $x_0$ 再应用了和之前前向中讲到的一模一样的贝叶斯公式)
第六行的第三项 $\sum^T_{t=2}log\frac{q(x_t|x_0)}{q(x_{t-1}|x_0)}$ 可化简,最后与第四项以及第一项可合并，最终得到了第七行的式子

最后一行将其简化为了含有KL散度的式子，其中 $L_T$ 不含参（q分布不含参， $x_T$ 逆向过程最终为纯高斯噪声)相当于常量可以直接忽略， $L_{t-1}$ 是逆扩散过程的KL散度，最后考虑的还是 $L_{t-1}和L_0$ 。

并且由于 $q和p_{\theta}$ 其实都是高斯分布，并且 $q$ 是关于参数 $\beta_t$ 的高斯分布，且 $\beta_t$ 是untrained的固定参数(忘记的,点此回去)， $p_{\theta}$ 的高斯分布均值是 $\mu_{\theta}$ ,方差是 $\Sigma_\theta$ 且 $\Sigma_\theta$ 也是untrained的固定参数。因此可训练的参数 $\theta$ 只在 $p_\theta$ 中。

上面刚才推导的式子也可写为：

给出一个结论：对于两个高斯分布p，q而言，它们的KL散度可等价为
$D_{KL}(p,q)=log\frac{\sigma_2}{\sigma_1}+\frac{\sigma_1^2+(\mu_1-\mu_2)^2}{2\sigma_2^2}-\frac{1}{2}$
让我们把 $L_{t-1}$ 的式子用上式表示出来，得到:

(此处 $L_{t-1}$ 应该是笔误，实为 $L_t$ ， $L_{VLB}$ 给出的是 $t = 2$ 开始，在(14-3)中已经被改为 $t = 1$ 开始到 $T - 1$ )

然后将 $\tilde \mu_t$ 用(8-2)替换， $\mu_\theta$ 用(9)替换， $x_t$ 用(3)替换，得到：

从(16)可以看出，diffusion训练的核心就是取学习高斯噪声 $\bar z_t,z_\theta$ 之间的均方误差MSE。论文中作者说我们可以将(16)式子中前面的这个系数给直接丢掉，这样训练会更稳定。

最后论文给出的式子，我们将 $\bar z_t$ 替换为 $\epsilon$ ， $z_\theta$ 替换为 $\epsilon_\theta$ ,DDPM将loss进一步简化为：

训练过程可以看做：

1）获取输入 $x_0$ ，从1…T随机采样一个 $t$
2) 从标准高斯分布采样一个噪声 $\epsilon \sim N(0,I)$
3) 最小化loss函数

总结

最后我们给出DDPM提供的训练/测试（采样）流程图

在训练过程中，我们要输入 $x_0$ 进行随机采样时刻 $t$ 并采样噪声 $\epsilon$ ，然后对loss函数进行梯度下降直到拟合。而在测试采样过程中，我们则利用马尔科夫链逆向逐步去噪计算 $x_T$ 直到 $x_0$ 作为最后的生成结果。

加速Diffusion采样和方差的选择(DDIM)

通过遵循反向扩散过程的马尔可夫链从DDPM生成样品非常慢，因为高质量生成需要的 $T$ 最多要走一千步或是几千步。“例如，从 DDPM 采样大小为 20 × 50 的 32k 图像大约需要 32 小时，但从 Nvidia 2080 Ti GPU 上的 GAN 采样不到一分钟。”
这就导致diffusion的前向过程非常缓慢。在denoising diffusion implicit model (DDIM)中提出了一种牺牲多样性来换取更快推断的手段。

一种简单的方法是运行一个跨步的采样，通过每隔 $\lceil T/S \rceil$ 步进行采样更新，总共采样 $S$ 步，这样就能有效减少采样数量。

另一种方法是重写 $q_\sigma(x_{t-1}|x_t,x_0)$ 的标准差 $\sigma_t$ ：
根据(3)我们可知：

（第二步利用了独立高斯分布可加性)

最终得到的(18)将方差 $\sigma_t^2$ 迎入到了均值中，当 $\sigma_t^2=\tilde \beta_t=\frac{1-\bar \alpha_{t-1}}{1-\bar \alpha_t}$ 时，(18)等价于(6)。我们给定一个 $\eta$ 作为控制采样随机性的超参数 $\sigma_t^2=\eta \tilde \beta_t$ （作用类似于调整方差的大小),当 $\eta=1$ 的时候就等价于DDPM，当 $\eta=0$ 的时候是DDIM

（上图是不同设置的扩散模型在 CIFAR10 和 CelebA 数据集上的 FID 得分，包括了DDIM( $\eta=0$ )以及DDIM( $\hat \sigma$ )( $\eta=1$ ））

根据上表可知，数据量较小时DDIM的训练更快，而数据量较大时使用DDPM并采用更大的方差效果更好

与DDPM相比，DDIM能够：

1.使用更少的步骤生成更高质量的样本。
2.具有“一致性”属性，因为生成过程是确定性的，这意味着以同一潜在变量为条件的多个样本应该具有类似的高级特征。
3.由于一致性，DDIM 可以在潜在变量中执行语义上有意义的插值。

Feller, William. “On the theory of stochastic processes, with particular reference to applications.” Proceedings of the [First] Berkeley Symposium on Mathematical Statistics and Probability. University of California Press, 1949. ↩︎
Feller, William. “On the theory of stochastic processes, with particular reference to applications.” Proceedings of the [First] Berkeley Symposium on Mathematical Statistics and Probability. University of California Press, 1949. ↩︎

AI助力基因遗传疾病检测：现状与未来 t0_54program 大数据与人工智能人工智能个人开发
在现代医学领域，与基因紊乱相关疾病的早期检测至关重要。像肺癌，早期诊断的患者5年生存率可达57%，而四期癌症患者生存率仅3%。阿尔茨海默病的早期检测，能让患者改变生活方式、参与临床试验并提前治疗脑部退化症状，有效延长生命。尽管基因检测对评估晚发性阿尔茨海默病的可能性有帮助，对早发性阿尔茨海默病也有指示作用，但其检测技术仍有待完善。目前，仅基于生物学研究的疾病检测技术多样，虽对特定病例精确，但通常需
Python的一点基础教程------文件读写卡提西亚 python 开发语言
最近在看大佬写的Python教程自学,但是感觉有点头痛,因为大佬讲了一些底层的结构和原理,但是又没那么详细,然后作为一个初学者自学的情况下,看的很费劲.看完就有感而发,想写一篇更基础的教程,教会大家怎么去用它,尽量少的去讲原理.但是当然,你也需要有一定的编程语言基础,了解基本的语法和函数等功能.正所谓师傅领进门,修行在个人,有时候我们学了一个东西,如果觉得很有趣,自然就会去了解关于它的更多信息,但
AI写作实战：从零开始撰写项目提案 SuperMale-zxq AI编程写作投资专栏 AI写作 java 人工智能 AI编程 python
AI写作实战：从零开始撰写项目提案为什么大多数项目提案一出生就已经死亡？还记得上周看到一封邮件吗？一位读者小李发了他精心准备的项目提案，希望有人给些建议。打开附件的那一刻，我叹了口气——这又是一份"自嗨式提案"：密密麻麻的文字堆砌、技术术语泛滥、价值主张模糊不清。我发现数千份项目提案中，有超过80%在开头几分钟就失去了读者的注意力。更残酷的是，决策者通常只会花60秒浏览你的提案，如果没有在这短暂时
CG-05 角度传感器转动灵敏寿命长可长期用在灰尘等恶劣环境
产品概述本产品采用非接触原理360度传感，机械轴传动采用两个双密封式轴承，转动灵敏度高。连接轴采用不锈钢304制造，品质出色。该产品可取代早期塑料电阻产品，寿命长，能长期使用于灰尘等恶劣环境。功能特点◆检测精度高，系统采用低功耗节能设计，数字处理技术◆量程宽，稳定性好◆数据信息显示线性度好，信号传输距离长，抗外界干扰能力强适用范围角度传感器对角度有着极强的角度分辨率，对转动的位置进行稳定的信号输出
【重构推荐系统】国产大模型驱动的电商个性化推荐完整实战：架构设计、推理优化与在线部署闭环观熵国产大模型部署实战全流程指南重构人工智能 Agent 智能体落地方案
个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到
CG-23H 超声波风速风向传感器--易风（加热型） sun15369027572 大数据
产品概述易风超声波风速风向传感器是一款基于超声波原理研发的风速风向测量仪器，利用发送的声波脉冲，测量接收端的时间或频率（多普勒变换）差别来计算风速和风向。该传感器可以同时测量风速，风向的瞬时数值，支持电流、电压信号输出以及RS485、NB-IoT、LoRa、4G及以太网等传输方式。整机外壳采用ABS材质，具有重量轻、没有移动部件、坚固实用的特点，而且不需维护和现场校准，能同时输出风速和风向。可以与
MySQL事务深度解析：原理、优化及最佳实践木木丰 mysql mysql 数据库 java windows
MySQL中的事务（Transaction）是数据库操作的基本单位，它代表着一组逻辑上相互关联的操作，要么全部成功，要么全部失败。这种“要么全做，要么全不做”的特性确保了数据库的完整性和一致性。事务在MySQL中扮演着至关重要的角色，特别是在处理复杂业务逻辑和并发访问时。下面将详细探讨MySQL事务的概念、使用方法、注意事项以及在实际应用中的最佳实践。一、事务的概念事务是一个不可分割的工作逻辑单元
深入详解：决策树算法的概念、原理、实现与应用场景猿享天开算法决策树机器学习
深入详解：决策树算法的概念、原理、实现与应用场景决策树（DecisionTree）是机器学习中一种直观且广泛应用的监督学习算法，适用于分类和回归任务。其树形结构易于理解，特别适合初学者。本文将从概念、原理、实现到应用场景，全面讲解决策树，并通过流程图和可视化示例增强理解，通俗易懂，帮助小白快速掌握决策树算法相关知识。1.决策树的概念1.1什么是决策树？决策树通过一系列条件判断（决策节点）将输入数据
[学习] PID算法原理与实践（代码示例）极客不孤独学习算法 c语言
PID算法原理与实践文章目录PID算法原理与实践一、PID算法原理1.1PID算法概述1.定义2.应用领域3.核心目标1.2基本原理1.3数学表达离散化实现（适用于数字控制）二、实践案例（C语言）1.电机转速控制2.温度控制系统3.时钟驯服系统三、常见问题与优化1.积分饱和（Windup）问题2.噪声干扰问题3.非线性系统适配问题四、扩展方向1.数字PID与模拟PID的差异2.变参数PID（如增益
[学习] C语言编程中线程安全的实现方法（示例）极客不孤独学习 c语言安全
C语言编程中线程安全的实现方法在多线程编程中，线程安全（ThreadSafety）是一个非常重要的概念。当多个线程同时访问共享资源时，如果没有合理的同步机制，就可能导致数据竞争、死锁甚至程序崩溃。本文将详细介绍在C语言中如何实现线程安全的几种主要方式，并提供可以实际运行的代码示例。文章目录C语言编程中线程安全的实现方法一、什么是线程安全？二、C语言中线程安全的实现方式方法一：互斥锁（Mutex）✅
代码随想录算法训练营第52天 | 101.孤岛的总面积、102.沉没孤岛、103.水流问题、104.建造最大岛屿 Amor_Fati_Yu 算法 java 数据结构
101.孤岛的总面积importjava.util.*;publicclassMain{privatestaticintcount=0;privatestaticfinalint[][]dir={{0,1},{1,0},{-1,0},{0,-1}};//四个方向privatestaticvoidbfs(int[][]grid,intx,inty){Queueque=newLinkedList=gr
Golang Fiber框架最佳实践：如何构建企业级应用 Golang编程笔记 Golang编程笔记 Golang开发实战 golang 开发语言后端 ai
GolangFiber框架最佳实践：如何构建企业级应用关键词：Golang、Fiber框架、企业级应用、最佳实践、Web开发摘要：本文聚焦于GolangFiber框架在企业级应用构建中的最佳实践。详细介绍了Fiber框架的背景、核心概念、算法原理、数学模型等基础知识，通过具体的代码案例展示了如何搭建开发环境、实现和解读源代码。同时探讨了Fiber框架在实际应用场景中的应用，推荐了相关的学习资源、开
代码随想录算法训练营第52天| 101. 孤岛的总面积、102. 沉没孤岛、103. 水流问题、104.建造最大岛屿扛过今天777 算法深度优先
101.孤岛的总面积卡码题目链接：101.孤岛的总面积学习链接：代码随想录题解：法一：count=0defdfs(grid,x,y):globalcountgrid[x][y]=0count+=1directions=[[1,0],[0,1],[-1,0],[0,-1]]fori,jindirections:next_x=x+inext_y=y+jifnext_x=len(grid)ornext_
Git使用基本指南 LEIX_lll git
一、Git基础配置首先需要配置用户信息，让Git知道你是谁：gitconfig--globaluser.name"你的名字"gitconfig--globaluser.email"你的邮箱@example.com"如果需要查看配置信息，可以使用：gitconfig--list二、仓库操作1.创建新仓库gitinit该命令会在当前目录下创建一个新的Git仓库。2.克隆已有仓库gitclone[远程仓
川翔云电脑全新上线：三维行业高效云端算力新选择渲染101专业云渲染电脑 houdini maya blender 3d 云计算
一、核心定位与优势云端虚拟工作站服务依托云端高性能CPU/GPU集群，提供远程桌面服务，支持普通设备运行专业软件。按需付费模式：无需采购高端硬件，大幅降低成本投入。生态协同优势：与渲染101同属母公司，可在云电脑中完成创作后一键提交至渲染101平台进行分布式渲染。二、硬件配置与性能参数CPU机型（侧重计算能力）GPU机型（图形渲染/AI训练）性能亮点支持最高8卡并联，显存叠加提升复杂场景处理能力。
深入研究 Golang 领域的 Fiber 框架架构 Golang编程笔记 golang 架构网络 ai
深入研究Golang领域的Fiber框架架构关键词：Golang、Fiber框架、架构、高性能、Web开发摘要：本文将深入探讨Golang领域的Fiber框架架构。我们会先介绍背景知识，包括目的、预期读者等。接着用通俗易懂的方式解释核心概念，如Fiber框架的各个组成部分，以及它们之间的关系。然后详细阐述核心算法原理、数学模型，通过实际代码案例展示其应用。还会介绍Fiber框架的实际应用场景、推荐
Prompt Engineering for Large Language Models 三月七꧁ ꧂ 论文合集llm+prompt prompt 语言模型人工智能自然语言处理 pdf javascript 前端
题目大型语言模型的快速工程简介随着OpenAI的ChatGPT和Google的Bard等软件的普及，大语言模型（LLM）已经渗透到生活和工作的许多方面。例如，ChatGPT可用于提供定制食谱，建议替换缺失的成分。它可用于起草研究提案、用多种编程语言编写工作代码、在语言之间翻译文本、协助政策制定等等（Gao2023）。用户通过“提示”或自然语言指令与大型语言模型进行交互。精心设计的提示可以带
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
【RAG面试题】LLMs已经具备了较强能力,存在哪些不足点? 一叶千舟 AI面试题【RAG】RAG
目录LLMs核心不足点1、知识过时与静态性（LackofReal-Time&DynamicKnowledge）：2、幻觉与事实性错误（Hallucinations&FactualInaccuracies）：3、领域专业知识深度不足（LimitedDomain-SpecificExpertise）：4、缺乏透明度和可追溯性（LackofTransparency&Traceability）：5、上下文
算法竞赛备考冲刺必刷题（C++） | 洛谷 P8814 解密热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P8814[CSP-J2022]解密-洛
Java注解的实现原理 empti_ Java基础 java
Java注解的实现原理Java注解的实现涉及Java语言规范、编译器处理和JVM支持等多个层面。下面我将详细解释注解在Java中的实现机制。一、注解的本质注解本质上是一种特殊的接口，所有注解类型都隐式继承自java.lang.annotation.Annotation接口。当你定义一个注解时：public@interfaceMyAnnotation{Stringvalue();}编译器实际上会生成
【网络】Linux 内核优化实战 - net.core.rmem_max 锅锅来了 Linux性能优化原理和实战网络 linux 运维
目录参数作用与原理默认值与查看方法调整场景与方法适用场景调整方法与其他参数的协同性能影响与注意事项典型案例总结net.core.rmem_max是Linux内核中控制套接字接收缓冲区（ReceiveBuffer）最大允许值的参数。它与net.core.rmem_default（默认值）共同决定了网络数据接收的性能上限和内存使用策略。以下是详细解析：参数作用与原理核心功能：限制单个套接字接收缓冲区的
微信小程序跳转其他小程序以及跳转网站
一、跳转其他小程序1.1知道appid和页面路径wx.navigateToMiniProgram({appId:appid,//替换为目标小程序AppIDpath:pathWithParams,//小程序路径envVersion:'release',//开发版、体验版或正式版success(res){console.log("跳转到其他小程序成功！",res);},fail(err){consol
MCP-Proxy：开发多LLM & 多MCP 支持并安全访问MCP Server的秘密 IT古董技术杂谈安全 MCP MCP-Proxy
在构建多模型、多协议、可控可信的大模型接入平台时，MCP-Proxy扮演着关键中枢。它不仅要支持多个LLM接入，还要保障对后端MCPServer的安全访问、请求审计、能力切换与资源隔离。什么是MCP/MCP-Proxy？MCP（ModelCapabilityProtocol）是新一代模型能力调用协议，类似于OpenAI的API，但可支持：多厂商大模型（OpenAI、DeepSeek、Yi、Chat
构建医学文献智能助手：基于 LangChain 的专业领域 RAG 系统实践
前言在当今医疗科技快速发展的时代，每天都有数以千计的医学研究成果在全球范围内发表。从临床试验报告到基础研究论文，从流行病学调查到药物研发数据，这些专业文献承载着推动医学进步的重要知识。然而，面对如此海量且专业性极强的文献资料，医疗从业者往往感到力不从心。如何在有限的时间内，准确把握文献核心价值，并将其转化为临床实践的指导？这个问题一直困扰着整个医疗行业。1.项目背景与业务价值1.1医学文献阅读的困
Spring AI快速入门学java的cc spring 大数据 java
一、引入依赖org.springframework.aispring-ai-starter-model-openaiorg.springframework.aispring-ai-bom${spring-ai.version}pomimport二、配置模型spring：ai:openai:base-url:https://dashscope.aliyuncs.com/compatible-mode
Python爬虫实战：全方位爬取知乎学习板块问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫学习开发语言 scrapy 游戏
1.项目背景与爬取目标知乎是中国最大的知识问答社区，聚集了大量高质量的学习资源和经验分享。爬取知乎“学习”板块的问答数据，可以为学习资料整理、舆情分析、推荐系统开发等提供数据支持。本项目目标：爬取“学习”话题下的热门问答列表抓取每个问答的标题、作者、回答内容、点赞数、评论数等详细信息实现动态加载内容的抓取，包含图片和富文本避免被反爬机制限制，保证数据采集稳定结合数据分析，为后续应用打基础2.知乎“
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比