tzc_fly

为自监督学习重构去噪扩散模型

在这项研究中，作者检验了最初用于图像生成的去噪扩散模型（DDM）的表示学习能力。其理念是解构DDM，逐渐将其转化为经典的去噪自动编码器（DAE）。这一解构过程让大家能够探索现代DDM的各个组成部分如何影响自监督的表征。观察到，只有极少数现代组件对学习好的表征至关重要，而其他许多组件则不重要。研究最终得出了一种高度简化的方法，在很大程度上类似于经典的DAE。

来自：Deconstructing Denoising Diffusion Models for Self-Supervised Learning

背景概述

去噪是当前计算机视觉和其他领域生成模型的核心。如今，这些方法通常被称为去噪扩散模型（DDM），学习了一种去噪自编码器（DAE），它可以去除由扩散过程驱动的多个级别的噪声。这些方法实现了令人印象深刻的图像生成质量，尤其是高分辨率、逼真的图像。这不禁让人想到，这些生成模型非常好，似乎对理解视觉内容有很强的表示。

虽然DAE是当今生成模型的强大力量，但它最初是为了以自监督的方式从数据中学习表示而提出的。在当今的表示学习社区中，DAE最成功的变体可以说是基于“masking noise”，例如预测语言中的缺失文本（例如，BERT）或图像中的缺失patch（例如，MAE）。然而，在概念上，这些基于mask的变体与去除加性噪声（例如，高斯噪声）存在显著不同：mask的token明确指定未知与已知内容，但在分离加性噪声的任务中没有明确的信号可用。然而，今天的DDM主要基于加性噪声，这意味着它们可以在不显式标记未知和已知内容的情况下学习表示。

最近，人们对DDM的表征学习能力越来越感兴趣。特别是，这些研究直接来自最初用于生成的预训练DDM，并评估其表示质量以进行识别。他们报告说，使用这些模型取得了令人鼓舞的结果。然而，这些开创性的研究显然留下了悬而未决的问题：这些现成的模型是为生成而设计的，而不是识别；目前还不清楚表示能力是通过去噪过程还是扩散过程获得的。

在这项工作中，作者对这些最近的探索相关初始化的方向进行了更深入的研究。不像之前使用面向生成的现成（off-the-shelf）DDM，作者训练面向识别的模型。核心是解构DDM，逐步将其转变为经典的DAE。通过这个解构性的研究过程，作者考察了现代DDM的每一个方面，目的是学习表征。这一研究过程使我们对DAE学习良好表示的关键组件有了新的理解。

令人惊讶的是，作者发现主要的关键组件是标记器（tokenizer），它创建了一个低维的潜在空间。有趣的是，这一观察结果在很大程度上独立于tokenizer的具体情况：作者探索了标准VAE、patch-wise VAE、patch-wise AE和patch-wise PCA编码器。发现使DAE能够实现良好的表示的是低维潜在空间，而不是tokenizer的细节。

由于PCA的有效性，解构轨迹最终达到了一个与经典DAE高度相似的简单架构（图1）。使用patch-wise PCA将图像投影到潜在空间上，添加噪声，然后通过逆PCA将其投影回来。然后训练一个自动编码器来预测去噪图像。作者将这种架构称为“潜在去噪自动编码器”（l-DAE，latent Denoising Autoencoder）。

图1：这种简单的架构在很大程度上类似于经典的DAE（主要区别是将噪声添加到潜在的DAE中），并实现了有竞争力的自监督学习性能。

解构轨迹还揭示了DDM和经典DAE之间的许多其他有趣的特性。例如，即使使用单个噪声水平（即，不使用DDM的噪声scheduling），也可以让l-DAE获得不错的结果。使用多个级别的噪声的作用类似于一种形式的数据增强，这可能是有益的，但不是一个促成因素。根据这一点和其他观察结果，作者认为DDM的表示能力主要是通过去噪驱动的过程获得的，而不是扩散驱动的过程。

最后，作者将结果与以前的基线进行比较。一方面，我们的结果比现有的结果要好得多：这正如预期的那样，因为这是解构的起点。另一方面，结果没有达到基线对比学习方法和基于mask的方法，但差距缩小了。研究表明，在DAE和DDM的方向上还有更多的研究空间。

去噪扩散模型

解构研究始于去噪扩散模型。简要描述了DDM如下。

扩散过程从干净的数据点 $z_{0}$ 开始，按顺序添加噪声。在指定的时间step $t$ ，加噪后的数据 $z_{t}$ 为： $z_{t}=\gamma_{t}z_{0}+\sigma_{t}\epsilon$ 其中， $\epsilon\sim N(0,I)$ 是一个从高斯分布采样的noise map， $\gamma_{t}$ 和 $\sigma_{t}$ 分别定义了信号和噪声的scaling因子。此外， $\gamma_{t}^{2}+\sigma_{t}^{2}=1$ 。

以时间step $t$ 为条件，学习去噪扩散模型来去除噪声。不同于DAE预测干净的输入，DDM预测噪声 $\epsilon$ 。损失为最小化： $||\epsilon-net(z_{t})||^{2}$ 其中， $net(z_{t})$ 是网络输出。在给定以时间步长 $t$ 为条件的噪声调度下，针对多个噪声水平来训练网络。在生成过程中，迭代地应用经过训练的模型，直到它达到干净信号 $z_{0}$ 。

DDM可以在两种类型的输入空间上操作。一个是原始像素空间，其中原始图像 $x_{0}$ 直接用作 $z_{0}$ 。另一种选择是在tokenizer产生的潜在空间上构建DDM，见图2b。在这种情况下，预训练的tokenizer $f$ （通常是一个自编码器），比如VQVAE被用于 $z_{0}=f(x_{0})$ 。

DiT：Diffusion Transformer
该研究从DiT开始，选择这种基于Transformer的DDM有几个原因：i.与其他基于UNet的DDM不同，基于Transformer的架构可以与Transformer驱动的其他自监督学习基线进行更公平的比较；ii.DiT在编码器和解码器之间有更清晰的区别，而UNet的编码器和解码器通过skip连接，并且在评估编码器时可能需要在网络改动上付出额外的努力；iii.DiT的训练速度比其他基于UNet的DDM快得多，同时实现了更好的生成质量。

作者使用DiT-Large（DiT-L）变体作为DDM基线。在DiT-L中，编码器和解码器加在一起的大小为ViT-L（24个blocks）。作者评估编码器的表示质量（linear probe accuracy），编码器有12个blocks，称为 $\frac{1}{2}L$ （half large）。

Tokenizer
DiT是潜在扩散模型（LDM）的一种形式，它使用VQGAN tokenizer。VQGAN tokenizer将(256,256,3)的输入图像转换到 $(32, 32, 4)$ 的latent map。

开始的baseline
默认情况下，作者在ImageNet上以256×256像素的分辨率训练400个epochs的模型。DiT baseline的结果见表1（第一行）。使用DiT-L，作者报告使用其 $\frac{1}{2}L$ 编码器的线性探头精度为57.5%。该DiT-L模型的生成质量为11.6。

重构扩散模型

解构轨迹分为三个阶段。作者首先调整了DiT中以生成为中心的设置，使其更倾向于自监督学习。接下来，逐步解构和简化tokenizer。最后，作者试图扭转尽可能多的DDM驱动设计，将模型推向经典的DAE。

用于自监督学习的DDM重定向

虽然DDM在概念上是DAE的一种形式，但它最初是为了生成图像而开发的。DDM中的许多设计都面向生成任务。有些设计对于自监督学习是不合法的（例如，涉及类别标签）；如果不考虑视觉质量，则其他一些是不必要的。在本节中，作者为了自监督学习的目的重新调整了DDM基线，总结见表1。

表1：从DiT baseline开始，并在ImageNet上评估其线性探针精度（acc）。每一行都基于对前一行的修改。使用类标签的灰色条目不是自监督学习的结果。

移除类别-条件
高质量的DDM通常在类标签上进行条件训练，这可以在很大程度上提高生成质量。但是，在自监督学习中，标签的使用是不行的。作为第一步，作者在baseline中删除类条件。令人惊讶的是，尽管生成质量如预期的那样受到极大的损害（FID从11.6提高到34.2），但去除类别条件显著提高了线性探针的精度，从57.5%提高到62.1%（表1）。作者假设，直接将模型条件化为类标签会减少模型对编码的信息需求，删除类条件可以强制模型学习更多语义。

重构VQGAN
在baseline中，LDM的VQGAN tokenizer使用多个损失项进行训练：i.自动编码重建损失；ii.KL散度正则化损失；iii.基于针对ImageNet分类训练的VGGNet的感知损失；iv.具有判别器的对抗性损失。

由于感知损失涉及有监督的预训练网络，使用用这种损失训练的VQGAN是不合法的。相反，作者在其中消除了感知损失。使用这种tokenizer将线性探针的准确率从62.5%显著降低到58.4%（表1）。这种比较表明，用感知损失（带有类标签）训练的tokenizer本身提供了语义表示。

作者训练下一个VQGAN tokenizer，它可以进一步消除对抗性损失。它将线性探头的精度从58.4%略微提高到59.0%（表1）。tokenizer在这一点上本质上是一个VAE。还注意到，消除这两种损失都会损害生成质量。

替换噪声调度
在生成任务中，目标是逐步将噪声图转换为图像。因此，原始噪声调度在噪声很大的图像上花费了许多时间步长（图3）。如果模型不是面向生成的，那么这是没有必要的。

为了进行自监督学习，作者研究了一种更简单的噪声调度。具体来说，让 $γ^{2}_{t}$ 在[0,1]的范围内线性衰减（图3）。这一变化大大提高了线性探头的精度，从59.0%提高到63.4%（表1），表明原始调度过于关注噪声较大的状态。另一方面，正如预期的那样，这样做会进一步损害生成能力，导致FID为93.2。

图3：原始调度器设置 $\gamma_{t}^{2}=\prod_{s=1}^{t}(1-\beta_{s})$ ，如果使用线性调度器，可以减少step。让模型一开始就关注比较干净的数据，而不是纯纯的噪声。

总体而言，表1中的结果表明，自监督学习表现与生成质量无关。DDM的表示能力不一定是其生成能力的结果。

重构Tokenizer

接下来，通过进行实质性的简化来进一步解构VAE tokenizer。作者将以下四种自动编码器变体作为tokenizer进行比较，每种变体都是前一种的简化版本。

卷积VAE
到目前为止，解构被引导到VAE tokenizer，现在将VAE的编码器和解码器设置为卷积网络 $f(\cdot)$ 和 $g(\cdot)$ 。卷积VAE被如下损失最小化： $x-g(f(x))||^{2}+KL[f(x)|N(0,I)]$ 其中， $x$ 是VAE的输入图像。

Patch-wise VAE
接下来考虑简化情况，VAE的编码器和解码器都是线性投影，并且VAE的输入 $x$ 是一个patch，最小化损失为： $x-U^{T}Vx||^{2}+KL[Vx|N(0,I)]$ 这里， $x$ 表示flatten为 $D$ 维向量的patch。 $U$ 和 $V$ 都是 $d \times D$ 矩阵，其中 $d$ 是潜在空间的维数。patch大小设置为16×16像素。

Patch-wise AE
作者通过去除正则化项对VAE进行进一步简化： $x-U^{T}Vx||^{2}$ 因此，这个tokenizer本质上是patch上的自动编码器（AE），编码器和解码器都是线性投影。

Patch-wise PCA
最后，考虑一个更简单的变体，它在patch空间上执行主成分分析（PCA）。很容易证明PCA等效于AE的一个特殊情况： $x-V^{T}Vx||^{2}$ 其中， $V$ 符合 $VV^{T}=I\in R^{d\times d}$ ，PCA可以简单地通过在一大组随机采样的patch上进行特征分解来计算，不需要基于梯度的训练。

由于使用patch的简单性，对于三个patch tokenizer，我们可以在patch空间中可视化它们的滤波器（图4）。

图4：patch tokenizer的可视化。每个滤波器对应于线性投影矩阵 $V : d \times D$ 的一行，为了可视化，将其整形为16×16×3。

表2总结了使用这四种tokenizer变体的DiT的线性探针准确性。作者展示了关于潜在维度“per token”的结果。PCA tokenizer的有效性在很大程度上将现代DDM推向经典DAE。

表2：线性探针精度与latent维度的权衡。利用DiT模型，作者研究了用于计算潜在空间的tokenizer的四种变体。作者改变潜在空间的维度 $d$ （per token）。通过上面的图显示出来。尽管在体系结构和损失函数方面存在差异，但tokenizer的所有四种变体都表现出相似的趋势。

高分辨率、基于像素的DDM在自监督学习方面较差
在继续之前，报告了一个与上述观察结果一致的额外的消融实验。具体来说，考虑一种naive tokenizer，它对从resized image中提取的patch执行identity mapping。在这种情况下，token是由patch的所有像素组成的展平向量。在图5中，作者展示了这种“pixel-based” tokenizer的结果，该tokenizer分别对256、128、64和32的图像大小进行操作，patch大小为16、8、4、2。这些token化空间的“潜在”维度分别为768、192、48和12。在所有情况下，Transformer的序列长度都保持不变（256）。

图5：pixel-based的tokenizer的线性探测结果，分别在256、128、64和32的图像大小上操作，补丁大小为16、8、4、2。这些token化空间的“潜在”维度分别为768、192、48和12。与之前研究的其他tokenizer类似，这种基于像素的标记器呈现出类似的趋势：相对较小的潜在空间维度是最优的。

这些比较表明，tokenizer和由此产生的潜在空间对于DDM或DAE在自监督学习场景中至关重要。特别是，在像素空间上应用具有加性高斯噪声的经典DAE会导致较差的结果。

走向经典的DAE

接下来，继续解构轨迹，目标是尽可能接近经典的DAE。作者试图消除当前基于PCA的DDM和经典DAE之间仍然存在的每一个方面。通过这个解构过程，作者更好地理解了每一个现代设计如何影响经典DAE。表3给出了下面讨论的结果。

表3：从Patch-wise PCA标记器开始，迈向经典DAE。每一行都基于对前一行的修改。

预测干净的数据（而不是噪声）
虽然现代DDM通常预测噪声 $ε$ ，但经典DAE预测的是干净数据。作者通过最小化以下损失函数来检验这种差异： $\lambda_{t}||z_{0}-net(z_{t})||^{2}$ 其中， $z_{0}$ 是干净数据（latent空间中）， $\lambda_{t}=\gamma_{t}^{2}$ 是基于 $t$ 的loss权重，为不同等级的噪声引入去噪贡献。直观地说，它只是对更干净的数据的损失项给予了更多的重视（large $\gamma_{t}^{2}$ ）。

随着预测干净数据（而不是噪声）的修改，线性探头的精度从65.1%下降到62.4%（表3）。这表明预测目标的选择会影响表示质量。尽管在这一步中受到了下降影响，但从现在起，作者依然坚持这种修改，因为目标是向经典DAE迈进。

移除输入scaling
在现代DDM中，输入按 $γ_t$ 因子缩放。这在传统DAE中并不常见。接下来，作者研究去除输入缩放因子，即设置 $γ_t=1$ 。由于 $γ_t$ 是固定的，我们需要直接在 $σ_t$ 上定义一个噪声调度。作者简单地将 $σ_t$ 设置为从0到 $\sqrt{2}$ 的线性调度。此外，根据经验将等式中的权重设置为 $λ_t=1/(1+σ^{2}_{t})$ 。此后获得了63.6%的准确率（表3），这有缩放的62.4%相比是有利的。这表明缩放数据是不必要的。

使用逆PCA对图像空间进行运算
到目前为止，对于探索过的所有条目，该模型在tokenizer产生的潜在空间上运行。理想情况下，作者希望可以直接在图像空间上工作，同时仍然具有良好的准确性。利用主成分分析，可以通过逆主成分分析来实现这一目标。这个想法如图1所示。特别地，通过PCA基（即 $V$ ）将输入图像投影到潜在空间中，在潜在空间中添加噪声，并通过逆PCA基（ $V^{T}$ ）将带噪的潜在空间投影回图像空间。图1（底部）显示了在潜在空间中添加了噪声的示例图像。有了这个有噪声的图像作为网络的输入，我们可以应用直接对图像进行操作的标准ViT网络，就好像没有tokenizer一样。

进一步将其应用于输出侧（即，用逆PCA预测图像空间上的输出）具有63.9%的准确度。结果表明，用逆PCA在图像空间上操作可以获得与在潜在空间上操作类似的结果。

预测原始图像
虽然逆PCA可以在图像空间中产生预测目标，但该目标不是原始图像。这是因为PCA对于任何降维都是有损编码器。相比之下，直接预测原始图像是一种更自然的解决方案。当让网络预测原始图像时，引入的“噪声”包括两部分：i.加性高斯噪声，其固有维数为 $d$ ，ii.PCA重建误差，其固有维数为 $D - d$ （ $D$ 为768）。作者对这两部分的损失进行了不同的加权。

形式上，使用干净的原始图像 $x_{0}$ 和网络预测 $net(x_{t})$ ，可以计算投影到全PCA空间上的残差 $r$ ： $r=V(x_{0}-net(x_{t}))$ ，这里 $V$ 是PCA基 $D\times D$ 。然后最小化： $\lambda_{t}\sum_{i=1}^{D}w_{i}r_{i}^{2}$ 其中， $i$ 表示向量 $r$ 的第 $i$ 维。 $w_{i}$ 对PCA重建误差的损失进行加权。采用该公式，预测原始图像的线性探头精度达到64.5%（表3）。

这个变体在概念上非常简单：它的输入是一个噪声图像，其噪声来自PCA潜在空间中，它的预测是原始的干净图像（图1）。

单级噪声
最后，出于好奇，作者进一步研究了具有单级噪声的变体。并注意到，由噪声调度给出的多级噪声是由DDM中的扩散过程驱动的；在传统DAE中，这在概念上是不必要的。

作者将噪声水平 $σ$ 固定为常数（ $\sqrt{1/3}$ ）。使用这种单级噪声实现了61.5%的良好精度，与多级噪声对应（64.5%）相比，降低了3%。使用多级别的噪声类似于DAE中的一种数据增强形式：这是有益的，但不是一个促成因素。这也意味着DDM的表示能力主要是通过去噪驱动过程获得的，而不是扩散驱动过程。

总结

作者解构了现代DDM，并将其推向经典DAE（图6）。其中撤销了许多现代设计，在概念上只保留了从现代DDM继承的两种设计：i.添加了噪声的低维潜在空间；ii.多级噪声。作者使用表3末尾的条目作为最后的DAE实例化（如图1所示），并将这种方法称为“潜在去噪自动编码器”，简称l-DAE。

图6：从现代DDM到l-DAE的整体解构轨迹。每一行都基于对前一行的修改。

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
2019-12-22-22:30 涓涓1016
今天是冬至，写下我的日更，是因为这两天的学习真的是能量的满满，让我看到了自己，未来另外一种可能性，也让我看到了这两年这几年的过程中我所接受那些痛苦的来源。一切的根源和痛苦都来自于人生，家庭，而你的原生家庭，你的爸爸和妈妈，是因为你这个灵魂在那一刻选择他们作为你的爸爸和妈妈来的，所以你得接受他，你得接纳他，他就是因为他的存在而给你的学习和成长带来这些痛苦，那其实是你必然要经历的这个过程，当你去接纳的
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息