乐伊Roy

Stable Diffusion学习指南【图生图篇】

即使之前在Midjourney中有过图生图的使用经验，但大部分人对该功能的印象仅限于喂图，通过它可以让模型了解更多我们要传达的信息，从而达到准确出图的目的。但在Stable Diffusion中的图生图还要强大的多，除了控图还包含了手动涂鸦、局部重绘、图像扩展等更多功能。

今天的文章里我会为你详细介绍图生图的工作原理、工具解析和图像重绘的应用方向，如果没有看过【文生图篇】的朋友建议先去学习下，以便你更好的理解今天的内容。

Stable Diffusion学习指南系列文章：

01 Stable Diffusion学习指南【初识篇】

02 Stable Diffusion学习指南【安装篇】

03 Stable Diffusion学习指南【文生图篇】

04 Stable Diffusion学习指南【模型篇】

图生图功能初识

1.1 传统意义上的喂参考图

我们都知道，模型在运算时是根据我们提供的提示内容来确定绘图方向，如果没有提示信息，模型只能根据此前的学习经验来自行发挥。在之前的文生图篇，我们介绍了如何通过提示词来控制图像内容，但想要实现准确的出图效果，只靠简短的提示词是很难满足实际需求的。

AI绘画的随机性导致我们使用大段的提示词来精确描述我们想要的画面内容，但毕竟文字能承载的信息量有限，即使我们写了一大段咒语，模型也未必能准确理解，不排除有时候还会出现前后语义冲突的情况。其实这个过程就像甲方给我们明确设计方向，除了重复沟通想要的画面内容外，有没有什么比口述更高效的沟通方式呢？这个时候，有经验的甲方会先去找几张目标风格的竞品图，让我们直接按照参考图的感觉走。

【感觉】这个词听起来似乎虚无缥缈，但在AI绘画领域是有实际道理的，因为图像能承载的信息要比文字多得多。以上面这张图为例，如果用提示词描述，可能写上几百字都难以向模型解释清楚画面的内容，但图生图不同，模型会自动从参考图上提取像素信息，并将其作为特征向量准确映射到最终的绘图结果上，通过这样的方式能最大程度还原参考图中的提示信息，实现更稳定准确的出图效果。

因此，传统意义上的图生图就是将提示词和参考图中的图像信息进行综合考虑并进行绘图的过程。

1.2 真正强大的图像重绘

当然，如果仅仅是喂图功能，Stable Diffusion的图生图板块并不值得我们单独花一篇文章来讲解，它的真正价值在于提供了丰富的操作工具将图像可控性提升到了新的层次。

我们先来回顾下平时使用文生图进行AI绘画的过程：编写提示词进行绘图，然后根据出图结果再不断优化提示词和各类参数进行抽奖，最终得到一张比较满意的图片。而图生图则是直接根据现有图片进行优化调整，因此图生图的操作过程可以简单理解成省去了前期文生图的抽奖过程，直接在现有图像约束的基础上进行的二次重绘。

需要注意的是，配合参考图进行图生图的过程是需要将参考图先逆向推导为潜空间的数据，再和提示词综合考虑绘制成图像。因此相比没有逆向推导过程的文生图，图生图的绘制会占用更多的系统资源，根据这个原理，我们也就能理解使用参考图的尺寸越大，在逆向推导的过程中消耗的资源也会越多。

在Stable Diffusion中，我们可以通过蒙版和局部重绘等功能来控制只对图像特定部分的区域进行重绘，并设置各类参数来控制重绘的效果。此外通过选择不同的绘图模型和调整图像尺寸，我们也能甚至还能实现画风转换、图像无损放大等更多玩法。相较于其他AI绘画工具，Stable Diffusion中的图生图并非单纯的喂参考图，而是可以在现有图片的基础上通过人工干预来实现更加稳定可控的图像重绘。

图生图工具解析

在WebUI的功能导航栏中选择图生图模块，我们可以看到它的页面布局和文生图基本类似，同样有提示词输入框、操作按钮和参数设置项，不同的是这里多了提示词反推、支持上传图片的二级功能模块和对应的参数设置项。

2.1 提示词反推

先来看提示词反推的功能：即根据提供的图片自动反推出匹配的文本关键词，也就是我们俗称的图生文功能。WebUI这里提供了Clip反推和DeepBooru反推2种反推操作，其区别在于：

Clip反推：推导出的文本倾向于自然语言的描述方式，即完整的描述短句，该功能的特点是可以描述出画面中对象间的关系
DeepBooru反推：推导结果更多的是单词或短句，比较类似我们平时书写提示词的方式，该功能更倾向于描述对象特征

不难看出，通过Clip和DeepBooru反推的提示词中包含不少错误标签，需要人工进行二次筛选。其实，WebUI在图生图模块内置提示词反推是为了在上传图片后可直接获取相应的参考关键词，以便后面更好的通过提示词来控制重绘图像内容。但实际上我们平时反推提示词时更常使用的是秋叶整合包中自带的Tagger插件，该插件除了生成的提示词准确度和稳定更高，还提供了关键词分析和排名展示，属于Stable Diffusion的必备插件之一。

在Stable Diffusion中有非常多类似的开源插件可以有效提升绘图效率，但不属于本篇文章重点，这里就不过多介绍了。

2.2 二级工具栏概览

在图生图模块中为我们内置了许多二级工具栏，很多朋友看到这样可能会担心学习起来很复杂。但其实这里每款工具其实都是在上一个工具基础上进行的衍生，比如涂鸦和局部重绘是在原生图生图基础上增加了手绘和蒙版，而涂鸦重绘又是这2款工具的结合。系统来看，所有的二级工具都是围绕图像重绘、手绘涂鸦和蒙版选区这3个基础功能所进行的重组，而WebUI作者是为了方便我们使用将实际操作场景进行了细分。

上图中整理了不同工具的简介和差异对比，下面针对每款工具和相关参数为大家进行详细介绍。

2.3 图生图工具

这部分的操作和文生图基本相同，区别在于支持额外上传参考图并增加了几项图生图专属的参数。下面介绍几项影响图生图效果的重要参数，这也是所有二级模块都需要用到的参数，其中和文生图模块中相同的参数这里就不再赘述了，大家可以回顾下【文生图篇】的相关内容。

2.3.1 重绘幅度

重绘幅度可以说是图生图中最重要的参数，它的功能有点类似Midjourney中的iw参数。前面介绍图生图的原理是在原图基础上绘制一张新的图片，而重绘幅度就是用来控制在原图基础上重绘的发散性程度，数值越高，说明模型重绘过程中更加自由，绘制结果和原参考图的差异性越大，生成的图像也就更倾向于模型自身的绘图风格。

可以看到当重绘幅度过高时，绘制的图像内容和原图基本就很难进行关联了，因此我们通常将重绘幅度的数值控制在0.4～0.8之间，这样既能维持参考图的控图效果，又能保证重绘后不会发生太强烈的变化。但从重绘幅度角度来看图像可操作的范围并不大，该参数的更多场景是配合其他功能项进行灵活调节，在下面的内容中我会配合各类工具进行详细介绍。

2.3.2 重绘尺寸

故名思义，该参数用于设置重绘后的图像尺寸，可以分为直接设置图像宽高和设置图像缩放倍数2种调节方式。

默认情况下重绘尺寸会自动带入当前参考图的宽高数值，而当我们拖动尺寸滑块时，可以直观的在参考图上预览重绘后的图像范围。

2.3.3 缩放模式

很多时候我们的参考图和重绘后的图片尺寸并不一致，而缩放模式就是用来选择采用何种变形方式来处理图像。这里虽然提供了4个按钮，但是可以分为2类场景来使用。一种是图像长宽比发生变化时使用，这里提供了3种我们常见的处理方式：拉伸、裁剪、填充（由于汉译插件不同，在名称上存在一定差异）。另一种是图像长宽比例不变时使用，多数情况下用于图像等比放大。

换句话说，如果重绘后的图像尺寸和原图完全一样，这几种缩放模式使用起来并没有区别。

下面我们来挨个介绍不同缩放模式的效果差异。首先是拉伸模式（仅调整大小），它的效果是将原图直接变形拉伸至新设定的尺寸。在下面的图中可以看到，在重绘幅度参数设置为0时，图像被直接变形拉伸为正方形，而随着提升重绘幅度，变形效果逐渐得到缓解，但同样也会导致和原图差异过大。

第二种裁剪模式（即裁剪后缩放）是根据新设定图像的长宽比，对原参考图的内容进行裁切。重绘后尺寸由矩形变为正方形，上下部分内容被裁切，这里的重绘幅度参数不会对图像的长宽比例产生影响。

第三个填充模式（缩放后填充空白）的效果根据新设定的长宽比例，将原图缺失的部分进行绘制填充。比如当图像从原图的512*768重绘为768*768时，下图的效果就是向左右填充了新的背景内容，且随着重绘幅度数值越大，填充部分和原图的融合效果越好。

最后一种缩放模式叫调整大小（潜空间放大），有的地方也叫直接缩放，该功能主要用于对图像进行等比放大，实现“小图转大图”的效果。当然如果重绘尺寸比例和原图比例不一致，则默认会采用拉伸的方式进行处理，但由于是反馈到潜空间中进行运算，因此图像出现了模糊变形的效果。

相较于单纯增加分辨率的放大做法，图生图中使用调整大小模式有重绘幅度参数可供调节，少量的重绘幅度可以为原图增加更多细节。

当然添加重绘幅度的弊端是不可避免的会导致图像发生改变，想要实现更好的效果还有更多定制插件可以实现低显存绘制高清大图，此处先按下不表。

对于调整大小功能的潜空间放大算法，我们可以在设置-放大-图生图放大算法中进行切换，选择之后记得保存设置并重启webUI界面。

综合使用场景来看，除非是需要对图像进行画布拓展，否则多数情况下还是建议先将参考图裁剪到目标比例再导入图生图中使用，这样的出图效果会更加可控。

下面我们再来看看图生图模块下的其他二级工具及参数，由于汉化差异，二级工具的名称可能不同，比如涂鸦重绘有的翻译插件下也被称作有色蒙版重绘。

2.4 涂鸦工具

再来看看第二个涂鸦工具，涂鸦工具的参数项和图生图完全相同，唯一区别是上传图像后右上角多了画笔工具，支持我们对图像进行涂抹。涂鸦工具相当于增加了我们传统的手绘过程，在图片上涂抹色块后再进行全图范围的图生图，同时配合提示词可以实现更加多样的重绘效果。

其中画笔支持调整调整笔触大小和切换颜色，自带的吸色工具也可以进行全屏幕范围内的取色。

在这几个操作工具中，返回上一步的按钮目前还存在bug，有时候并不会逐步撤回而是将整个涂鸦笔触全部清空。并且由于不知名原因，上传的图片有时候会出现报错或失效等情况，需要删除当前图片后重新上传才能。

涂鸦工具的操作很简单，使用画笔在图像上涂抹颜色后点击生成，Stable Diffusion会将手绘后的图像进行整体重绘，同时控制重绘幅度和增加描述关键词可以实现非常神奇的融图效果。在下图中可以看到女孩的衣服会根据涂鸦部分重绘成紫色的运动服，当重绘幅度设置为0.5左右时达到比较自然的融合效果。

需要注意的是通过涂鸦工具来重绘图像时，由于重绘幅度的影响，画面中未被涂鸦的部分也会发生变化，因此涂鸦工具是针对画面整体进行重绘。

由于鼠标涂鸦的绘制效果不够准确，而且涂抹的颜色不支持透明度等细节调整，因此涂鸦工具平时使用并不多，一般都是导入PS中进行细致的绘制操作，这里就不做过多赘述了。

2.5 局部重绘工具

再来看看局部重绘工具，在前几天，Midjourney终于上架了大家期待已久的局部重绘功能，应该算得上是Midjourney目前在控图方向上最大的一次迈步，而Stable Diffusion在这块算得上是深耕已久。简单来说，局部重绘就是在图像中设定一块区域，在图生图过程中只针对该区域部分进行重绘，而其他部分保持不变，从而实现精准控制改变图像特定部分的效果。该功能通常用于对画面大部分内容都基本满意，但需要调整部分细节元素的场景。

在下图中可以看到，局部重绘同样是使用画笔进行涂抹，但这里涂抹的颜色只有黑色，因为被涂抹区域表示的是蒙版，而不是实际的颜色色块。

下面我们来看看局部重绘的各项参数。

蒙版边缘模糊度：该参数用于设置重绘区域和原图的融合程度，效果可以简单理解为PS中的选区羽化。边缘模糊度太小会导致边缘衔接过于生硬，而数值太高会削弱蒙版的区域限制效果，导致蒙版不精确或直接失效。默认情况下数值是4，我们可以根据图像的融合效果来进行适度调节。

为方便对比蒙版效果，在下图的案例中我选择重绘黑色蒙版之外的区域，可以发现当边缘模糊度为0时，蒙版边缘非常生硬，而随着数值变大，重绘区域和原图的融合过渡也变得更加自然。

蒙版模式：【重绘蒙版区域】表示重绘涂抹过的蒙版区域，【重绘非蒙版区域】表示涂抹区域不变，而是重绘画面中的其他区域。该参数类似PS中的选区反转，在实际使用时根据重绘区域大小自由选择是涂抹需要重绘的部分还是剩余的背景部分。

蒙版区域内容处理：该选项用于设置重绘时的图像处理方式，这里提供了4个选项：填充、原图、潜空间噪声、空白潜空间，具体的效果可以看下图，相较之下潜空间噪声会比其他几项产生出更多变化，而原图的效果比较稳定。

该参数对绘图结果的影响不太稳定，一般情况下保持默认的【原图】即可。

重绘区域：指的是重绘过程中用于参考的图像范围。在下图中可以清楚的看到，当重绘区域设置为【仅蒙版区域】时，绘制的部分只有涂抹的蒙版部分区域的元素，相当于把涂抹区域切割下来单独进行重绘，该选项下会打断选区和参考图其他部分的联系，最终画面的融合效果可能会下降。

仅蒙版区域下边缘预留像素：该参数只在重绘区域选择了【仅蒙版区域】时生效，用于控制切割下来重绘部分向外扩展的范围大小。观察下面重绘过程的进度图可以发现，边缘预留像素的数值越大，则绘制过程中会向四周裁剪更多的内容进行整体重绘。

在默认情况下局部重绘会参考全图进行绘制，并且被涂抹的范围并不代表都会发生变化，所以通常我们会在目标区域基础上对外再涂抹一部分区域，以保证重绘后更好的融合效果，而提高边缘预留像素也是同样的原理。

总结来看，由于手涂蒙版的方式比较方便也很自由，因此局部重绘被广泛用于图像的局部调整，比如常见的脸部修复、手部修复等。

2.6 涂鸦重绘工具

涂鸦重绘工具可以理解为涂鸦+蒙版的结合，相当于在涂抹颜色的同时加上了局部重绘的蒙版，只不过这个过程中颜色涂抹和蒙版绘制是同时进行的。因此和局部重绘相比，涂鸦重绘多了一个参数项：蒙版透明度。

蒙版透明度设置的是涂抹色块在画面中的呈现效果：当透明度设置为0时涂抹颜色完全覆盖下方图片，此时等同于涂鸦工具的效果，50%时相当于半透明色块，而达到100%时蒙版完全透明，相当于色块消失。需要注意的是，当透明度过高时涂抹色块可能无法被Stable Diffusion准确识别，绘制结果中会直接呈现出半透明色块效果（如下图中的50%透明度时）。

下面举个实际案例，我们希望实现长裙变短裙的效果。如果只是单纯的局部重绘，重绘的部分始终会受到原图其他部分的影响出现裙摆，但这里的重绘幅度又不能调整过高，否则和原图会产生明显的割裂感。

但使用了涂鸦重绘相当于给Stable Diffusion提供了大概的范围参考，并且由于可以自由设置绘制色块的不透明度，不用担心完全覆盖原图内容，在整个重绘操控上更加准确和稳定。

对比来看，涂鸦重绘比单纯的涂鸦工具多了蒙版的局部控图效果，又比局部重绘工具多了颜色的指导作用，可以说是两款工具的结合体。

2.7 上传重绘蒙版工具

虽然涂鸦重绘效果很好，但毕竟手动涂抹的方式不够准确，因此WebUI也提供了自行上传蒙版的方法来精准控制重绘区域。上传重绘蒙版和局部重绘的页面基本相同，区别在于支持额外上传一张已绘制好的蒙版图。

这里蒙版图片的颜色含义和PS中的蒙版相同，白色表示有内容，黑色表示为空，因此白色区域内的图像会被进行重绘。相信很多朋友都出现过黑白蒙版傻傻分不清楚的情况，这里给大家分享个小妙招。我们只要将蒙版图想象成黑板即可，黑色表示默认的空白，白色即粉笔填充后的内容。

需要注意的是，在Stable Diffusion中表示半透明蒙版的灰色并不适用，因此像黑白渐变的蒙版图不起效果，我们平时用黑白纯色即可。

上传蒙版的优势在于我们可以精准控制蒙版范围，通常在PS中进行抠图并填充成黑白蒙版图，再上传到Stable Diffusion中进行使用。

2.8 批量处理工具

最后还有个批量处理工具，顾名思义可以批量对图像进行重绘操作。只需设置到相关参数和提示词，设置到参考图文件夹和输出文件夹就能实现批量重绘。我们平时在抖音上看到那种用拍摄视频转换AI绘图视频也是同样的原理，通过将视频拆解成逐帧图片再进行重绘，但目前开源社区中有用于制作动态视频更好用的插件，这里就不再赘述了。

关于图生图的更多知识

由于各款工具的名称都比较相似，加上不同功能项的调节参数和使用方法都不同，新手在学习图生图模块时很容易把各类功能弄混淆。因此，在学习这类AI绘画工具时，我更建议大家按照下面重绘应用方向的思路来理解，而不是单纯的从工具角度学习。

3.1 重绘的3个应用方向

我们前面提到图生图的本质是进行图像的二次重绘，根据绘制区域的差异，可以将重绘功能划分为整体重绘、局部重绘和图像扩展三个方向：

整体重绘 Img2img：按照原图的比例进行整体重绘，即传统意义上的基于参考图进行图生图，需要注意的是图像比例不变，但尺寸可以等比例调整。
局部重绘 Inpaint：通过手动涂鸦或上传蒙版等方法控制只针对指定区域进行重新绘制。
图像拓展 Outpaint：在原画布尺寸基础上向其他方向拓展，添加更多原画布外的内容。

回过头来看，文生图、图生图、涂鸦都相当于整体重绘功能，而局部重绘、涂鸦重绘和上传重绘蒙版则是局部重绘功能，至于图像扩展则是在图像比例发生变化且缩放模式选择填充时启用。

我们横向对比其他工具来看，整体重绘、局部重绘和图像扩展可以说是所有图像处理工具的基础功能，毕竟可控性在商业领域的价值很多时候比创意性更加重要，而可以将两者结合起来灵活使用的AI绘画工具才称得上是行业翘楚。这也是为什么PS的创意生成和画布拓展绘制功能刚一推出就引起广泛热议，而像Midjourney近期更新的Zoom Out图像扩展和Vary（Region）局部重绘等功能同样也是在向控图稳定性方向发展。

3.2 图生图中的提示词

前面提到图生图本质是增加了参考图的约束，虽然提示词的信息权重被参考图削弱了一部分，但并不意味着提示词就没用了。相反，很多时候还是需要通过提示词来告诉Stable Diffusion我们希望绘制的内容。这时候有朋友会问，那我们是只填写需要重绘部分的内容还是将画面全部内容进行完整描述呢？其实，图生图的提示词填写要根据实际的出图效果来调整。

当我们只希望更改画面中的部分元素而其他部分不变时，就需要在提示词中将不更改的部分进行保留，并对修改部分进行调整或补充描述，为了保证出图效果还可以灵活增加对应关键词的权重。

而当局部重绘时，如果绘制部分和原有图像的融合效果不佳，我们可以增加蒙版部分之外的内容描述来加强和画面其他部分的联系，比如下面的图中通过交互动作来增加重绘后手部和环境的融合效果。

以上案例只针对提示词进行了调整，实际使用时像seed值、重绘幅度、绘图模型等因素也要进行灵活考虑。

3.3 图生图和高清修复

如果有仔细观察的小伙伴应该已经发现了，图生图中并没有提供文生图中的高清修复选项，这是因为高清修复的本质就是进行了一次额外图生图操作，同样是先生成小图再进行放大，所以在图生图中想实现高清修复，只需将图像尺寸调大进行重绘即可，此外高清修复这一特性在图生图中有更多使用场景。

不知道大家平时是否发现过这样的现象，当人物在画面中占比越小，出图结果中出现脸部崩坏的情况就越常见，而当对人物脸部特写时很少出现崩坏情况。这是因为Stable Diffusion模型在逆向扩散的过程中对大区域的图像去噪处理会更加清晰，因此更擅长绘制画面中占比大的事物，通过利用这一点我们可以将图像中不清晰的小图截取出来进行放大重绘，然后再放回原图位置，即可有效修复局部变形的情况。

在今天文章里，我为大家介绍了Stable Diffusion中图像重绘的作用、各类工具和参数的功能解析以及关于图像重绘的学习思路。相比于文生图的一步成型，图生图更多是碎片化的使用思路，需要通过不断的修饰和调整局部细节来得到我们想要的图片。

回顾近几篇的文章内容，从文生图到图生图，从局部重绘再到上传重绘蒙版，不难发现我们对Stable Diffusion的学习是从发散向可控的方向逐渐递进，而聊到可控性就不得不提Stable Diffusion中大名鼎鼎的ControlNet，在下篇文章中我会为你详细介绍这款真正让Stable Diffusion立足AI绘画之巅的神级插件。今天文章就到这里结束啦，我们下期再见

如果想学习更多Stable Diffusion相关知识或者有相关问题，欢迎加入我的粉丝交流群共同探讨

你可能感兴趣的:(Stable,Diffusion,stable,diffusion,人工智能,AIGC,AI作画)

整理：开启新征程！四篇文章助力 AI，告别 “3D理解困难户” mslion 人工智能 3d 大语言模型计算机视觉目标识别
近年来，人工智能的发展让大语言模型（MLLM）变得越来越强大，它们可以理解和处理文字、图片、视频等多种信息，在很多领域都有很好的应用。然而，当这些模型需要理解3D（立体）场景时，仍然面临一些困难。目前的MLLM主要是用2D图片训练出来的，也就是说，它们更擅长识别平面的信息，比如照片中的人和物体。但是，现实世界是三维的（3D），仅靠2D图片训练的模型很难准确理解物体的立体关系。例如，如果只给一个普通
RAG(检索增强生成)系统实践与调优 python_知世 android 金融自然语言处理大模型技术人工智能 RAG 大模型
在人工智能领域，检索增强生成（RetrievalAugmentedGeneration,RAG）是一种结合信息检索和生成式人工智能的技术，它通过从外部数据源中检索相关信息，来辅助大语言模型（LargeLanguageModel,LLM）生成更为准确、上下文相关的答案。1什么是RAG检索增强生成（RetrievalAugmentedGeneration,RAG）是一种结合信息检索和生成式人工智能的技
不同用户群体设计的Manus试用申请理由模板 xinxiyinhe 人工智能人工智能
注：仅供参考。以下是为不同用户群体设计的Manus试用申请理由模板，结合其核心功能与官方审核偏好撰写，可根据自身需求调整使用：模板1：学术研究场景申请理由：我目前从事人工智能与产业经济交叉领域的博士后研究，亟需通过AI技术快速处理大量非结构化数据（如政策文件、企业年报、行业研报）。Manus的「多智能体调度」与「跨平台工具调用」功能能显著提升研究效率，例如：自动化筛选并分析1000+份上市公司ES
RISC_V GPU skybox 系列 core 模块之VX_issue.sv CDerL skybox _core skybox issue skybox core
VX_issue_top.sv//Copyright©2019-2023////LicensedundertheApacheLicense,Version2.0(the"License");//youmaynotusethisfileexceptincompliancewiththeLicense.//YoumayobtainacopyoftheLicenseat//http://www.apac
DeepSeek对于普通打工人来说有什么帮助呢？人工智能
在当今快速变化的社会中，普通打工人面临着越来越多的挑战：职场竞争加剧、技能更新换代加快、工作与生活的平衡难以掌控等。在这样的背景下，如何提升自身竞争力、找到适合自己的职业发展路径，成为了每个打工人都需要思考的问题。而DeepSeek，作为一款基于人工智能和大数据分析的职业发展工具，正在为普通打工人提供全新的解决方案。本文将从多个角度探讨DeepSeek对于普通打工人的帮助，分析它如何通过职业规划、
vite+vue+ts+element-plus从零开发管理后台框架(14)-全屏切换 vue3
安装插件npminstall@vueuse/core@10.11.0编辑src/views/Main.vue，template段header-right下最前面添加如下代码。script段引入并实例化FullScreenimport{onMounted,ref}from'vue'import{useRoute,useRouter}from'vue-router'import{useFullscre
【定制开发】碰一碰发视频系统定制开发，支持OEM 余~~18538162800 音视频
在短视频营销爆发的2025年，"碰一碰发视频"技术已成为实体商家引流标配。某连锁餐饮品牌通过定制化开发，单月视频发布量突破10万条，获客成本降低80%！本文将深入解析该系统的技术架构与开发要点，助你快速搭建高效解决方案。一、系统架构设计1.核心模块划分NFC交互层：负责卡片识别与数据传输视频处理引擎：实现AI剪辑与内容生成分发管理平台：支持多账号矩阵运营数据监控中心：实时追踪发布效果2.技术栈选型
回溯法——跳房子小赵起名困难户算法练习算法动态规划数据结构
跳房子是小朋友玩的游戏。地面上画出一连串格子，每个格子里有一个整数，小朋友从外面跳入格子，并继续往前跳，直到跳出所有格子。每次跳跃的规则是，可以跳入下一格或下下格或下下下格。怎么跳能让落脚格子里的数的累加和最小。输入格式:第一行输入格子数n(1usingnamespacestd;#defineL110intn;inta[L];intv[L];intmain(){cin>>n;for(inti=0;
豆包AI：打破智能边界，开启“人人可编程”的AI普惠时代 Herbig AI 人工智能
在人工智能技术狂飙突进的2024年，全球AI工具用户已突破12亿，但企业AI落地率仍不足35%——高昂的开发成本、复杂的技术门槛与碎片化的场景需求，如同三重枷锁禁锢着智能革命的红利释放。当大多数AI平台还在比拼模型参数时，豆包AI以“零代码交互+多模态引擎+垂直场景精调”的创新架构，正在重塑人机协作的范式。这款由字节跳动火山引擎团队打造的智能平台，不仅让AI开发效率提升400%，更在医疗、教育、工
论文学习：基于机器学习的光声图像分析1 superace7911 基于机器学习的光声图像处理机器学习人工智能图像处理
3/25——3/31期间论文学习笔记，关于基于机器学习的光声图像分析的6篇1区论文血管结构模拟&分割：Quantificationofvascularnetworksinphotoacousticmesoscopy链接数据集链接摘要这篇论文提出了一种新的方法，利用中观光声成像（MesoscopicPhotoacousticImaging,PAI）技术和高级图像分析技术，来非侵入性地定量化和分析活体
链表的应用不知真不只链表 java 前端
双向链表的引用双向有头链表的创建Dou_node*create_doulink(){Dou_node*pnode=malloc(sizeof(Dou_node));if(NULL==pnode){printf("failmalloc");returnNULL;}pnode->ppre=NULL;pnode->pnext=NULL;returnpnode;}链表是否为空的判断intis_empty_
自学嵌入式第29天-----epoll、sqlite3 以德服人23 服务器网络运维
1.正确选择触发模式（ET和LT）水平触发（LT）：默认模式，只要文件描述符处于就绪状态，epoll_wait会持续通知。适合大多数场景，编程简单。边缘触发（ET）：只在状态变化时通知一次，适合高性能场景，但需要确保一次性处理完所有数据，否则可能丢失事件。注意：在ET模式下，必须循环读取或写入数据，直到返回EAGAIN或EWOULDBLOCK。如果未处理完数据，epoll_wait不会再通知，可能
常见JVM命令 yyueshen JVM jvm java
1.java-XX:+PrintCommandLineFlagsHelloGC作用：打印JVM启动时的命令行参数，包括用户显式设置的参数和JVM自动默认设置的参数。用于确认JVM实际使用的配置。2.java-Xmn10M-Xms40M-Xmx60M-XX:+PrintCommandLineFlags-XX:+PrintGC-XX:+PrintGCDetails-XX:+PrintGCTimeSta
mt4j android,Brainstorming und Mind-Mapping im Multi-Device-Kontext. Konzeption und prototypische Im... Oxygenfia mt4j android
摘要：DievorliegendeArbeitbeschreibtdieKonzeptionundprototypischeImplementierungeinerAnwendungzurelektronischenUnterstützungvonBrainstorming-undMind-Mapping-SitzungenaneinemmultitouchfhigenTabletopmitSma
使用 UpTrain 提升 LLM 应用效果的实战指南 qahaj python
随着大语言模型（LLM）的广泛应用，如何评估和改进这些应用的性能成为了一个关键问题。UpTrain作为一个开源平台，提供了一系列评估功能，使得开发者能够对LLM应用进行全面的检测，并提供问题解决的指导。在这篇文章中，我们将介绍如何使用UpTrain的回调处理器在开发链中进行多样化评估，并详细展示如何实现这些功能。技术背景介绍UpTrain提供了超过20个预配置检查项（涵盖语言、代码、嵌入等用例），
使用LLMRails构建增强型AI应用：从文档检索到语义查询 VYSAHF 人工智能 python
使用LLMRails构建增强型AI应用：从文档检索到语义查询在构建生成式AI应用时，文档的索引和查询是其中的重要环节。LLMRails提供了一个便捷的API平台，专注于高性能和高准确度的文档处理。本文将详细介绍如何利用LLMRails和LangChain实现这一功能。技术背景介绍LLMRails是一个提供文档索引和查询的API平台，优化了性能和准确度。通过与LangChain的集成，LLMRail
qt----实现模拟键盘爱吃巧克力的程序媛上位机 qt
https://blog.csdn.net/ken2232/article/details/129803417https://blog.csdn.net/judgejames/article/details/93191524?spm=1001.2101.3001.6661.1&utm_medium=distribute.pc_relevant_t0.none-task-blog-2%7Edefau
C++之创建线程 C嘎嘎嵌入式开发 C++c++开发语言
1.使用函数指针最简单的方式是使用一个普通的函数作为线程的入口点。#include#includevoidthreadFunction(){std::cout#includeintmain(){std::threadt([]{std::cout#includeclassMyClass{public:voidmemberFunction(){std::cout#includevoidthreadFu
iOS 18 系统功能解析目录蓝鲸忘了海 IOS 1-18系统功能解析 ios cocoa macos
iOS18系统功能解析目录iOS18系统功能解析引言第一部分：iOS18系统架构全解析1.1全新系统设计理念1.2核心架构与硬件协同1.3安全架构与隐私保护1.4跨平台生态协同第二部分：用户界面与交互体验的革新2.1全新视觉设计2.2自定义UI与多任务切换2.3通知中心与交互体验2.4动态交互动画与手势识别第三部分：人工智能与机器学习的深度整合3.1新一代智能助手3.2CoreML与机器学习框架进
基于 DeepSeek 的自动化运维（适合企业降本增效） Real Man★ 运维自动化
基于DeepSeek的自动化运维解决方案DeepSeek凭借其强大的AI能力（如自然语言处理、时序预测、异常检测），可显著提升运维效率，实现从监控告警到故障自愈的全流程自动化。以下是结合企业级场景的实战方案：一、核心应用场景与实现路径智能监控与告警日志分析：使用DeepSeek-NLP模型自动解析日志，提取关键错误模式（如OutOfMemory、Timeout）。python复制fromdeeps
亿道三防AI加固平板电脑首亮相，工业级AI PC开启行业新纪元！都市前线人工智能电脑
8月28日至30日，亿道三防在第22届国际物联网展·深圳站上隆重发布了多款AI加固平板电脑和户外三防新品，首次亮相便赢得了现场观众的热烈好评。此外，还有三防平板电脑、工业平板电脑、车载平板电脑以及防爆平板等众多行业类明星产品也悉数登场，亿道三防为观众呈现了一场覆盖全品类、全行业、全生态的科技盛宴。接下来，让我们一起回顾此次IOTE展会上亿道三防推出的重磅新品和明星产品吧!AI加固平板电脑EM-I1
Ubuntu、CentOs更换源（阿里云的源） C000kie Linux ubuntu centos 阿里云 linux
ubuntu备份当前的apt配置文件sudomv/etc/apt/sources.list/etc/apt/sources.list.backup编辑配置文件，将以下内容写到文件中sudovi/etc/apt/sources.listdebhttps://mirrors.aliyun.com/ubuntu/focalmainrestricteduniversemultiversedeb-srcht
VUE中出现多个页面的样式冲突问题 JAVA叶知秋 vue.js 前端 javascript
1.使用Vuescoped样式隔离在标签添加scoped属性，自动生成唯一属性选择器实现样式隔离：.container{/*仅当前页面生效*/}注：H5端通过scoped实现隔离，小程序/APP端通过自动转换类名实现132.自定义页面专属标识在根元素添加页面ID，通过层级选择器限定作用域：.page-home.container{/*仅限当前页面*/}3.类名命名规范采用页面名-元素的BEM命名法
Unity 导出 Terrain地形为OBJ到3DMAX 羽阿呆 Unity unity 游戏引擎
地形不是网格模型，所以使用其他插件导出fbx在3dmax里面是识别不了的，没有办法使用，那么，该如何导出地形作为模型使用呢，可以借助unity插件导出，主要代码如下：usingSystem.IO;usingSystem.Text;usingUnityEditor;usingUnityEngine;usingSystem;enumSaveFormat{Triangles,Quads}enumSave
CMOS 图像传感器市场趋势和新兴应用沧海一升 CMOS 图像传感器成像 CIS sensor 图像传感器 image
2024年底，Yole举办了一场网络研讨会，有关CMOS图像传感器市场的最新趋势和新兴应用，本次网络研讨会由EdgeAI+Vision联盟联合举办，讨论了CIS供应商如何专注于增强传感器功能，以及如何将其产品组合转向更高潜在价值的市场。除此外还探讨了神经形态、光学超表面、短波红外和多光谱成像等新兴传感模式将如何在未来补充CMOS图像传感器，在某些情况下甚至取代CMOS图像传感器。可以在下面链接看到
19个判定学术写作内容有AI生成痕迹的例子 AIWritePaper官方账号 AIWritePaper DeepSeek ChatGPT 人工智能 chatgpt 机器学习 AIWritePaper 大数据
写作风格与语言特征重复性与一致性：AI生成的内容往往会在文中重复使用某些短语或表达方式，且整体语气和风格保持高度一致，缺乏人类写作者在不同情境下自然产生的微妙变化。缺乏情感与语境变化：AI生成的文本通常难以体现出人类写作者在不同段落或情境中可能会有的情感波动或语境的灵活转换。过度使用特定词汇和短语：某些词汇和短语在AI生成的文本中出现频率较高，如“commendable”“meticulous”“
Chebykan wx 文章阅读やっはろ深度学习
文献筛选[1]神经网络：全面基础[2]通过sigmoid函数的超层叠近似[3]多层前馈网络是通用近似器[5]注意力是你所需要的[6]深度残差学习用于图像识别[7]视觉化神经网络的损失景观[8]牙齿模具点云补全通过数据增强和混合RL-GAN[9]强化学习：一项调查[10]使用PySR和SymbolicRegression.jl的科学可解释机器学习[11]Z.Liu,Y.Wang,S.Vaidya,F
Claude 3.7 全解析：AI 代码助手的巅峰之作？
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读最近AI领域的新模型层出不穷，Claude3.7的发布无疑是最受瞩目的事件之一。从Claude3.5的成功，到如今对抗OpenAIO3Mini和DeepSeekR1的挑战，这款新一代AI是否真的能超越前辈，成为最强的AI代码助手？在深入研究和亲身体验后，这篇文章将完整解析Claude3.7的新特性、性能表现
暑假算法刷题日记 Day 6 mjh_yylx 算法刷题打卡算法
今天继续刷完二分查找，还有最后五个题二分查找就结束啦！023、P3743小鸟的设备题目背景小鸟有nnn个可同时使用的设备。题目描述第iii个设备每秒消耗aia_iai个单位能量。能量的使用是连续的，也就是说能量不是某时刻突然消耗的，而是匀速消耗。也就是说，对于任意实数，在kkk秒内消耗的能量均为k×aik\timesa_ik×ai单位。在开始的时候第iii个设备里存储着bib_ibi个单位能量。同
人工智能AI通用分级标准方法魔王阿卡纳兹 IT杂谈人工智能通用分级分类标准
人工智能（AI）的通用分级标准在近年来得到了广泛关注和研究，不同的机构和组织提出了多种分级框架，以帮助理解和评估AI的发展水平。以下是对人工智能通用分级标准的详细分析：1.OpenAI的五级分级标准OpenAI于2024年7月发布了通用人工智能（AGI）的五级分级标准，旨在追踪大型语言模型在AGI方面的进展。具体分级如下：第一级：聊天机器人具备语言对话能力的人工智能，如ChatGPT，能够进行基本
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。