Jasminexjf

《Conditional Image Generation with PixelCNN Decoders》之Pixcel CNN---gated Pixcel CNN 阅读笔记

最近在看Generative models,Aaron courville的lecture 资料中提到了pixcel RNN,但是由于其必须逐一提取当前像素点的信息（从左到右、从上到下），虽然效果好，但是速度太慢了；进而将model中的RNN装换成CNN，从而有了Pixcel CNN,但是该model的问题是Blind spot 和效果没有Pixcel RNN 好；进而提出改进模型 gated Pixcel CNN model，引入了两种stack方式：horizontal stack and vertical stack。并在此基础上进行了一些小 trick的实验。具体如下：

转载原文：图片生成模型-gated Pixcel CNN

google DeepMind团队在《pixel recurrent neural networks》中提出了pixelRNN/CNN之后又发表了一篇论文——《Conditional Image Generation with PixelCNN Decoders》——这篇论文中提出了一个基于pixelRNN/CNN上进行改进的一个模型——gated pixelCNN。 gated pixelCNN依旧还是一个图片生成模型。它基于对像素点的概率分布进行建模，训练好模型之后，只要给这个模型一组描述性的向量（这些向量可以是一组具有描述性的标签，也可以是基于其他网络生成的特征信息），gated pixelCNN就可以生成大量的有变化的图片。 ———-

图片生成模型

生成模型是一种训练模型进行无监督学习的模型，给模型一组数据，希望从数据中学习到信息后的模型能够生成一组和训练集尽可能相近的数据。图片生成模型就是更具体的指向说给模型一组图片作为训练集让模型进行学习，希望模型生成一组和训练集图片尽可能相近的图片。下图是从斯坦福的课程上截下来的图：

图中可以看到图片生成模型更直观的理解就是要让生成的图片的像素点的联合分布和训练集的图片像素点的联合分布相近。具体来说，图像生成模型又可以根据模型对像素点分布的预测情况进一步细分。

其中当下最流行的三种图片生成器模型当属：pixelRNN/CNN、VAE、GAN。

-**自回归模型**：auto regressive models，代表模型pixelRNN/CNN

-**变化自编码器**：VAE（variational auto encoder），一种概率图形模型，建模过程就是要达到数据的对数似然最大化的下限。过程中包括encode过程（将图片信息压缩）和decode过程（将压缩后的信息作为输入，进行图片再生成）

-**生成对抗网络**：GAN（generative adversarial network），生成两个网络，分别是生成器网络和判别式网络来联合进行建模

pixelRNN/CNN

怎么想

现在需要构建一个模型来实现生成一张图片，那么最简单的想法就是一个像素点一个像素点的进行生成，同时将前面生成的像素点作为参考。相当于将预测一张图上所有像素点的联合分布转换为对条件分布的预测。

这里的x i 就是指在i 处的像素点。

怎么做

既然是用已经预测得到的像素来预测当前点的像素，自然能够想到其实这就是对一组有顺序的序列的预测，那么就应该可以想到用RNN来建模。因此这个模型就叫pixelRNN。在pixelRNN中用了12个两维LSTM层。在《pixel recurrent neural networks》这篇论文中，作者提到了用两种方式来构建不同的pixelRNN，由于本文是对gated pixelCNN进行梳理，所以这里就不对pixelRNN进行展开说明。

怎么改

由于使用了RNN模型，所以pixel RNN的训练时间特别长，需要对模型进行改进。作者又考虑到这是对图像进行处理，那为什么不可以使用 CNN来进行建模呢？用CNN构建出来的模型叫pixelCNN。但是标准的卷积层会把所有像素的信息一次性进行提取，所以在pixelCNN中就是基于传统的CNN技术，用到masked convolutions以及去掉池化层来进行建模。

masked convolutions

这是一个5*5的掩膜卷积核。它的作用就是只保留中心点处之前的像素信息。
可以看到当要提取中心点的像素信息的时候，这个点的左边和前面的像素信息都得到了提取，右边和后面的像素信息被“遮盖”住了，而关于这个点的信息的提取论文中又提出了两种方式进行获取（这两种方式对应了mask A和mask B这两种掩膜方式）。

可以看到两种mask的区别就是在信息传递上RGB这三个通道中像素点信息是否传递给自己这一点上有不同。可以看到，maskA这种掩膜的传递方式是不传递给自己，maskB这种方式是信息要传递给自己。
这里还需要进行说明，为什么三个通道之间的传递关系是这样的，因为每个点的像素信息是由RGB这三个通道的值构成的，所以像素的信息传递不仅仅是基于前后的context的像素点信息的传递，还有自己的三个通道上面的值的一个传递。而按照RGB的位置顺序来说，R算是前面的信息，G属于中间的信息，B是后面的信息，所以在记录当前像素点的R通道上面的信息时就不能把后面的GB信息当作已知条件，同样的，在记录当前像素点的B通道上的信息时可以将RG两个通道上的信息当作已知条件。所以可以看到有这样的传递关系。
论文中提到，在pixelCNN中，只有在第一个卷积层上使用了maskA，后面所有的层上都是使用的maskB这种掩膜。

最左边的那一列是作者给出的关于pixelCNN的一个结构示意图。由于pixelRNN它还是一个RNN，所以不管是生成图片的过程还是训练的过程，它都是以序列的形式在进行，所以速度较慢，而pixelCNN在训练的时候得益于卷积可以并行运算，所以训练时间较pixelRNN有提高，但是最后生成图片的效果没有pixelRNN的效果好。最后论文中还构建了一个multi-scale version 的pixelRNN模型，这里也不展开多说。 ———-

gated pixelCNN

为什么要从pixelCNN到gated pixelCNN

gated pixelCNN是在pixelCNN上进行了某些改进的到的，为什么要进行这些改进主要有以下两个原因：第一，从表现效果上面看，pixelCNN的速度虽然比pixelRNN快，但是模型的效果并没有它好，所以希望能够在pixelCNN的速度基础上通过某些改进提高模型最后的表现效果。第二，pixelCNN存在“盲点”问题。在生成图像的时候因为使用了mask的原因，所以存在“盲点”的问题。下图中灰色的区域就是提取当前像素点的信息的时候存在的“盲点”。

（所谓的“盲点”就是指当前的像素值信息提取的过程中无论如何都不会包括到灰色区域的像素信息。）

怎么改

作者分别针对两个需要改进的方面提出了相应的解决方案：

表现效果

为什么pixel RNN的效果不错，可以推测是因为pixelRNN模型中每一个LSTM层都能够获取到之前像素的所有信息。
而在CNN中，随着卷积层的层数的增加，获取到的信息也在不断增多。
所以如果能够合理增加pixelCNN中的卷积层，那么有可能提高其表现效果。
另外一个方面，pixelRNN表现效果不错，是因为RNN可以对更复杂的结构进行建模。因为RNN模型结构中存在大量的单元（输入门、遗忘门、输出门），这些单元可以帮助模型的神经元之间有更加复杂的联系。所以，在对pixel CNN的改进工作中，可以将masked convolutions之间的简单线性链接单元换成和RNN中门与门之间的激活方式一样的连接方式：

其中σ σ 是sigmoid激活函数，k是指这是第几层，⨀指元素之间的点乘运算，*指卷积运算
这样的单元相当于在pixelCNN中也引入了“门”的概念，这也是为什么改进之后的这个模型叫gated pixelRNN的原因。

“盲点”问题

要如何改进“blind spot”问题，论文中提到将两种卷积网络进行结合使用，论文中分别叫这两种卷积网络horizonal stack和vertical stack。
Horizonal stack是将当前像素所在的行（当然也是指当前像素之前的像素值）作为条件进行卷积，所以horizonal stack的卷积核的规格为1*n，在horizonal stack中仍然要使用掩膜技术来实现只提取前面的信息。
Vertical stack是将当前像素所在的行的前面所有行当作条件来进行卷积，由于vertical stack是对前面的信息进行提取，所以vertical stack中不进行掩膜操作。

将每一层的两种stacks的结果进行结合，就可以得到当前像素点的信息，这样就消除了“盲点”问题。

所以使用门的技术和更多的卷积层来提高pixelCNN的表现效果，使用horizonal stack和vertical stack结合的方式来解决“盲点”问题之后，就得到了论文最终想要的模型gated pixelCNN。

A single layer in the gated pixelCNN architecture

改后的gated pixelCNN的作用

论文中提到

这仍然是一个基于像素的概率分布进行预测的图像生成器（生成式模型）。

论文中还提到

只要给这个模型一组描述性的向量，就可以生成相应的图片。提供给模型的向量可以有两种：可以是一组描述性的标签；也可以是基于其他网络生成的向量。
这两种向量的生成效果具体来说的话，用ImageNet数据集中的分类标签（一组描述性的标签）进行生成图像，这个模型可以生成大量多变的真实场景，比如说动物、风景等等；如果是用由其它卷积网络中间生成的没见过的人脸照片（其他网络生成的向量）输入pixel CNN模型中，则可以生成这个人不同的表情、姿势等等的图片。

另外，论文中也提到

如果把门这种元件纳入条件pixelCNN中，则可以把这个条件pixelCNN当作图片自动编码器的解码器，可以使pixelCNN的性能达到和pixelRNN的性能一样好，但计算时间减小很多。

下面将对这三种情况进行具体的阐述：

unconditional gated pixelCNN

unconditional gated pixelCNN是指直接用gated pixelCNN生成图像。
gated pixelCNN本身还是一个基于像素的概率分布进行预测的图像生成器（生成式模型），所以gated pixelCNN仍然可以在训练好模型之后直接进行图片生成。在论文中作者在CIFAR-10这个数据集上训练了gated pixelCNN模型，并基于同一个数据集进行训练的生成模型进行了对比。

Table 1: Test set performance of different models on CIFAR-10 in bits/dim (lower is better), training performance in brackets.

这里的NLL值是指负对数似然的值，是用来衡量一个生成模型的总体效果的，这个值越小越好。
可以看到gated pixelCNN的效果已经在pixelCNN上得到了很大的提升，而且和pixel RNN的效果已经很接近了（虽然还是赶不上pixelRNN）。

Table 2: Performance of different models on ImageNet in bits/dim (lower is better), training performance in brackets.

可以看到，在ImageNet这个数据集上，可以看到gated pixel CNN的效果已经非常好了。

conditional gated pixelCNN

Gated pixel CNN作为一个条件图片生成器就是指，在预测像素点的概率的时候，添加一些先验信息来使生成的图片往我们想要的方向生成。上面提到的给模型一组向量来生成图片就是指作为conditional gated pixelCNN的作用。

这里的h h就是我们给的一个先验信息，就是前面提到的那组“向量”。h 可以以两种方式提供给模型：一组描述性的标签；基于其他网络生成的向量。

（一） h 是a one-hot encoding that specifies a class

若h 是a one-hot encoding that specifies a class，也就是指一组描述性的标签的时候，gated pixel CNN可以准确的生成这个种类，同时生成这个种类在不同的地方摆出不同造型的图片。
更通俗的说h 只告诉模型要生成的东西是什么，不告诉模型这个东西在哪里的时候，训练好的模型会生成大量基于不同地点的图片。
更NB的地方是，作者指出，h 甚至可以直接是imagenet 这个数据集中1000类别里面的类别id，最后得到了大量的真实场景下的这些类别的图片。
在作者的实验中，作者训练pixelCNN生成了八种不同类型的动物图片，可以看到这些图片角度光线等等环境条件是不同的，但是场景相似。

Figure 3: Class-Conditional samples from the Conditional PixelCNN.

（二）h 是基于其他网络生成的向量

若h h是一个用由其它卷积网络中间生成的没见过的人脸信息，模型将会生成这个人在不同的场景下摆出不同姿势的新图片。
作者在训练过程中用Flicker这个数据集中的人脸图片来对gated pixelCNN进行训练，然后给模型一张不在整个训练集中的完全陌生的人脸信息给模型，最后模型生成了大量这个人的新图片。

Figure 4: Left: source image. Right: new portraits generated from high-level latent representation.

gated pixelCNN auto-encoder

最后Gated pixelCNN还可以在一个auto-encoder中用作一个强有力的图片decoder。
就像前面介绍VAE中介绍到的那样，一个auto-encoder由两部分组成，一个encoder一个decoder。
在将gated pixelCNN 用作一个auto-encoder的时候，encoder部分就是将输入的图片降维变成一个低纬度表示的特征，这个特征就是在前面conditional pixelCNN中提到的那个h h ，然后将这个h h 送入decoder中，将h h 进行重构，还原为原来的图片。Gated pixelCNN用作一个decoder的实质其实还是主要实现了conditional pixelCNN的功能，它将encoder中生成的h h 作为条件输入，尽可能的还原为原始图片。
在作者的实验中，作者在ImageNet上训练了一个gated pixelCNN auto-encoder，和使用MSE进行模型选择的convolutional auto-encoder，最后生成的图片效果如下：

Figure 6: Left to right: original image, reconstruction by an auto-encoder trained with MSE,conditional samples from a PixelCNN auto-encoder. Both auto-encoders were trained end-to-end with a m = 10-dimensional bottleneck and a m = 100 dimensional bottleneck.

最左边的这个张图是原图，中间的是用卷积auto-encoder生成的图片，右边的是gated pixel CNN生成的图片。可以看到，卷积auto-encoder是尽力去重构真实的图像，而gated pixelCNN在尽力去生成不同的但是相似的图像。

总结

最后作者对整个模型进行了一个总结，并提出了展望，作者指出，从前面的各种案例中可以看到，gated pixel CNN可以生成在不同光照条件下的图片，所以gated pixel CNN可以客服生成模型中训练集光照条件不好的问题。

探索 AI 系统提示与模型资源库：`system-prompts-and-models-of-ai-tools` 几道之旅人工智能智能体及数字员工人工智能
在当今的人工智能领域，系统提示和工具模型的优化与应用对于提升AI助手的性能和响应质量至关重要。x1xhlol开源的system-prompts-and-models-of-ai-tools仓库为开发者们提供了一个丰富的资源集合，涵盖了多种AI工具的系统提示、工具和模型。仓库概述这个仓库包含了超过7500行的代码和文档，详细介绍了多个知名AI工具的系统提示和相关模型，其中包括FULLv0、Curso
山东大学FPGA课程实验一加法器设计小田不甜~ fpga开发
【实验题目】设计一个16位二进制全加器模块。用层次化设计方法，设计一个16位二进制全加器模块。设计一个16位二进制超前进位全加器模块。设计一个16-bit8421-BCD码全加器模块。【实验软件工具】QuartusII;ModelSimSE.【实验要求】实验内容与原理说明（包括框图、逻辑表达式和真值表）；实验模块程序代码（设计模块DesignBlock）和激励代码（激励模块TestBench）；仿
噪声预测 vs. 数据预测：扩散模型中的目标函数选择与生成表现对比观熵扩散模型工程指南机器学习算法人工智能
噪声预测vs.数据预测：扩散模型中的目标函数选择与生成表现对比关键词：噪声预测、数据重建、MSELoss、ELBO、score-basedmodeling、DDPM、EDM、训练目标、采样策略摘要：扩散模型的训练目标设计直接影响模型收敛速度、生成质量与采样路径稳定性。最初的DDPM采用了预测添加噪声ε的方法，但近年来诸如EDM（ElucidatedDiffusionModels）等模型开始转向对原
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-predict.py 红色的山茶花 YOLO 笔记深度学习
predict.pyultralytics\models\yolo\detect\predict.py目录predict.py1.所需的库和模块2.classDetectionPredictor(BasePredictor):1.所需的库和模块#UltralyticsAGPL-3.0License-https://ultralytics.com/licensefromultralytics.eng
利用视觉-语言模型搭建机器人灵巧操作的支架三谷秋水智能体大模型计算机视觉语言模型机器人人工智能计算机视觉机器学习
25年6月来自斯坦福和德国卡尔斯鲁厄理工的论文“ScaffoldingDexterousManipulationwithVision-LanguageModels”。灵巧机械手对于执行复杂的操作任务至关重要，但由于演示收集和高维控制的挑战，其训练仍然困难重重。虽然强化学习(RL)可以通过在模拟中积累经验来缓解数据瓶颈，但它通常依赖于精心设计的、针对特定任务的奖励函数，这阻碍了其可扩展性和泛化能力。
Django 4.x Models App settings 模型应用设置 Mr数据杨 Python Web开发 python django 模型 model 配置
在Django框架中，模型（Model）是用于定义和操作数据库表结构的核心组件。模型通过使用Python类的形式，帮助简化数据库操作，自动生成SQL语句，使得开发者能够专注于业务逻辑的实现，而无需直接编写复杂的SQL代码。Django的ORM（对象关系映射）提供了一种便捷的方式，将Python对象与数据库记录进行映射操作，从而有效地管理数据交互。对于那些想要在项目中使用Django构建数据库应用的
Django ORM 2. 模型（Model）操作博观而约取 django python 后端
1.数据准备本文后续所有ORM操作将通过提供通用的测试数据进行演示：定义6个模型（覆盖字段类型、关系类型、查询、聚合、注解等场景）关于创建模型请参考上一节：DjangoORM1.创建模型（Model）使用Django离线脚本批量生成各模型测试数据模型定义在测试app(假如app名为web)下的models.py（web/models.py）中添加如下6个模型：fromdjango.dbimport
面向大语言模型幻觉的关键数据集：系统性综述与分类法致Great 语言模型人工智能自然语言处理
面向大语言模型幻觉的关键数据集：系统性综述与分类法摘要大语言模型（LargeLanguageModels,LLMs）在自然语言处理的多个领域取得了革命性进展，但其固有的“幻觉”问题——即生成看似合理但与事实不符或与上下文无关的内容——严重制约了其在关键应用中的可靠性与安全性。为了系统性地评估、理解并缓解LLM的幻觉现象，学术界和工业界开发了大量多样化的数据集与基准。本文对大模型幻觉领域的关键数据集
ImportError: cannot import name ‘get_metadata_patterns‘ from ‘datasets.data_files‘这通常是由于 modelscope 微信公众号：AI创造财富 python linux 机器学习
base)powersys@powerSys:~/work/modelscope$python1.pyTraceback(mostrecentcalllast):File"/home/powersys/work/modelscope/1.py",line1,infrommodelscope.pipelinesimportpipelineFile"/home/powersys/work/minico
Error: Waveform5.vwf.vt(30): near “1“: syntax error, unexpected INTEGER NUMBER, expecting ‘)‘ Erro 嘉陵妹妹 quartus quartus
Error:Waveform5.vwf.vt(30):near“1”:syntaxerror,unexpectedINTEGERNUMBER,expecting‘)’Error:e:/quartus/modelsim_ase/win32aloem/vlogfailed.ExecutingONERRORcommandatmacro./deng01.doline4解决方案:1:将输出端口output改
多模态大语言模型arxiv论文略读（145）胖头鱼爱算法 #mllm_arxiv 语言模型人工智能自然语言处理论文笔记论文阅读
ReasoningLimitationsofMultimodalLargeLanguageModels.AcasestudyofBongardProblems➡️论文标题：ReasoningLimitationsofMultimodalLargeLanguageModels.AcasestudyofBongardProblems➡️论文作者：MikołajMałkiński,SzymonPawlo
多模态大语言模型arxiv论文略读（140）
SemiHVision:EnhancingMedicalMultimodalModelswithaSemi-HumanAnnotatedDatasetandFine-TunedInstructionGeneration➡️论文标题：SemiHVision:EnhancingMedicalMultimodalModelswithaSemi-HumanAnnotatedDatasetandFine-T
【Rust + Actix Web】现代后端开发：从零构建高并发 Web 应用 LCG元前端 rust 前端开发语言
目录项目概述环境准备项目创建与依赖配置系统架构设计核心代码实现1.数据库模型(`src/models.rs`)2.应用状态管理(`src/state.rs`)3.核心业务逻辑(`src/handlers.rs`)4.主应用入口(`src/main.rs`)高并发优化策略1.异步处理模型2.连接池配置优化3.缓存策略设计性能测试结果部署方案Docker部署配置(`Dockerfile`)Kubern
django 数据库迁移指令 CrazyDemo #django框架 web框架
#rbac/models.pyclassRole(models.Model):...classUser(models.Model):#name=models.CharField(max_length=12)#password=models.CharField(max_length=12)roles=models.ManyToManyField(Role)#直接写对应的类名，字符串形式反射是找不到的
Flutter基础（项目1结构）
123lib/├──api/#网络请求层├──common/#公共类、常量、工具函数├──models/#数据模型├──providers/#状态管理（Provider/Riverpod）├──routes/#⭐路由集中管理（核心）│└──app_routes.dart#路由配置入口├──views/#⭐页面文件（一个页面一个.dart）│├──home_page.dart│├──detail_p
一个简单测试Deepseek吞吐量的脚本,国内环境可跑谢平康深度学习 pytorch 人工智能
一个简单测试Deepseek吞吐量的脚本,这里用DeepSeek-R1-Distill-Qwen-32B,支持单卡409024G可跑,具体看你的硬件情况做调整,理论支持所有的模型,看你需要,可以修改模型名称,重点是pip使用国内的源,模型下载用阿里的ModelScope,无障碍下载,使用.最后可以生成一个txt与html报表.前提是你安装了python与python-venv,你可以不用venv来
第 3 部分 - 类视图 pythondjango
我们也可以使用类视图，而不是基于函数的视图来编写API视图。我们会看到，这是一种强大的模式，允许我们重用通用功能，并有助于我们保持代码的简洁性。我们将从重构views.py中的根视图为类视图开始。fromsnippets.modelsimportSnippetfromsnippets.serializersimportSnippetSerializerfromdjango.httpimportHt
Promptify：简化NLP任务的高效工具箱金斐茉
Promptify：简化NLP任务的高效工具箱PromptifyPromptEngineering|PromptVersioning|UseGPTorotherpromptbasedmodelstogetstructuredoutput.JoinourdiscordforPrompt-Engineering,LLMsandotherlatestresearch项目地址:https://gitcod
【企业管理】研发管理之产品生命周期管理 flyair_China 企业管理研发管理产品经理
一、产品生命周期管理的体系化方法与思路1.全周期管理框架四阶段模型：导入期（市场验证）、成长期（规模扩张）、成熟期（利润优化）、衰退期（战略退出）。核心流程：需求分析：通过市场调研与用户画像精准定位需求（如特斯拉ModelS导入期的高端定位）。研发协同：采用敏捷开发（Scrum/Kanban）与模块化设计，缩短研发周期（如华为硬件迭代效率提升30%）。生产与供应链：数字化供应链管理（如西门子工业4
【Axum】Rust Web 高效构建：Axum 框架从入门到精通指南 LCG元前端 rust 前端开发语言
目录一、环境准备与项目创建1.1安装Rust工具链1.2创建项目并添加依赖二、Axum核心架构解析三、项目结构设计四、核心代码实现4.1应用入口(src/main.rs)4.2数据模型(src/models.rs)4.3路由配置(src/routes.rs)4.4认证服务(src/services/auth.rs)4.5用户处理器(src/handlers.rs)4.6数据访问层(src/repo
django+drf 前后端分离总结（1） a35155 python django python 后端
django常见问题django设计模式django的内置组件认证组件auth模块models用户模型主要有下面几个字段：username、password、email、first_name、last_name一般我们继承AbstractUser去扩展#注意要在setting设置这个、重载系统的用户，让UserProfile生效AUTH_USER_MODEL='users.UserProfile'
阿里云魔搭社区AIGC专区：中国AI创作的革命性平台 Liudef06小白阿里云 AIGC 人工智能
在生成式人工智能重塑全球数字创作版图的浪潮中，中国首个一站式AIGC开发平台——阿里云魔搭社区AIGC专区于2024年9月杭州云栖大会正式亮相。这一突破性进展不仅填补了国内全流程AI创作工具的空白，更以157款多模态开源模型和全免费GPU算力的开放姿态，为超过690万开发者提供了从模型调用到应用落地的完整生态支持。一、魔搭社区：中国AI模型生态的奠基者魔搭社区（ModelScope）作为阿里云在2
生成式人工智能实战 | 深度卷积生成对抗网络（Deep Convolutional Generative Adversarial Network, DCGAN）盼小辉丶生成式人工智能实战150讲人工智能生成对抗网络神经网络
生成式人工智能实战|深度卷积生成对抗网络0.前言1.模型与数据集分析1.1模型分析1.2数据集介绍2.构建DCGAN生成人脸图像2.1数据处理2.2模型构建2.3模型训练0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetworks,DCGAN)是基于生成对抗网络(ConvolutionalGenerativeAdversarialNet
Prompt Engineering for Large Language Models 三月七꧁ ꧂ 论文合集llm+prompt prompt 语言模型人工智能自然语言处理 pdf javascript 前端
题目大型语言模型的快速工程简介随着OpenAI的ChatGPT和Google的Bard等软件的普及，大语言模型（LLM）已经渗透到生活和工作的许多方面。例如，ChatGPT可用于提供定制食谱，建议替换缺失的成分。它可用于起草研究提案、用多种编程语言编写工作代码、在语言之间翻译文本、协助政策制定等等（Gao2023）。用户通过“提示”或自然语言指令与大型语言模型进行交互。精心设计的提示可以带
基于OpenCV-python的人脸识别系统 transuperb 完整代码 opencv python 人工智能
importsysimportosimporttkinterastkfromtkinter.ttkimportStyleimportnumpyasnpimportcv2fromPILimportImageTk,ImageDraw,ImageFontfrompanel.models.tabulatorimportthemefromModelimport*fromtkinterimportttk,fi
【大模型学习 | LORA 原理及实现】九年义务漏网鲨鱼语言模型 python pytorch 自然语言处理
LORA:LOW-RANKADAPTATIONOFLARGELAN-GUAGEMODELSGithub库：GitHub-microsoft/LoRA:Codeforloralib,animplementationof“LoRA:Low-RankAdaptationofLargeLanguageModels”GPT-3：175B微调模型变得十分的贵。作者提出利用Low-RankAdaption来冻结
Prism框架实战：WPF企业级开发全解待香港下雪就不用敲代码了 wpf c#visual studio 开发语言
以下是一个完整的WPF项目示例，使用Prism框架实现依赖注入、导航、复合命令、模块化和聚合事件功能。项目结构清晰，包含核心功能实现：项目结构PrismDemoApp/├──PrismDemoApp(主项目)│├──Views/││├──ShellView.xaml││├──MainView.xaml││└──SettingsView.xaml│├──ViewModels/││├──ShellVi
LLM推理入门实践：基于 Hugging Face Transformers 和 vLLM ctrl A_ctrl C_ctrl V #大模型llm python 自然语言处理人工智能
文章目录1.HuggingFace模型下载2.HuggingFaceTransformers库模型推理3.关于prompt的组成：system、user、assistant4.vLLM模型推理vLLM的多卡推理踩坑1.HuggingFace模型下载模型在HuggingFace下载，如果下载速度太慢，可以在HuggingFace镜像网站或ModelScope进行下载。使用HuggingFace的下载
Halcon 检测物体定位点吃个糖糖 Halcon 人工智能计算机视觉深度学习
文章目录get_domain返回所有输入图像的定义域作为一个区域add_channels给区域增加灰度值find_shape_model发现匹配模板find_shape_models发现最佳模板示例get_domain返回所有输入图像的定义域作为一个区域Halcon中的区域get_domain(Image:Domain::)Image:图像(input_object):类型可以是(多通道-)图像数
Are Multimodal Large Language Models Pragmatically Competent Listeners in Simple Reference UnknownBody LLM Daily Multimodal 语言模型人工智能自然语言处理
论文主要内容总结本文聚焦于多模态大语言模型（MLLMs）在指称消解任务中的语用能力研究，通过简单但抽象的视觉刺激（如颜色块和颜色网格）开展实验。具体内容如下：1.研究目的考察LLaVA-NeXT、Qwen2-VL和JanusPro等MLLMs在“导演-匹配者”式参考游戏中，对颜色和空间布局的语境化语用推理能力，验证其是否能像人类一样根据视觉上下文解析指称表达。2.实验方法模型：测试三种MLLMs的
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1