Dlimeng

AI绘画中CLIP文本-图像预训练模型

介绍

OpenAI 在 2021 年提出了 CLIP（Contrastive Language–Image Pretraining）算法，这是一个先进的机器学习模型，旨在理解和解释图像和文本之间的关系。CLIP 的核心思想是通过大规模的图像和文本对进行训练，学习图像内容与自然语言描述之间的对应关系。这种方法使得模型能够在没有特定任务训练的情况下，对广泛的视觉概念进行理解和分类。

历史

OpenAI 的 CLIP（Contrastive Language–Image Pretraining）算法是在多模态学习领域的一个重要发展，而要理解其历史发展，首先需要明确“模态”的含义及其在人工智能中的应用。

模态的含义

在人工智能和计算机科学中，“模态”（Modality）通常指的是不同类型的数据或通信方式。常见的模态包括文本、图像、视频、音频等。每种模态具有独特的特性和处理方式。

多模态学习

多模态学习涉及同时使用和分析多种不同类型的数据（即多种模态）。例如，一个多模态系统可能会同时处理图像和文本信息，以更全面地理解和解释内容。

CLIP 的历史发展

早期背景：在 CLIP 之前，大多数人工智能系统主要关注单一模态的处理。例如，有些模型专注于图像识别，而其他模型则集中于文本分析。
多模态学习的兴起：随着技术的发展，研究人员开始探索如何结合不同模态的数据来提高人工智能系统的理解和分析能力。多模态学习开始成为研究的热点。
CLIP 的推出：2021 年，OpenAI 推出了 CLIP，这是一个突破性的多模态学习模型。CLIP 通过大规模的图像和文本数据训练，学习理解两者之间的关联。
CLIP 的创新：CLIP 的创新之处在于其能够使用对比学习方法同时处理和理解图像和文本信息。这意味着模型可以对图像进行分类或描述，而无需大量特定任务的训练。
影响和应用：CLIP 的成功展示了多模态学习在实际应用中的潜力，包括图像分类、内容创建、自动标注等领域。
后续发展：CLIP 的成功激发了更多关于多模态学习的研究和开发，推动了人工智能向更复杂、更全面的理解和处理不同类型数据的方向发展。

CLIP 解决方案

OpenAI CLIP 模型并不是最初为 GPT（Generative Pretrained Transformer）设计的。虽然 CLIP 和 GPT 都是 OpenAI 开发的模型，但它们是针对不同用途和应用场景设计的。

目的和用途

GPT：主要关注于理解和生成文本。
CLIP：旨在关联图像和文本，使模型能够理解视觉内容并有效地将其与语言描述相关联。

技术关联

预训练和大数据：CLIP 和 GPT 都使用了预训练的方法，在大规模数据集上进行学习。GPT 在文本数据上进行预训练，而 CLIP 在图像和文本对上进行预训练。
深度学习和神经网络：两者都基于深度学习的原理，使用神经网络架构来处理和生成数据。
多模态学习的概念：尽管 GPT 主要专注于文本，但在其最新的迭代中，例如 GPT-4，已开始涉足多模态学习，这是 CLIP 主要关注的领域。

技术差异

专注领域：CLIP 专注于图像和文本之间的关系，而 GPT 主要处理文本数据。
模型结构和目的：CLIP 使用对比学习方法来关联图像和文本，GPT 使用 Transformer 架构来生成连贯、有意义的文本。
应用范围：GPT 在文本生成、翻译、问答等任务中表现出色，而 CLIP 适用于图像识别、内容创建、文本到图像的任务等。

数据来源

OpenAI 的 CLIP（Contrastive Language–Image Pretraining）模型是在一个非常大的图像-文本对数据集上训练的。具体来说，据 OpenAI 的原始论文所述，CLIP 是在一个包含约4亿个图像-文本对的数据集上进行训练的。

这个数据集的规模是其显著特点之一，它使得模型能够学习并理解广泛的视觉概念和自然语言描述。大规模的数据集对于训练如 CLIP 这样的多模态模型来说至关重要，因为它们提供了足够的样本来捕捉和理解图像内容和相关文本之间复杂的关系。

随着技术发展，现在已经超过论文所述4亿对。

监督信号

CLIP（Contrastive Language–Image Pretraining）模型实现监督信息的方式是通过对比学习。这是一种自监督学习方法，不需要传统的标注数据集。 CLIP 的基本工作原理：

图像和文本编码器：CLIP 由两个主要组成部分构成：一个图像编码器和一个文本编码器。图像编码器处理输入的图像，将其转换为向量表示（特征）。文本编码器则对应地处理文本数据，如标签或描述，并将其转换为向量表示。
生成特征向量：每张图像 $I_i )$ 通过图像编码器生成一个向量，每个文本 $T_j )$ 通过文本编码器生成一个向量。
对比损失函数：在训练过程中，CLIP 使用一个对比损失函数（如 InfoNCE），该损失函数鼓励模型将每个图像的向量表示靠近其对应文本的向量表示，同时将其远离不匹配文本的向量表示。具体来说，模型被训练以最大化图像和正确文本对之间的点积 $I_i \cdot T_i )$ ，同时最小化与错误配对的点积 $I_i \cdot T_{j\neq i} )$ 。
构建正负样本对：对于每个图像-文本对 $I_i, T_i)$ ，正确的配对被视为正样本，而该图像与数据集中其他所有文本 $T_{j\neq i} )$ 的配对被视为负样本。

通过这种方式，CLIP 可以在没有显式标注的情况下学习图像内容与文本描述之间的语义关系。训练完成后，CLIP 能够根据其文本描述识别图像，或者根据图像内容找到合适的文本标签。这种方法的优势在于其能够处理开放式任务，并对未见过的图像和文本描述具有较好的泛化能力。

代码实现

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision.models import resnet50
from transformers import BertTokenizer, BertModel

# 假设你已经有一个包含图像和文本对的 Dataset
class YourDataset(torch.utils.data.Dataset):
    # 初始化方法，加载数据等
    # 返回数据集大小
    # 获取单个样本的方法

# 定义图像编码器
class ImageEncoder(nn.Module):
    def __init__(self):
        super(ImageEncoder, self).__init__()
        # 使用预训练的ResNet50作为图像编码器
        self.resnet = resnet50(pretrained=True)
        self.resnet.fc = nn.Linear(self.resnet.fc.in_features, 512)  # 假设我们的特征空间大小为512

    def forward(self, images):
        return self.resnet(images)

# 定义文本编码器
class TextEncoder(nn.Module):
    def __init__(self):
        super(TextEncoder, self).__init__()
        # 使用预训练的BERT作为文本编码器
        self.bert = BertModel.from_pretrained('bert-base-uncased')
        self.linear = nn.Linear(self.bert.config.hidden_size, 512)  # 假设我们的特征空间大小为512

    def forward(self, input_ids, attention_mask):
        outputs = self.bert(input_ids=input_ids, attention_mask=attention_mask)
        pooled_output = outputs.pooler_output
        return self.linear(pooled_output)

# 对比损失函数
class ContrastiveLoss(nn.Module):
    def forward(self, image_features, text_features):
        # 计算图像和文本特征之间的相似度
        logits = image_features @ text_features.T
        # 使用温度缩放 softmax
        temperature = 0.07
        logits = logits / temperature
        # 对角线元素是正样本对的相似度
        labels = torch.arange(logits.size(0)).to(logits.device)
        loss = nn.CrossEntropyLoss()(logits, labels)
        return loss

# 实例化模型和损失函数
image_encoder = ImageEncoder()
text_encoder = TextEncoder()
contrastive_loss = ContrastiveLoss()

# 优化器
params = list(image_encoder.parameters()) + list(text_encoder.parameters())
optimizer = optim.Adam(params, lr=1e-4)

# 数据加载器
dataset = YourDataset()
data_loader = DataLoader(dataset, batch_size=32, shuffle=True)

# 训练循环
for epoch in range(num_epochs):
    for images, texts in data_loader:
        # 对图像和文本进行编码
        image_features = image_encoder(images)
        input_ids, attention_mask = texts  # 假设这些是经过BERT Tokenizer处理的文本
        text_features = text_encoder(input_ids, attention_mask)

        # 计算对比损失
        loss = contrastive_loss(image_features, text_features)

        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

    print(f"Epoch {epoch}: Loss {loss.item()}")

注意：这个代码提供了一个高级概述，并没有涉及一些实际实现中的细节，比如数据预处理、设备管理（CPU/GPU）、模型保存和加载、评估逻辑等。

可以考虑使用 OpenAI 发布的官方代码库或者像 transformers 这样的第三方库，它们提供了预训练的 CLIP 模型和方便的接口。

衡量相似度

在构建多模态模型如 CLIP 时，可以使用多种方法来衡量图像表示和文本表示之间的相似度。两种常用的方法是点积（dot product）和余弦相似度（cosine similarity）。

点积（Dot Product）

点积直接计算两个向量的对应元素的乘积之和。如果两个向量在相同维度的数值都很大且符号相同（即都是正数或都是负数），它们的点积就会很大。

余弦相似度（Cosine Similarity）

余弦相似度是通过测量两个向量之间的夹角的余弦值来确定它们之间的相似度。计算公式为两个向量的点积除以它们各自范数（norm）的乘积。这样，余弦相似度主要关注向量的方向而不是其大小。

区别

规范化：余弦相似度在计算时对向量进行了规范化处理，它不受向量长度的影响，只反映方向上的相似性；而点积会受到向量长度的影响。
解释性：点积可以直接解释为向量元素间的相互作用强度，而余弦相似度表示方向一致性的度量。
范围：余弦相似度的取值范围为 [-1, 1]，而点积的范围可以是任意实数。

扩散模型与CLIP

在结合 CLIP 架构时，可以采取以下步骤：

文本编码器：CLIP 的文本编码器可以用来处理文本输入，生成与文本描述相匹配的语义表示。
图像编码器：同样地，CLIP 的图像编码器可以处理图像输入，为现有的图像生成高层次的特征表示。
条件输入：在扩散模型中，可以将这些来自 CLIP 的语义表示作为条件输入，引导生成过程以确保最终产生的图像与给定的文本描述相匹配。
降噪 U-Net：在扩散模型中，降噪 U-Net 用于在每个扩散步骤中估计和移除噪声，从而逐步重建图像。在结合了 CLIP 后，U-Net 可以被调整以接受来自 CLIP 的条件表示作为额外的输入，通过交叉注意（cross-attention）机制来集成文本和图像信息。
交叉注意机制：这是一个关键的集成点，在 U-Net 的每个层次中，可以通过交叉注意模块将文本的条件表示与图像的特征结合起来。这样，生成过程在每一步都会考虑到文本描述的语义内容。
训练过程：在训练扩散模型时，需要确保文本条件信息被正确地用于指导图像的生成。这可能涉及调整损失函数，以奖励那些更好地与文本描述相匹配的图像。

CLIP 开源项目

OpenAI 只是开源了 CLIP 模型的权重，并没有开源对应的 4 亿图文对。后来的学者便开始复现 OpenAI 的工作。比较有代表性的工作包括 OpenCLIP、ChineseCLIP 和 EVA-CLIP。

OpenCLIP 是社区驱动的，目的是复现 OpenAI 的 CLIP 模型。这个项目已经在多个数据源和计算预算上训练了多个模型，从小规模实验到较大规模实验，包括在如 LAION-400M、LAION-2B 和 DataComp-1B 等数据集上训练的模型。 https://github.com/mlfoundations/open_clip
ChineseCLIP 是 OpenAI CLIP 模型的中文版本，它使用了大约2亿的中文图文对进行训练，以实现中文领域的图文特征计算、跨模态检索和零样本图片分类等任务。https://github.com/OFA-Sys/Chinese-CLIP
EVA-CLIP 使用了约910万的数据对进行预训练,采用CLIP的经典网络结构。它是目前效果最好的开源中文CLIP模型之一,为中文多模态任务提供了有价值的预训练权重。https://github.com/THUDM/EvaClip

测试环境

https://modelscope.cn/studios/damo/chinese_clip_applications/summary

【大模型学习路线】从月薪6K到年薪35W，普通二本生转行大模型的逆袭之路：我的500小时崩溃实录与实战秘籍（附保姆级学习路线） AGI大模型学习学习人工智能大模型应用程序员 AI 大模型 AI大模型
摘要：26岁机械专业零基础转大模型，被面试官羞辱“非科班别做梦”，5个月死磕源码，现拿下3个大厂offer。踩过所有新人会踩的坑，总结出普通人高效突围的4个阶段+7个杀手级项目。（文末送自研《大模型避坑指南》+120G学习资料包）一、血泪教训：这些弯路我替你走了（小白必看）2023年3月12日，我在工地上画完第108张CAD图纸后，突然收到大学班群消息：“XX同学入职字节AILab，年薪50W+”
关闭表单后再次打开时校验提示未清除松岛的枫叶 vue.js 前端 javascript
在Vue+ElementUI中，若关闭表单后再次打开时校验提示未清除，可通过以下方案解决（结合搜索结果的实践经验）：一、核心原因分析•校验状态缓存：ElementUI的表单校验状态（如红色边框和错误提示）不会随对话框关闭自动重置，需手动清理。•数据残留：若表单数据未正确初始化，旧数据可能触发残留校验规则。•DOM更新时序：直接调用resetFields()时，若表单DOM未完全渲染，可能导致方法失
文档处理控件Aspose.Words 教程：.NET版中增强的 AI 文档摘要功能 CodeCraft Studio 控件文档管理人工智能 excel word pdf
Aspose.Words是一个功能强大的Word文档处理库。它可以帮助开发人员自动编辑、转换和处理文档。自24.11版以来，Aspose.Wordsfor.NET提供了AI驱动的文档摘要功能，使用户能够从冗长的文本中快速提取关键见解。在25.2版中，我们通过使用Anthropic生成语言模型进行摘要扩展了此功能。本篇内容将对此做讨论的。Aspose.wordsfor.Net最新版下载文档摘要有何新
BUAA-SCSE Training day2 屎宝宝 BUAA Training 2013
好多题目是uva上的然后当时看过刘汝佳的书再看看就好还有一些思路都很清晰代码也很少就没有什么可写的了A-OpenCreditSystemTimeLimit:3000MSMemoryLimit:0KB64bitIOFormat:%lld&%lluSubmitStatusPracticeUVA11078DescriptionProblemEOpenCreditSystemInput:StandardI
《Operating System Concepts》阅读笔记：p272-p285 codists 读书笔记操作系统
《OperatingSystemConcepts》学习第27天，p272-p285总结，总计14页。一、技术总结1.semaphoreAsemaphoreSisanintegervariablethat,apartfrominitialization,isaccessedonlythroughtwostandardatomicoperations:wait()andsignal().2.monit
【操作系统概念】【恐龙书】笔记六——第六章进程同步我岂是非人哉计算机操作系统
Chapter6:ProcessSynchronization问题的提出：彼此合作的进程之间可以用共享逻辑地址空间的方式来实现，共享逻辑地址空间，也就是共享代码区和数据区，会导致数据不一致，所以介绍一些避免数据不一致的机制。6.1BackgroundConcurrentaccesstoshareddatamayresultindatainconsistencyMaintainingdatacons
洛谷 P11626 题解 Yingye Zhu(HPXXZYY) 二分 dp 数学（数论）算法 c++
[ProblemDiscription]\color{blue}{\texttt{[ProblemDiscription]}}[ProblemDiscription]给定长度为nnn的数组A1⋯nA_{1\cdotsn}A1⋯n，求∑a=1n∑b=a+1n∑c=b+1n∑d=c+1n∑e=d+1n∑f=e+1n∑g=f+1n(gcd⁡i=1aAi+gcd⁡i=a+1bAi+gcd⁡i=b+1cAi
BUAA-SCSE Training day2 指导…… Sd_无心插柳
题目的确选择的比昨天难多了....http://acm.hust.edu.cn/vjudge/contest/view.action?cid=25719#overviewAinti,x,y;cin>>T;while(T--){cin>>n;x=-1>y;ans=max(x-y,ans);x=max(y,x);}cout>n&&n){memset(s,0,sizeof(s));f=0;while(n
Trae 解决无法登录问题兔子不爱吃bug 人工智能 python java
什么是Trae？Trae是字节跳动于2025年1月19日推出的AI编程工具，集成了众多顶级AI。Trae海外版官方网站：https://www.trae.ai解决上网环境问题如果你是在国内登录Trae时可能会出现以下状况：解决方法下载插件工具ILink安装完成后开启插件，再次登录。登录成功最后就是下载，安装，登录了，我就不一个个演示了。
Transformer 架构对比：Dense、MoE 与 Hybrid-MoE 的优劣分析 m0_74825656 面试学习路线阿里巴巴 transformer 架构深度学习
1.LLM基础架构类型DenseTransformerMoE(MixtureofExperts)TransformerHybrid-MoETransformer2.Transformer按照编码方式分类单向自回归模型(如早期GPT系列)双向模型(如BERT)编码器-解码器模型(如BART,T5)DenseTransformerDenseTransformer的优势是什么DenseTransform
【微服务】SpringBoot整合LangChain4j 操作AI大模型实战详解小码农叔叔 AI大模型实战与应用 springboot 入门到精通 LangChain4j LangChain4j总结 LangChain4j 使用 LangChain4j 实战 LangChain4j 详解
目录一、前言二、Langchain4j概述2.1Langchain4j介绍2.1.1Langchain4j是什么2.1.2主要特点2.2Langchain4j核心组件介绍2.3Langchain4j核心优势2.4Langchain4j核心应用场景三、SpringBoot整合LangChain4j组件使用3.1前置准备3.1.1获取apikey3.1.2导入基础依赖3.1.3添加配置文件3.2对话能
Mac触控板设置以及使用 Yo3ngLau Mac实用技巧操作集
本文转载自：https://blog.csdn.net/guang_s/article/details/84307604如有侵权，联系即删，转载仅用于学习用途触控板Mac触控板体验是非常好的，很多同学甚至直接用触控板代替鼠标操作，但是默认设置中有一些功能是没有开启的，需要手动配置。本文就来说说如何更改Mac触控板默认设置，让触控板变得更高效。一、启用三指拖移1、打开系统偏好设置，点击辅助功能。2、
大模型提示词工程师的自我修养-应用二（RAG数据合成与数据多样性问题的解决） -（专题4） AI专题精讲大模型专题系列人工智能
1.生成数据大型语言模型（LLMs）具有生成连贯文本的强大能力。通过有效的提示策略，可以引导模型生成更好、一致且更有事实依据的响应。LLMs也特别适用于生成数据，这对于进行各种实验和评估非常有用。例如，我们可以用它来为情感分类器生成快速样本，如下所示：提示词生成10个情感分析的示例。示例分为正面或负面类别。生成2个负面示例和8个正面示例。示例如下格式：Q:A:输出Q:我刚刚得到了最棒的消息！A:正
牛客周赛 Round 86 —— 题解山海风z 算法小屋算法 c++数据结构
A-小苯跑外卖_牛客周赛Round86签到题：向上取整#includeusingnamespacestd;intmain(){intx,y;cin>>x>>y;coutusingnamespacestd;#defineintlonglongsignedmain(){intt;cin>>t;while(t--){intn,k;cin>>n>>k;vectornums(n+1,0);intsum=0;
【2017-2024】Adobe AN多功能的动画制作软件安装 HIosng adobe
AdobeAN软件简介AdobeAnimate（简称AdobeAN）是由AdobeSystems开发的一款多功能的动画制作软件。它不仅可以用来设计二维动画，也支持创建交互性内容，为网络、游戏和应用程序提供了丰富的媒介。AdobeAnimate是创造动画、交互式内容与动态图形的强大工具，广受动画师、游戏开发者和设计师的欢迎。安装包https://pan.baidu.com/s/1BCK34EJWWu
ubuntu 20.04安装visual studio code并配置C++编译环境 Android Coder #NDK与音视频 ubuntu
1.下载安装visualstudiocode我的系统是Ubuntu20.04，首先是下载安装包。进入官网，直接下载压缩包。https://code.visualstudio.com/Download下载完成后双击安装即可。2.C++运行环境配置插件的安装汉化：过于简单，直接按照教程操作：https://jingyan.baidu.com/article/7e44095377c9d12fc1e2ef
elementUI中的Nav meau yourana123 前端 elementui
在做项目中遇到一个需求，当用户处于某种状态时，点击导航菜单的某项，不能切换，并且弹出消息提示.例如，我在新建状态下，点击了其中一项，不能切换，并弹出消息提示，原来选中的一项没有改变。default-active表示默认选中的一项，无法动态实时的显示激活的那项。所以无法通过改变default-active，设置激活项。解决方案：由于导航菜单的每一项都是通过key绑定的index来的，每一次点击不同的
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
OpenCV图像拼接（4）图像拼接模块的一个匹配器类cv::detail::BestOf2NearestRangeMatcher 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::BestOf2NearestRangeMatcher是OpenCV库中用于图像拼接模块的一个匹配器类，专门用于寻找两幅图像之间的最佳特征点匹配。它是基于“最近邻与次近邻距离比”原则来过滤匹配点对的，以提高匹配结果的准确性。这个类特别适用于需
Java 24 正式发布：AI 开发与后量子安全引领企业级编程革命程序猿小白菜后端java生态圈 java 人工智能安全
摘要2025年3月18日，Oracle正式发布Java24（OracleJDK24），这是Java诞生30周年之际的重要版本更新。新版本聚焦AI开发支持、后量子安全加密、性能优化和开发效率提升，提供20余项新特性及数千项改进，为企业级应用开发注入全新动力。一、语言特性：代码简洁性与模式匹配增强Java24在语法层面进一步简化代码逻辑，提升开发效率：JEP488：原始类型模式匹配（第二次预览）支持在
产品经理必备知识之网页设计系列（二）-如何设计出一个优秀的界面文宇肃然产品运营系列课程快速学习实战应用界面设计产品设计产品经理网页设计
前言第一部分参见产品经理必备知识之网页设计系列（一）-创建出色用户体验https://blog.csdn.net/wenyusuran/article/details/108199875第三部分参见产品经理必备知识之网页设计系列（三）-移动端适配&无障碍设计及测试https://wenyusuran.blog.csdn.net/article/details/108199947设计师和开发人员在构
YUV422 转换成 RGB Langneer VS C++c++c语言算法
#defineCLIPVALUE(x,minValue,maxValue)((x)(maxValue)?(maxValue):(x)))#defineYUVToR(Y,U,V)((Y)+1.4075*((V)-128))#defineYUVToG(Y,U,V)((Y)-0.3455*((U)-128)-0.7169*((V)-128))#defineYUVToB(Y,U,V)((Y)+1.779*
【AI大模型】搭建本地大模型GPT-NeoX：详细步骤及常见问题处理 qzw1210 gpt 人工智能深度学习
搭建本地大模型GPT-NeoX：详细步骤及常见问题处理GPT-NeoX是一个开源的大型语言模型框架，由EleutherAI开发，可用于训练和部署类似GPT-3的大型语言模型。本指南将详细介绍如何在本地环境中搭建GPT-NeoX，并解决过程中可能遇到的常见问题。1.系统要求1.1硬件要求1.2软件要求操作系统:Linux(推荐Ubuntu20.04或更高版本)CUDA:11.2或更高版本Python
chatgpt赋能python：Python怎么倒序列表 aijinglingchat ChatGpt python chatgpt 人工智能计算机
Python怎么倒序列表列表是Python中最常用的数据结构之一，但在实际使用时，有时需要将列表进行倒序排列。Python提供了多种方法来实现这个需求，本文将简要介绍这些方法以及它们的使用场景。方法1：使用reverse()函数使用列表的reverse()方法是Python中最简单直接的方法来倒序列表。该方法会将原列表倒置。lst=[1,2,3,4,5]lst.reverse()print(lst
Github一周热门ai项目 25.3.24 BillyXie23 AI探索 ai github 人工智能 AI编程开源
项目1：Significant-Gravitas/AutoGPT地址：https://github.com/Significant-Gravitas/AutoGPT描述：AutoGPT致力于让AI技术触手可及，为每个人提供构建AI的工具。Stars:173,711推荐理由：AutoGPT是开源AI领域的标杆项目，强调“人人可用AI”的愿景。它提供了一套完整的工具链，适合开发者和企业快速搭建AI应用
密码学，算法在人工智能的实战利用 china—hbaby 人工智能密码学
在人工智能（AI）的快速发展中，数据安全和隐私保护成为了核心议题。密码学，作为保护信息安全的基石，其在AI领域的应用显得尤为重要。本文将探讨密码学在AI中的利用，并提供一些代码示例来展示其实际应用。密码学的概述即常用加密方式密码学（Cryptography）是数学和计算机科学的一个分支，它涉及保护信息的安全性和隐私性。密码学的主要目标是确保信息在传输过程中不被未授权的第三方读取或篡改，以及确保信息
力扣算法ing(9/100) 菥菥爱嘻嘻小白学习算法算法 leetcode 数据库 typescript
2.26438.找到字符串中所有字母的异位词438.找到字符串中所有字母异位词给定两个字符串s和p，找到s中所有p的异位词的子串，返回这些子串的起始索引。不考虑答案输出的顺序。示例1:输入:s="cbaebabacd",p="abc"输出:[0,6]解释:起始索引等于0的子串是"cba",它是"abc"的异位词。起始索引等于6的子串是"bac",它是"abc"的异位词。示例2:输入:s="abab
AI密码学饼干帅成渣密码学
嗯，用户给了一个需要破译的密码文档：“Uifqjhjtpouifusff.”，提示是用字母往前推移1的凯撒密码。首先，我得确认自己是否正确理解提示。凯撒密码通常是将字母按照一定位移来替换，这里的提示是往前推1位，也就是每个字母变成它在字母表中的前一个字母。比如，A变成Z，B变成A，依此类推。不过有时候可能会有不同的解释，比如是否包括空格和标点，不过这里文档中的句子看起来都是字母和空格，没有标点，所
QtQML Series - Qt中文乱码解决方案稳定的菜着 #&QT开发数据库 qt
目录系列文章目录前言1.main函数入口设置中文编码2.VisualStudio插件3.如果使用预编译头4.开启UTF-8支持4.1.pro文件4.2MSVC4.3GCC&Clang5.总结系列文章目录系列文章ReadMe前言中文乱码是Qt开发中的常态问题1.main函数入口设置中文编码intmain(){#includeQApplicationa(argc,argv);//设置中文字体a.set
【前端】实操tips集合 JAMJAM_NoName 前端学习前端 javascript 开发语言
1.关闭vue中组件名字的多词校验(1)package.json文件中修改eslint配置"eslintConfig":{"rules":{"vue/multi-word-component-names":"off"}},（2）.eslintrc.js或者.eslintrc配置文件中进行配置module.exports={rules:{'vue/multi-word-component-names
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st