阿里云大数据AI技术

当大火的文图生成模型遇见知识图谱，AI画像趋近于真实世界

作者：朱祥茹、段忠杰、汪诚愚、黄俊

导读

用户生成内容（User Generated Content，UGC）是互联网上多模态内容的重要组成部分，UGC数据级的不断增长促进了各大多模态内容平台的繁荣。在海量多模态数据和深度学习大模型的加持下，AI生成内容（AI Generated Content，AIGC）呈现出爆发性增长趋势。其中，文图生成（Text-to-image Generation）任务是流行的跨模态生成任务，旨在生成与给定文本对应的图像。典型的文图模型例如OpenAI开发的DALL-E和DALL-E2。近期，业界也训练出了更大、更新的文图生成模型，例如Google提出的Parti和Imagen，基于扩散模型的Stable Diffusion等。

然而，上述模型一般不能用于处理中文的需求，而且上述模型的参数量庞大，很难被开源社区的广大用户直接用来Fine-tune和推理。此外，文图生成模型的训练过程对于知识的理解比较缺乏，容易生成反常识内容。本次，EasyNLP开源框架在先前推出的基于Transformer的文图生成模型（看这里）基础上，进一步推出了融合丰富知识图谱知识的文图生成模型ARTIST，能在知识图谱的指引上，生成更加符合常识的图片。我们在中文文图生成评测基准MUGE上评测了ARTIST的生成效果，其生成效果名列榜单第一。我们也向开源社区免费开放了知识增强的中文文图生成模型的Checkpoint，以及相应Fine-tune和推理接口。用户可以在我们开放的Checkpoint基础上进行少量领域相关的微调，在不消耗大量计算资源的情况下，就能一键进行各种艺术创作。

EasyNLP（https://github.com/alibaba/EasyNLP）是阿⾥云机器学习PAI 团队基于 PyTorch 开发的易⽤且丰富的中⽂NLP算法框架，⽀持常⽤的中⽂预训练模型和⼤模型落地技术，并且提供了从训练到部署的⼀站式 NLP 开发体验。EasyNLP 提供了简洁的接⼝供⽤户开发 NLP 模型，包括NLP应⽤ AppZoo 和预训练 ModelZoo，同时提供技术帮助⽤户⾼效的落地超⼤预训练模型到业务。由于跨模态理解需求的不断增加，EasyNLP也⽀持各种跨模态模型，特别是中⽂领域的跨模态模型，推向开源社区，希望能够服务更多的 NLP 和多模态算法开发者和研究者，也希望和社区⼀起推动 NLP /多模态技术的发展和模型落地。

本⽂简要介绍ARTIST的技术解读，以及如何在EasyNLP框架中使⽤ARTIST模型。

ARTIST模型详解

ARTIST模型的构建基于Transformer模型，将文图生成任务分为两个阶段进行，第一阶段是通过VQGAN模型对图像进行矢量量化，即对于输入的图像，通过编码器将图像编码为定长的离散序列，解码阶段是以离散序列作为输入，输出重构图。第二阶段是将文本序列和编码后的图像序列作为输入，利用GPT模型学习以文本序列为条件的图像序列生成。为了增强模型先验，我们设计了一个Word Lattice Fusion Layer，将知识图谱中的的实体知识引入模型，辅助图像中对应实体的生成，从而使得生成的图像的实体信息更加精准。下图是ARTIST模型的系统框图，以下从文图生成总体流程和知识注入两方面介绍本方案。

第一阶段：基于VQGAN的图像矢量量化

在VQGAN的训练阶段，我们利用数据中的图片，以图像重构为任务目标，训练一个图像词典的codebook，其中，这一codebook保存每个image token的向量表示。实际操作中，对于一张图片，通过CNN Encoder编码后得到中间特征向量，再对特征向量中的每个编码位置寻找codebook中距离最近的表示，从而将图像转换成由codebook中的imaga token表示的离散序列。第二阶段中，GPT模型会以文本为条件生成图像序列，该序列输入到VQGAN Decoder，从而重构出一张图像。

第二阶段：以文本序列为输入利用GPT生成图像序列

为了将知识图谱中的知识融入到文图生成模型中，我们首先通过TransE对中文知识图谱CN-DBpedia进行了训练，得到了知识图谱中的实体表示。在GPT模型训练阶段，对于文本输入，首先识别出所有的实体，然后将已经训练好的实体表示和token embedding进行结合，增强实体表示。但是，由于每个文本token可能属于多个实体，如果将多个实体的表示全都引入模型，可能会造成知识噪声问题。所以我们设计了实体表示交互模块，通过计算每个实体表示和token embedding的交互，为所有实体表示加权，有选择地进行知识注入。特别地，我们计算每个实体表征对对于当前token embedding的重要性，通过内积进行衡量，然后将实体表示的加权平均值注入到当前token embedding中，计算过程如下：

得到知识注入的token embedding后，我们通过构建具有layer norm的self-attention网络，构建基于Transformer的GPT模型，过程如下：

在GPT模型的训练阶段，将文本序列和图像序列拼接作为输入，假设文本序列为w，生成图像的imaga token表示的离散序列概率如下所示：

最后，模型通过最大化图像部分的负对数似然来训练，得到模型参数的值。

ARTIST模型效果

标准数据集评测结果

我们在多个中文数据集上评估了ARTIST模型的效果，这些数据集的统计数据如下所示：

在Baseline方面，我们考虑两种情况：zero-shot learning和标准fine-tuning。我们将40亿参数的中文CogView模型作为zero-shot learner，我们也考虑两个模型规模和ARTIST模型规模相当的模型，分别为开源的DALL-E模型和OFA模型。实验数据如下所示：

从上可以看出，我们的模型在参数量很小的情况（202M）下也能获得较好的图文生成效果。为了衡量注入知识的有效性，我们进一步进行了相关评测，将知识模块移除，实验效果如下：

上述结果可以清楚地看出知识注入的作用。

案例分析

为了更加直接地比较不同场景下，ARTIST和baseline模型生成图像质量对比，我们展示了电商商品场景和自然风光场景下各个模型生成图像的效果，如下图：

电商场景效果对比

自然风光场景效果对比

上图可以看出ARTIST生成图像质量的优越性。我们进一步比较我们先前公开的模型（看这里）和具有丰富知识的ARTIST模型的效果。在第一个示例“手工古风复原款发钗汉服配饰宫廷发簪珍珠头饰发冠”中，原始生成的结果主要突出了珍珠发冠这个物体。在ARTIST模型中，“古风”等词的知识注入过程使得模型生成结果会更偏向于古代中国的珍珠发簪。

第二个示例为“一颗绿色的花椰菜在生长”。由于模型在训练时对“花椰菜”物体样式掌握不够，当不包含知识注入模块时，模型根据“绿色”和“菜”的提示生成了有大片绿叶的单株植物。在ARTIST模型中，生成的物体更接近于形如花椰菜的椭圆形的植物。

ARTIST模型在MUGE榜单的评测结果

MUGE（Multimodal Understanding and Generation Evaluation，链接）是业界首个大规模中文多模态评测基准，其中包括基于文本的图像生成任务。我们使用本次推出的ARTIST模型在中文MUGE评测榜单上验证了前述文图生成模型的效果。从下图可见，ARTIST模型生成的图像在FID指标（Frechet Inception Distance，值越低表示生成图像质量越好）上超越了榜单上的其他结果。

ARTIST模型的实现

在EasyNLP框架中，我们在模型层构建了ARTIST模型的Backbone，其主要是GPT，输入分别是token id和包含的实体的embedding，输出是图片各个patch对应的离散序列。其核⼼代码如下所示：

# in easynlp/appzoo/text2image_generation/model.py

# init
self.transformer = GPT_knowl(self.config)

# forward
x = inputs['image']
c = inputs['text']
words_emb = inputs['words_emb']

x = x.permute(0, 3, 1, 2).to(memory_format=torch.contiguous_format)
# one step to produce the logits
_, z_indices = self.encode_to_z(x) 
c_indices = c

cz_indices = torch.cat((c_indices, a_indices), dim=1)

# make the prediction
logits, _ = self.transformer(cz_indices[:, :-1], words_emb, flag=True)
# cut off conditioning outputs - output i corresponds to p(z_i | z_{

 
  在数据预处理过程中，我们需要获得当前样本的输入文本和实体embedding，从而计算得到words_emb： 
  # in easynlp/appzoo/text2image_generation/data.py

# preprocess word_matrix
words_mat = np.zeros([self.entity_num, self.text_len], dtype=np.int)
if len(lex_id) > 0:
    ents = lex_id.split(' ')[:self.entity_num]
    pos_s = [int(x) for x in pos_s.split(' ')]
    pos_e = [int(x) for x in pos_e.split(' ')]
    ent_pos_s = pos_s[token_len:token_len+self.entity_num]
    ent_pos_e = pos_e[token_len:token_len+self.entity_num]

    for i, ent in enumerate(ents):
        words_mat[i, ent_pos_s[i]:ent_pos_e[i]+1] = ent
encoding['words_mat'] = words_mat

# in batch_fn
words_mat = torch.LongTensor([example['words_mat'] for example in batch])
words_emb = self.embed(words_mat)
 
  ARTIST模型使⽤教程 
  以下我们简要介绍如何在EasyNLP框架使⽤ARTIST模型。 
  安装EasyNLP 
  ⽤户可以直接参考GitHub（https://github.com/alibaba/EasyNLP）上的说明安装EasyNLP算法框架。 
  数据准备 
   
   准备自己的数据，将image编码为base64形式：ARTIST在具体领域应用需要finetune, 需要用户准备下游任务的训练与验证数据，为tsv文件。这⼀⽂件包含以制表符\t分隔的三列（idx, text, imgbase64），第一列是文本编号，第二列是文本，第三列是对应图片的base64编码。样例如下： 
   
  64b4109e34a0c3e7310588c00fc9e157	韩国可爱日系袜子女中筒袜春秋薄款纯棉学院风街头卡通兔子长袜潮	iVBORw0KGgoAAAAN...MAAAAASUVORK5CYII=
 
  下列⽂件已经完成预处理，可⽤于训练和测试： 
  https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/artist_text2image/T2I_train.tsv
https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/artist_text2image/T2I_val.tsv
https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/artist_text2image/T2I_test.tsv
 
   
   将输入数据与lattice、entity位置信息拼接到一起：输出格式为以制表符\t分隔的几列（idx, text, lex_ids, pos_s, pos_e, seq_len, [Optional] imgbase64） 
   
  # 下载entity to entity_id映射表
wget wget -P ./tmp https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/artist_text2image/entity2id.txt

python examples/text2image_generation/preprocess_data_knowl.py \
  	--input_file ./tmp/T2I_train.tsv \
    --entity_map_file ./tmp/entity2id.txt \
    --output_file ./tmp/T2I_knowl_train.tsv

python examples/text2image_generation/preprocess_data_knowl.py \
    --input_file ./tmp/T2I_val.tsv \
    --entity_map_file ./tmp/entity2id.txt \
    --output_file ./tmp/T2I_knowl_val.tsv

python examples/text2image_generation/preprocess_data_knowl.py \
    --input_file ./tmp/T2I_test.tsv \
    --entity_map_file ./tmp/entity2id.txt \
    --output_file ./tmp/T2I_knowl_test.tsv
 
  ARTIST文图生成微调和预测示例 
  在文图生成任务中，我们对ARTIST进行微调，之后用于微调后对模型进行预测。相关示例代码如下： 
  # 下载entity_id与entity_vector的映射表
wget -P ./tmp https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/artist_text2image/entity2vec.pt

# finetune
python -m torch.distributed.launch $DISTRIBUTED_ARGS examples/text2image_generation/main_knowl.py \
    --mode=train \
    --worker_gpu=1 \
    --tables=./tmp/T2I_knowl_train.tsv,./tmp/T2I_knowl_val.tsv \
    --input_schema=idx:str:1,text:str:1,lex_id:str:1,pos_s:str:1,pos_e:str:1,token_len:str:1,imgbase64:str:1,  \
    --first_sequence=text \
    --second_sequence=imgbase64 \
    --checkpoint_dir=./tmp/artist_model_finetune \
    --learning_rate=4e-5 \
    --epoch_num=2 \
    --random_seed=42 \
    --logging_steps=100 \
    --save_checkpoint_steps=200 \
    --sequence_length=288 \
    --micro_batch_size=8 \
    --app_name=text2image_generation \
    --user_defined_parameters='
        pretrain_model_name_or_path=alibaba-pai/pai-artist-knowl-base-zh
        entity_emb_path=./tmp/entity2vec.pt
        size=256
        text_len=32
        img_len=256
        img_vocab_size=16384
      ' 

# predict
python -m torch.distributed.launch $DISTRIBUTED_ARGS examples/text2image_generation/main_knowl.py \
    --mode=predict \
    --worker_gpu=1 \
    --tables=./tmp/T2I_knowl_test.tsv \
    --input_schema=idx:str:1,text:str:1,lex_id:str:1,pos_s:str:1,pos_e:str:1,token_len:str:1, \
    --first_sequence=text \
    --outputs=./tmp/T2I_outputs_knowl.tsv \
    --output_schema=idx,text,gen_imgbase64 \
    --checkpoint_dir=./tmp/artist_model_finetune \
    --sequence_length=288 \
    --micro_batch_size=8 \
    --app_name=text2image_generation \
    --user_defined_parameters='
        entity_emb_path=./tmp/entity2vec.pt
        size=256
        text_len=32
        img_len=256
        img_vocab_size=16384
        max_generated_num=4
      '
 
  在阿里云机器学习平台PAI上使用Transformer实现文图生成 
  PAI-DSW（Data Science Workshop）是阿里云机器学习平台PAI开发的云上IDE，面向不同水平的开发者，提供了交互式的编程环境（文档）。在DSW Gallery中，提供了各种Notebook示例，方便用户轻松上手DSW，搭建各种机器学习应用。我们也在DSW Gallery中上架了使用Transformer模型进行中文文图生成的Sample Notebook（见下图），欢迎大家体验！ 
   
  未来展望 
  在这一期的工作中，我们在EasyNLP框架中扩展了基于Transformer的中文文图生成功能，同时开放了模型的Checkpoint，方便开源社区用户在资源有限情况下进行少量领域相关的微调，进行各种艺术创作。在未来，我们计划在EasyNLP框架中推出更多相关模型，敬请期待。我们也将在EasyNLP框架中集成更多SOTA模型（特别是中文模型），来支持各种NLP和多模态任务。此外，阿里云机器学习PAI团队也在持续推进中文多模态模型的自研工作，欢迎用户持续关注我们，也欢迎加入我们的开源社区，共建中文NLP和多模态算法库！ 
  Github地址：https://github.com/alibaba/EasyNLP 
  Reference 
   
   Chengyu Wang, Minghui Qiu, Taolin Zhang, Tingting Liu, Lei Li, Jianing Wang, Ming Wang, Jun Huang, Wei Lin. EasyNLP: A Comprehensive and Easy-to-use Toolkit for Natural Language Processing. EMNLP 2022 
   Tingting Liu*, Chengyu Wang*, Xiangru Zhu, Lei Li, Minghui Qiu, Ming Gao, Yanghua Xiao, Jun Huang. ARTIST: A Transformer-based Chinese Text-to-Image Synthesizer Digesting Linguistic and World Knowledge. EMNLP 2022 
   Aditya Ramesh, Mikhail Pavlov, Gabriel Goh, Scott Gray, Chelsea Voss, Alec Radford, Mark Chen, Ilya Sutskever. Zero-Shot Text-to-Image Generation. ICML 2021: 8821-8831 
   
  阿里灵杰回顾 
   
   阿里灵杰：阿里云机器学习PAI开源中文NLP算法框架EasyNLP，助力NLP大模型落地 
   阿里灵杰：预训练知识度量比赛夺冠！阿里云PAI发布知识预训练工具 
   阿里灵杰：EasyNLP带你玩转CLIP图文检索 
   阿里灵杰：EasyNLP中文文图生成模型带你秒变艺术家 
   阿里灵杰：EasyNLP集成K-BERT算法，借助知识图谱实现更优Finetune 
   阿里灵杰：中文稀疏GPT大模型落地 — 通往低成本&高性能多任务通用自然语言理解的关键里程碑 
   阿里灵杰：EasyNLP玩转文本摘要（新闻标题）生成 
   阿里灵杰：跨模态学习能力再升级，EasyNLP电商文图检索效果刷新SOTA 
   阿里灵杰：EasyNLP带你实现中英文机器阅读理解 
   阿里灵杰：EasyNLP发布融合语言学和事实知识的中文预训练模型CKBERT

Meta Platforms （原Facebook）计划推出新的大型语言模型以应用于人工智能 PM简读馆技术杂谈人工智能 facebook 语言模型
一、引言在当今科技飞速发展的时代，人工智能领域成为众多科技巨头激烈角逐的关键战场。MetaPlatforms作为全球社交媒体和科技行业的领军者，一直积极投身于新技术的探索与创新。近期，有消息传出MetaPlatforms计划推出新的大型语言模型以应用于人工智能领域，这一举措无疑将对行业格局产生深远影响。本报告将对MetaPlatforms在人工智能领域的发展历程、此次计划推出新模型的背景、可能带来
【知识图谱】neo4j安装与配置_社区版_2025（附完整安装软件包）知识靠谱知识图谱知识图谱 neo4j 人工智能
【知识图谱】neo4j-community-5.15.0社区版安装步骤前言所需环境配置1.安装JDK（1）测试一下（2）安装2.配置JDK环境3.安装neo4j4.配置neo4j环境5.测试安装结果前言(经历过各种版本NEO4J，遇见杂七杂八的各种问题，也看过非常多很好的教程，特此来分享一下，为大家排排坑。)所需环境配置环境工具：Windows10+jdk-17.0.7_windows-x64_b
完整指南：从基础到高级使用 Semantic Kernel 江沉晚呤时 Net core AI c#.netcore
SemanticKernel是微软推出的一款强大的开发框架，旨在帮助开发者通过语义理解和自然语言处理（NLP）构建智能应用。它为开发者提供了与OpenAI、AzureCognitiveServices等人工智能服务集成的简便接口，使得构建自然语言处理（NLP）应用变得更加直观和高效。在本文中，我们将从基础到高级全面讲解如何使用SemanticKernel，并提供详细的代码示例，帮助你快速掌握这个框
将excel文件各列保存为txt的实战代码爱编程的喵喵 Python基础课程 python excel txt 实战代码
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了将excel文件各列保存为txt的实
智能守护者X100 - 自动化生产线智能机器人安全监控管理系统大霸王龙行业+领域+业务场景=定制 python microsoft ascii 文本处理
1.产品介绍产品名称：智能守护者X100-自动化生产线智能机器人安全监控管理系统主要功能：全方位实时监控：智能守护者X100采用高清摄像头与红外夜视技术，实现对自动化生产线及智能机器人的360°无死角监控。系统能自动识别并追踪生产线上的机器人活动轨迹，确保生产安全无遗漏。智能异常检测与预警：集成先进的人工智能算法，能够实时分析视频数据，自动识别机器人操作异常（如碰撞、卡顿、偏离预定路径等），并立即
【实战篇】DeepSeek + Cline 编程实战：从入门到“上头” 再见孙悟空_ 【2025 AI学习从零单排系列】【2025AI工具合集】DeepSeek+cline DeepSeek deepseek cline deepseek编程 AI编程
嘿，小伙伴们！今天咱们来好好唠唠这个超火的组合——DeepSeek+Cline，看看它们在编程实战里到底能发挥多大的威力。要是你还在为写代码时的各种问题烦恼，那这篇文章绝对能帮到你！一、初识DeepSeek和ClineDeepSeek是啥？DeepSeek是杭州深度求索公司开发的一系列人工智能模型，特别擅长知识类任务。它能干的事儿可多了，像自然语言处理、代码生成、数据分析这些都不在话下。而且，De
从代码到云端：纷析云以开源生态重构企业财务管理边界沈晓晶开源 java gitee gitcode
一、公司简介纷析云是专注于企业数字化转型的财务软件服务商，致力于提供高效、安全且灵活的财务管理工具。通过结合云计算、开源技术与智能化功能，纷析云助力企业实现财务流程的自动化与合规化，尤其适合中小型企业及需要高度定制化的用户。二、核心产品与解决方案灵活的部署模式：源代码销售：企业可购买源代码进行二次开发，完全掌控系统功能，满足个性化需求。私有化部署：适用于对数据隐私要求高的企业，支持本地化部署与定制
智能教育：DeepSeek在个性化学习中的创新应用 Evaporator Core #DeepSeek快速入门系统架构设计师 DeepSeek进阶开发与应用聚类数据挖掘机器学习
教育是塑造未来的基石，而个性化学习则是现代教育的重要趋势。随着人工智能技术的飞速发展，教育领域正迎来一场深刻的变革。DeepSeek作为人工智能领域的领军者，正在通过其强大的技术能力，推动个性化学习的创新应用。一、个性化学习路径：从数据到洞察个性化学习的核心在于根据学生的学习数据，生成定制化的学习路径。DeepSeek通过深度学习算法，能够从海量的学习数据中提取关键信息，生成更加精准的学习建议。f
【DeepSeek R1构建本地RAG知识库】应用框架选型对比（MaxKB、Dify、FastGPT、RagFlow、Anything-LLM） Xd聊架构从0到1落地AI人工智能 rag ai 知识库
文章目录前言一、MaxKB1.简介2.技术概览二、Dify1.简介2.技术概览三、FastGPT1.简介四、RagFlow1.简介2.技术概览五、Anything-LLM1.简介2.技术概览六、更多资料1.LLM框架推荐2.RAG生产落地实践架构七、总结1.综合对比2.优缺点对比3.按需选择4.社区与支持5.部署与使用便捷性结尾前言在人工智能技术加速渗透各行各业的今天，检索增强生成（Retriev
DeepSeek + IDEA 辅助编程王炸组合猫猫姐大模型 java 大模型
DeepSeek+IDEA辅助编程王炸组合2025年的春节可以说是人工智能在中国史上飘红的一段历史时刻，年后上班的第一天，便马不停蹄的尝试新技能。今天的科技在飞速发展，编程领域的人工智能工具犹如雨后春笋般涌现。其中，DeepSeek则以其卓越的性能和智能化的功能，迅速在众多开发者中赢得了青睐。对于Java开发者而言，将DeepSeek集成到IDEA中，就如同为自己的编程之路配备了一位智能助手，大幅
Lucene硬核解析专题系列（三）：查询解析与执行 yinlongfei_love lucene mybatis 全文检索
Lucene的索引构建为高效搜索奠定了基础，而查询解析与执行则是将用户意图转化为实际结果的关键环节。本篇将从查询的解析开始，逐步深入到查询类型、评分模型和执行流程，揭示Lucene搜索能力的底层原理。一、查询语法与QueryParser的工作原理Lucene的查询过程始于用户输入的搜索字符串，例如“人工智能AND机器学习”。这一字符串需要被解析为Lucene能够理解的结构化对象。QueryPars
虚拟现实与增强现实：DeepSeek在沉浸式体验中的创新应用 Evaporator Core #DeepSeek快速入门人工智能 #深度学习 AI写作
在科技飞速发展的今天，虚拟现实（VR）和增强现实（AR）技术正在深刻改变我们的生活方式和交互体验。某知名科技评论家张华曾指出："VR和AR的潜力远未被完全挖掘，尤其是在与人工智能结合后，它们将带来前所未有的沉浸式体验。"DeepSeek作为人工智能领域的先锋，正在通过其强大的技术能力，推动VR和AR技术在沉浸式体验中的创新应用。一、VR与AR的技术融合VR和AR的核心在于为用户提供沉浸式的交互体验
微软官宣！Skype将在2025年5月5日正式退役，全面押注Teams 新加坡内哥谈技术人工智能自然语言处理语言模型深度学习学习 microsoft
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/23年传奇落幕，Skype正式告别历史舞台！微软宣布，这款曾经引领互联网通话革命的应用将
NLP自然语言处理——文本处理的基本方法小村学长毕业设计自然语言处理人工智能
NLP（自然语言处理）是人工智能领域的一个重要分支，它专注于使计算机能够理解和生成人类语言。文本处理是NLP中的基础且核心的部分，涉及多个步骤和技术，以确保原始文本数据能够被有效地转换、分析和利用。以下是对文本处理基本方法的详细探讨，包括文本预处理、文本表示、以及常见的NLP任务等。一、文本预处理文本预处理是NLP中的第一步，也是至关重要的一步。它主要包括以下几个子步骤：文本清洗：去除特殊字符：移
自然语言处理：文本表示梦丶晓羽 python Glove Word2Vec TF-IDF 自然语言处理人工智能
介绍大家好，博主又来给大家分享知识了。今天给大家分享的内容是自然语言处理中的文本表示。在当今数字化信息爆炸的时代，自然语言处理作为人工智能领域的重要分支，发挥着越来越关键的作用。而文本表示，则是自然语言处理的基石之一，它就像是一把神奇的钥匙，能够将人类丰富多样、充满语义的自然语言，转化为计算机可以理解和处理的形式。话不多说，我们直接进入正题。文本表示概念阐述在自然语言处理(NLP)中，文本表示是将
活在AI原生时代的05后，开始用AI创业 shelly聊AI AI行业趋势 AI-native 人工智能 deepseek
大家好，我是Shelly，一个专注于输出AI工具和科技前沿内容的AI应用教练，体验过300+款以上的AI应用工具。关注科技及大模型领域对社会的影响10年+。关注我一起驾驭AI工具，拥抱AI时代的到来。人工智能&AIGC术语100条Shelly聊AI-重磅发布Shelly聊AI：年度展望：2025年AI与社会发展关键事件的深度思考（每年一篇，十年为期）凌晨1点，14岁的王泽恺在电脑前伸了个懒腰。屏幕
GPT-5倒计时：2025年AI海啸来袭，机器与人类对话临近 shelly聊AI AI核心技术 AI行业趋势 gpt 人工智能 openai
大家好，我是Shelly，一个专注于输出AI工具和科技前沿内容的AI应用教练，体验过300+款以上的AI应用工具。关注科技及大模型领域对社会的影响10年+。关注我一起驾驭AI工具，拥抱AI时代的到来。人工智能&AIGC术语100条Shelly聊AI-重磅发布Shelly聊AI：年度展望：2025年AI与社会发展关键事件的深度思考（每年一篇，十年为期）从实验室到现实，AI的进化速度正在挑战人类想象的
DeepSeek与数据分析：现状、挑战与未来展望 CodeJourney. 数据库人工智能算法
在当今数字化时代，人工智能（AI）的浪潮正以前所未有的速度席卷各个领域，数据分析作为众多行业决策的关键支撑，也不可避免地受到AI技术发展的深刻影响。近期，AI话题持续火热，不少企业老板要求员工学习AI并将其应用纳入考核。在此背景下，本文作者“紫苜”（原“蒋公子”）对频繁登上热搜的DeepSeek展开了探索，深入研究它在数据分析领域的能力、应用方式以及与其他工具的比较。DeepSeek在数据分析方面
DeepSeek-R1：重新定义推理性能的开源人工智能知识小报童 DeepSeek前言内容整理开源人工智能深度学习机器学习神经网络自然语言处理语言模型
目录重新定义卓越的基准变革性应用案例技术创新后训练优化冷启动数据以提高可用性可扩展性蒸馏模型API集成：为开发者而生竞争定价：可及的高级人工智能开源优势DeepSeek代表的引用推动开放人工智能的边界推动边界意味着什么？挑战与未来方向影响与愿景2025年1月20日–DeepSeek推出了DeepSeek-R1，这是一款突破性的开源人工智能推理模型，旨在与OpenAI的o1等专有对手竞争。该模型在M
无人系统：未来科技的智能化代表给生活加糖！热门知识科技
无人系统（UnmannedSystems）是指在不依赖人类直接干预的情况下，通过自主或远程控制方式完成任务的系统。随着科技的不断进步，特别是在人工智能、机器人学、传感技术、通信技术等领域的突破，无人系统在各行各业中得到了广泛的应用，逐渐改变着传统的生产、服务和管理模式。无人系统的典型代表包括无人驾驶汽车、无人机（UAV）、无人船（USV）、无人地面车辆（UGV）等。一、无人系统的定义与类型无人系统
XLNet：超越BERT的新星 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
-XLNet：超越BERT的新星1.背景介绍1.1自然语言处理的重要性自然语言处理(NaturalLanguageProcessing,NLP)是人工智能领域的一个重要分支,旨在使计算机能够理解和生成人类语言。随着大数据时代的到来,海量的自然语言数据不断涌现,对NLP技术的需求与日俱增。NLP技术已广泛应用于机器翻译、智能问答、信息检索、情感分析等诸多领域,为人类生产和生活带来了巨大便利。1.2预
Svelte 开发 AI 应用：高效轻量级前端框架的 AI 集成探索赵大仁大语言模型前端 AI 人工智能前端框架
Svelte开发AI应用：高效轻量级前端框架的AI集成探索1.引言人工智能（AI）与Web应用的结合已经成为前端开发的重要趋势。传统上，Vue、React等框架常用于AI前端交互，而Svelte作为一款编译时优化的前端框架，以轻量级、高性能、无运行时的特点，成为AI应用开发的新选择。本文将探讨如何利用Svelte构建高效的AI应用，包括AIAPI集成、前端推理优化、可视化分析、Web组件开发等关键
DeepSeek R1：揭示适度思考在信息处理中的关键作用耶耶Norsea 网络杂烩人工智能
摘要DeepSeekR1是一款先进的大型推理模型，研究发现其在信息过载时性能显著下降。当减少过度思考，即不过度分析信息时，DeepSeekR1的计算成本可降低43%。这表明适度思考有助于提高信息处理效率并减少资源消耗，为优化人工智能模型提供了新的视角。关键词DeepSeekR1,信息过载,推理模型,计算成本,适度思考一、适度思考与信息处理效率1.1DeepSeekR1推理模型的特性概述DeepSe
深入解析Python机器学习库Scikit-Learn的应用实例 caihuayuan5 面试题汇总与解析 spring boot java 后端大数据课程设计
深入解析Python机器学习库Scikit-Learn的应用实例随着人工智能和数据科学领域的迅速发展，机器学习成为了当下最炙手可热的技术之一。而在机器学习领域，Python作为一种功能强大且易于上手的编程语言，拥有庞大的生态系统和丰富的机器学习库。其中，Scikit-Learn作为Python中一个重要的机器学习库，包含了许多常用的机器学习算法和工具，可用于数据挖掘、数据分析和预测建模等应用场景。
基于YOLOv5的无人超市商品检测：食品、饮料、零食与家居用品深度学习&目标检测实战项目 YOLO 目标跟踪深度学习人工智能 ui
引言随着人工智能技术的快速发展，尤其是计算机视觉的提升，无人超市的概念逐渐成为现实。在无人超市中，商品的智能化管理和检测是其顺利运行的关键。商品检测不仅要实现高效、准确的物品识别，还要支持多种商品类别的实时检测，以保证购物体验的顺畅与安全。在此背景下，深度学习与目标检测算法，如YOLOv5，成为了实现这一目标的重要工具。YOLOv5作为目前最先进且高效的目标检测算法之一，其应用范围广泛，包括人脸检
STM32实战开发（166）：智能体育器材管理系统：基于STM32和LSTM技术的实现方案嵌入式开发项目 stm32 lstm 嵌入式硬件单片机 struts 能源
1.引言随着物联网、人工智能技术的不断发展，智能体育器材管理系统逐渐成为体育行业的热点。传统的体育器材管理方式往往依赖人工统计、人工管理，容易导致数据失真和管理不及时等问题。因此，基于STM32微控制器和LSTM（长短期记忆网络）模型的智能体育器材管理系统应运而生，结合物联网技术、传感器技术、数据分析算法等，能够为体育器材的管理提供更加高效、智能的解决方案。2.STM32微控制器概述STM32是一
基于YOLOv5的野生动物检测与监控系统：猫、狗、鸟、猴子、狮子、老虎、象的实时识别与分析深度学习&目标检测实战项目 YOLO 目标跟踪人工智能深度学习 ui 目标检测机器学习
1.引言随着人工智能技术的飞速发展，尤其是深度学习在计算机视觉领域的突破，目标检测技术已广泛应用于各类场景。从城市交通监控到安防系统，再到野生动物保护和生态监测，目标检测技术为我们提供了实时、精确的解决方案。在众多目标检测算法中，YOLO（YouOnlyLookOnce）系列因其高效性和实时性，已成为解决多类别目标检测任务的首选方法。本文将介绍如何使用YOLOv5进行野生动物检测与监控，包括猫、狗
《解锁万相2.1大模型：开启视频创作新世界》：此文为AI自动生成空云风语人工智能音视频人工智能
《解锁万相2.1大模型：开启视频创作新世界》：此文为AI自动生成万相2.1大模型初印象在人工智能飞速发展的当下，大模型领域的每一次突破都备受瞩目。2025年2月25日晚间，阿里巴巴带来了一个令人振奋的消息：阿里云视频生成大模型万相2.1（Wan）正式开源。这一消息瞬间在AI圈引发了广泛关注，也让众多开发者和视频创作爱好者们对万相2.1充满了期待。万相2.1作为阿里云通义系列AI模型的重要成员，自发
电商图书行业类目AI导购Agent系统详细设计与开发实战 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着电子商务的蓬勃发展，图书行业也迎来了线上销售的黄金时代。然而，海量的图书种类、复杂的读者需求，使得用户在选购图书时常常面临选择困难。传统的搜索和推荐方式往往无法精准匹配用户的个性化需求，导致用户体验不佳，转化率低。为了解决这一痛点，AI导购Agent系统应运而生。该系统利用人工智能技术，模拟专业的图书导购员，为用户提供个性化的图书推荐和导购服务。通过深度学习、自然语言处理等技术，A
大模型技术：重塑未来的力量每天五分钟玩转人工智能人工智能机器学习深度学习大模型
大模型技术之所以成为当今科技领域的热点，是因为它拥有改变游戏规则的能力。以ChatGPT为例，这款由OpenAI开发的大型语言模型，首次实现了基于语言的智能涌现，推动了通用人工智能的技术飞跃和快速进化。大模型通过强大的数据处理能力和广泛的适用性，极大地提升了生产力，改变了生产要素的构成。它不仅加速了信息处理的速度和精度，使得数据成为新的生产资料，提高了知识创造和应用的效率；还通过促进跨领域知识融合
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

当大火的文图生成模型遇见知识图谱，AI画像趋近于真实世界

导读

ARTIST模型详解

第一阶段：基于VQGAN的图像矢量量化

第二阶段：以文本序列为输入利用GPT生成图像序列

ARTIST模型效果

标准数据集评测结果

案例分析

ARTIST模型在MUGE榜单的评测结果

ARTIST模型的实现

ARTIST模型使⽤教程

安装EasyNLP

数据准备

ARTIST文图生成微调和预测示例

在阿里云机器学习平台PAI上使用Transformer实现文图生成

未来展望

Reference

阿里灵杰回顾

你可能感兴趣的:(开源技术,人工智能,知识图谱)