国内外AI绘画『文生图』模型效果对比

 最近AI作画确实很火,在DALL-E和Imagen崭露头角之后,ERNIE-ViLG、Stable-Diffusion(SD)、Disco-Diffusion相继开源开放,涌现出丰富多彩的AI作画作品。本次通过一个开源工具来整体测试三种模型效果,用几行代码就整体测试国内外模型的效果。

ERNIE-ViLG效果


prompt:明日方舟,炫酷,兽耳娘,机能风,卡通

项目地址:PaddleHub/modules/image/text_to_image/ernie_vilg at develop · PaddlePaddle/PaddleHub · GitHub

Stable-Diffusion(SD)效果

prompt:a beautiful landscape photography of snow covered Rocky mountains, a dead intricate tree in the foreground, sunset, dramatic lighting, by Marc Adamus

prompt:close-up maximalist illustration of panther, by makoto shinkai, akihiko yoshida, yoshitaka amano, super detailed, hd wallpaper, digital art

项目地址:https://github.com/PaddlePaddle/PaddleHub/tree/develop/modules/image/text_to_image/stable_diffusion

Disco-Diffusion效果

prompt:在artstation上的一幅美丽的画,一个独特的灯塔,照耀着它的光穿过喧嚣的血海

由greg rutkowski和thomas Kinkade所作

项目地址:https://github.com/PaddlePaddle/PaddleHub/tree/develop/modules/image/text_to_image/disco_diffusion_ernievil_base

以上惊艳的文图生成效果,是通过PaddleHub三行Python代码实现的作品

import paddlehub as hub 

module = hub.Module(name="ernie_vilg") 

results = module.generate_image(text_prompts=["巨大的白色城堡"])

以上ernie_vilg替换为stable_diffusion或disco_diffusion_ernievil_base即可轻松体验不同的文图生成模型,用户也可自定义修改text_prompts来获得不同的效果体验。

三行代码虽然简单,但是代码背后的文图生成模型可不简单,分别来源于现在文图生成领域最顶尖的开源成果:ERNIE-ViLGStable-Diffusion以及Disco Diffusion + ERNIE-ViL。以DD+ ERNIE-ViL为例,DD扩散模型负责从初始噪声或者指定初始图像中来生成目标图像,ERNIE-ViL负责引导生成图像的语义和输入的文本的语义尽可能接近,随着扩散模型在ERNIE-ViL的引导下不断的迭代生成新图像,最终能够生成文本所描述内容的图像。

国内外文生图模型的效果对比,大家可以自行测试,只需要三行代码就可以,项目地址:

Github:https://github.com/PaddlePaddle/PaddleHub

你可能感兴趣的:(国内外AI绘画『文生图』模型效果对比)