Stable Diffusion是2022年发布的深度学习文本到图像生成模型,它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词(英语)指导下产生图生图的翻译。
Stable Diffusion主要用于 文本生成图像
的深度学习模型,也就是常说的txt2img
的应用场景中:通过给定 文本提示词(text prompt
),该模型会输出一张匹配提示词的图片。
基于Stable Diffusion的AI绘画网站。AI绘画工具最火的还是Midjourney(MJ,付费)和Stable Diffusion(SD),特别是SD,由于其开源属性,养活了一堆很有特色的AI绘画网站。
Lexica Art目前只只支持自己的模型:Lexica Aperture v2,图片尺寸可定制,生成的图片分辨率极高
网址:https://lexica.art/aperture
测试效果:
prompt: best quality, masterpiece, highres, 1girl,blush,(seductive smile:0.8),star-shaped pupils,china hanfu,hair ornament,necklace, jewelry,Beautiful face,upon_body, tyndall effect,photorealistic, dark studio, rim lighting, two tone lighting,(high detailed skin:1.2), 8k uhd, dslr, soft lighting, high quality, volumetric lighting, candid, Photograph, high resolution, 4k, 8k, Bokeh
Negative prompt: (((simple background))),monochrome ,lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, lowres, bad anatomy, bad hands, text, error, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, ugly,pregnant,vore,duplicate,morbid,mut ilated,tran nsexual, hermaphrodite,long neck,mutated hands,poorly drawn hands,poorly drawn face,mutation,deformed,blurry,bad anatomy,bad proportions,malformed limbs,extra limbs,cloned face,disfigured,gross proportions, (((missing arms))),(((missing legs))), (((extra arms))),(((extra legs))),pubic hair, plump,bad legs,error legs,username,blurry,bad feet
Catbird集成十几种SD模型,图片尺寸为512x512。
网址:https://www.catbird.ai/
网址:https://rightbrain.art/text2Image
测试效果:
prompt:干净的动画画可爱的仙女,女孩在花的肖像,干净的脸,白色灰色的背景
因为2022年stable diffusion已经全部开源(包括模型权重和代码),所以用户也可以自己尝试。
使用Google colab笔记本
一般会有很多大佬分享自己已经部署好的笔记本,通过架设Stable Diffusion WebUI可以较为轻松实现云端部署模型
使用kaggle网站
也有很多kaggle上的项目,类似于colab上的项目,kaggle也提供每周30小时的GPU算力
本地部署对电脑的操作系统、内存、显卡等硬件条件都有一定要求,适合有一定编程经验和深度学习基础的爱好者。