Midjourney是一款 AI 绘画工具,可以根据你的提示(本文中称为 prompt)创作出各种图像。你只需要在Discord上和一个机器人聊天,就可以用简单的命令来控制它。目前已不支持免费试用,可以选择付费计划来获得更多功能和优势。
目前 Midjourney 的最新模型为 v5.1 模型,新用户有25次免费额度,快去体验吧!
本文干货满满,建议收藏!!!
要使用 Midjourney 进行 AI 绘画,首先要创建一个 Discord 账号,然后加入 Midjourney 服务器。
具体如何注册 Midjourney 网上已有大量教程,还是不会注册的朋友们可以私聊博主。
在控制台输入 /imagine 指令,在 prompt 框中输入提示信息,完成后输入回车,即可创作一张 AI 绘画作品。
如我们在控制台输入 /imagin a cute cat,就会得到4张可爱的小猫咪图片:
在使用 /imagine 指令创作图片后,会生成4张不同的图片,同时下方会出现一排按钮,接下来讲解按钮的作用。
首先,使用1、2、3、4分别对这4张图片进行编号,U1~U4 和 V1~V4 表示对对应的图片做 U 操作(upscale,升档)或 V 操作(variations,变体),重做按钮表示按刚刚的提示重新生成4张图片。
mj 会为每条指令生成4张图片,升档操作表示从这4张图片中选择某张图片,放大这张图片并增加细节,提高清晰度。
可以看到,U1 操作即为选择了第1张图片,将其放大并增加细节,更加清晰。
下面还有3个按钮,功能如下:
Make Variations 按钮表示对这张图片进行变体操作。
Web 按钮,表示在个人主页中查看这张图片,如下所示:
右下角有个保存按钮,点击即可将其下载到我们自己的设备上了!
Favorite 按钮则表示收藏,可以在个人主页查看已收藏的图片。
变体操作表示从这4张图片中选择某张图片,对这张图片做变体处理,按照这张图片生成4张主体一致,细节有所变化的新图片。新生成的这4张图片还可以继续进行 U 操作、V 操作和重做操作。
在控制台输入指令 /settings,进入设置页面。如下图所示:
配置界面第1行和第2行的选项代表使用哪个模型进行作图,只能选择一项。当前版本默认使用 v5.1 模型,分辨率更高,理解力更强,细节处理更好。
Niji 模型是二次元风格的模型,适用于生成二次元风格的图片。RAW Mode 版本是 v5.1 模型的另一种模式,会生成另一种风格的图片,适合生成电影类型的图像,在选择 v5.1 模型时才会出现这个模式。
第3行的配置项为风格参数,有low、med、high、very high四种模式,越高图片越精细。
这一行的4个选项只可以选择其中1个。
第4行的第1个选项 Public mode,选中表示公开模式,所有人都能看见你生成的图片。
取消选中则表示隐身模式,别人看不见你生成的图片。
隐身模式只有高级订阅(即60$一月)的用户才可以使用。把 Midjourney bot 机器人拉入自己的服务器虽然看起来是只有自己看到自己生成的图片,但实际上你的 prompt 和你生成的图片也被发送到 Midjourney 的公共频道,所有人都可见。
第4行的第2个选项 Fast mode,选中表示快速模式,需要消耗占用 GPU 的快速时长。快速模式下不需要排队,出图速度较快。普通订阅的用户和高级订阅的用户每个月都有一部分快速时长。
取消选中则表示放松模式,需要排队作业,出图速度较慢。
第4行的第3个选项 Remix mode 代表混音模式,选中后可以对图片的局部风格进行调整,即在变体操作时调整生成图片的 prompt。
使用文本描述 A happy girl,绘画效果如下:
打开 Remix mode 后,做 v1 操作,可以看到出现一个弹窗,在弹窗中我们可以修改 prompt:
修改文本描述为 A sad girl 后,效果如下:
可以看到,混音模式下,可以对图片的局部风格进行调整,甚至可以完全改变图片的风格。
Midjourney 的 prompt 由文本描述和后缀参数两部分组成。文本描述推荐使用英文,Midjourney 对中文的识别能力不是很强。
由于博主英语不是很好,接下来的示例我都是使用 AI 来帮忙生成 prompt。
后缀参数可以控制图片的大小、风格、样式、质量等,可以更容易生成我们想要的图片。
后缀参数之间的顺序可以任意改变。
-- 后跟上模型代表使用这个模型进行作图。如 -- v5.1(注意 -- 后面有一个空格)表示使用 v5.1 模型,--niji 5(注意这里的 -- 后没有空格)表示使用 niji 5模型等。
后缀参数 ar 表示生成图片的比例。参数值为图片的宽高比,格式为 w:h,w 为宽,h 为高。
默认值为 1:1,一般的取值有 3:2,4:3,3:4 等。
网页上的图片比例一般为 16:9,来看下面的示例:
Welcome to the world :: of a future city ::2 that shines under the starlit sky. Neon lights twinkle in the distance, reflecting off the sleek, glassy surfaces of towering structures. Futuristic vehicles zoom through the air, leaving trails of light in their wake. It's a city that's awake, alive, and pulsating with energy. --ar 16:9
这条 prompt 中文本提示中有权重切分符(::),权重切分符如何使用将在 Midjourney 的进阶篇中进行讲解。
后缀参数 style 表示模型生成图片的风格。
v4 模型有 4a、4b 和 4c 3种风格,niji 5 模型有 expressive(默认)、cute 和 scenic 3种风格,v5.1 模型有默认风格和 raw 风格2种风格。
Embark on a journey :: into the world of an endearing girl ::2 in a room inspired by Japanese aesthetics. The room bursts with pastel colors, plushies, and eclectic decorations, creating a warm and inviting ambiance. The girl, in her adorable clothes, with a sweet smile, embodies pure charm. --niji 5 --seed 1024
如下分别为 niji 5 模型使用 expressive 风格和 cute 风格的效果:
可以看到,cute 风格下的图片显得更加可爱。
后缀参数 chaos 影响初始图像网格的差异程度,可以简写为 c。取值范围为0-100,默认为0。
高 chaos 值将生成更不寻常和意外的结果和构图,低 chaos 值则会产生更可靠和可重复的结果。
如下分别为 chaos 参数值为0和80时的效果:
Welcome to the world of the Rainbow Windmill Island. ::2 The island, adorned with vibrant windmills spinning joyfully, stands in the middle of a turquoise sea. ::1.5 The sky above is bright and clear, with fluffy white clouds scattered across the azure expanse. The sight of the island, so full of life and color, brings a sense of peace and tranquility.
可以看到,chaos 值越高,生成的图片越更富有想象力。
后缀参数 seed 表示生成图片时使用的种子,可以确保生成的图片的一致性,相近的 seed 值生成的图片的构图和风格都很接近。使用相同的文本提示、模型、风格和 seed 值的 prompt,生成的四宫格图片将一模一样。
上面 --style 的案例中,和我使用相同的 seed 值1024,会得到和我一样的四宫格图片。
这个参数将在进阶篇详细展开。
后缀参数 --no 表示否定提示,表明在图像生成中不想要的东西,作用是对不需要的元素进行删除,使它们不太可能出现在输出中。
例如想生成一幅没有任何河流的风景画,可以这样写:
a landscape painting --no rivers
后缀参数 tile 生成可以用作重复图案的图像,用于制作无缝图案、壁纸和纹理。
woodden board texture --tile
一个检查无缝贴图的网站:Seamless texture check | pycheung.com
后缀参数 quality 影响生成图像所需的时间,即图片的质量,可以简写为 q。默认值为1,可选值有 .25、.5、1、2 四个值。
高质量的设置需要较长的处理时间并生成更多细节,更高的数值也意味着每个作业使用的GPU分钟数更多。
质量设置不影响分辨率,更高的 quality 设置并不总是更好。有时,较低的 quality 设置可以产生更好的结果,这取决于试图创建的图像。较低的 quality 设置可能最适合于手势抽象外观。更高的 quality 值可以改善从许多细节中受益的建筑图像的外观。选择与希望创建的图像类型最匹配的设置。
如下为 quality 值为1和2时的效果:
Welcome to a cityscape of the future, where skyscrapers::2 loom large against the sky, their futuristic design a testament to human ingenuity and progress::1.5. Neon lights flicker on their surfaces, painting an electrifying picture of the city night. --ar 3:2
可以看到,quality 值为2时图片有更丰富的细节。
后缀参数 stylize 影响生成的图片和 prompt 的相关度,可以简写为 s。取值范围为0-1000,默认值为100。数值越小,和我们 prompt 关联度越高;数值越大,生成的图片更加高调。
如下为 stylize 值为100和800时的效果:
Step into the enchanting world ::2 of a cute magical kitten in the realm of anime ::2. With sparkling eyes and a tiny wand, it casts spells of joy and laughter. --niji 5 --style cute
可以看到,当 stylize 值为800时,图片主体都变了,上面的 prompt 的主体为魔法猫咪。
取值范围0.5 ~ 2,用于图生图控制生成图片的图文相关性。取值越高,则生成的图片参考 prompt 中“图”的比重就越高;反之,参考“文”的比重就越高。在后续图生图的文章中会详细解析。
最基本的指令,用于文本生成图片,prompt后面加描绘词,即文生图。
用于图片生成与之相关的4条英文的文本描述,即图生文。
控制台输入 /describe 指令,上传一张图片,发送,即可得到4条文本描述。
注意:这几条文本描述只是 AI 分析图片得出来的,并无法保证使用这些文本描述可以得到相同的图片。
将两张图片按照文本描述进行混合,即图生图。后续文章会详解讲解。
在聊天记录中的一个任务右上角,点击添加反应按钮,搜索 "envelope",点击这个信封图标。
这时就可以在 Midjourney Bot 给你的私信中看到这个任务的 Job ID 和 seed 值。
这个时候控制台输入 /show 指令,job_id 框中粘贴上面查看到的 job_id,就可以看到这条消息了,同时可以对这个任务继续进行升档操作和变体操作。
这个指令并不经常使用,细心的朋友已经发现,上面获取 Job ID 那里同时还获取到了 seed 值,有用的其实就是这个 seed 值。
上文已经提到,使用相同的文本提示、模型、风格和 seed 值的 prompt,生成的四宫格图片将一模一样。现在就来试验一下:
Embark on a journey :: into the world of an endearing girl ::2 in a room inspired by Japanese aesthetics. The room bursts with pastel colors, plushies, and eclectic decorations, creating a warm and inviting ambiance. The girl, in her adorable clothes, with a sweet smile, embodies pure charm. --ar 1:1 --niji 5 --seed 4123671164
使用上面的 prompt,你将会得到和我相同的图片。这就是 seed 的神奇之处!
利用这个特性,我们就可以使用控制变量法对图片的细节进行微调了,进阶篇中我将详细讲解。
(1) /settings 设置
(2) /fast 切换到快速模式
(3) /relax 切换到放松模式
(4) /public 切换到公共模式
(5) /stealth 切换到隐身模式
(6) /prefer remix:切换到混合模式
Midjourney 有很多的后缀参数,有时候在每次作图时都会添加一些固定的后缀参数,显然有点麻烦。使用 /prefer suffix 指令可以定要添加每个提示末尾的后缀:
如下面这条指令,会在每次绘图时,prompt 后都添加上 --ar 16:9 --v 5.1 --style raw --q 2 --s 800。
接下来我输入文本描述,运行时后面会自动加上预设的后缀。
Step into the world of Zaun ::2, a city steeped in darkness and chaos. The high-tech industrial infrastructure towers above, offering a stark contrast to the disorder below
直接输入 /prefer suffix 指令,后不加任何内容,可以重置后缀预设。
使用 /prefer suffix 设置默认后缀参数的默认值,只能设置一条预设。如果想要设置多条后缀参数的预设,在不同情况下使用不同预设,那么就可以使用 /prefer option set 创建变量的方法。
定义变量 x 为 "--ar 4:3 --chaos 30",之后就可以直接在 prompt 中以 --x 的形式使用该变量,x 即等于 "--ar 4:3 --chaos 30"。
出现下面的提示时,即为创建变量成功!
使用变量 x 的方式如下:
Step into the vastness of the universe ::2. The sky is ablaze with countless stars, each one a distant world waiting to be discovered
如上案例中,在运行时变量 x 被自动替换为已经预设好的后缀参数。
控制台输入指令 /prefer option list 后回车发送,可以看到已定义好的变量。
另外,如果想要删除变量,可以使用 /prefer option set,设置空的 value 即可。
看到如下消息即为成功删除变量:
再次输入 /prefer option list 指令,可以看到已经没有了变量 x。
如订阅状况、工作模式等。
Subscription:订阅信息,有订阅等级,订阅方式(按月 / 按年)和订阅时间。
Job Mode:工作模式,Fast(快速模式)/ Relax(放松模式)。
Visibility:可见性,Publuic(公开模式)/ Stealth(隐身模式)。
Fast Time Remaining:剩余多少快速时长。
Lifetime Usage:快速模式下生成了多少张图片,使用了多长时间 GPU。
Relaxed Usage:放松模式下生成了多少张图片,使用了多长时间 GPU。
Queued Jobs (fast):当前有多少个快速模式的作业正在排队队列。
Queued Jobs (relax):当前有多少个放松模式的作业正在排队队列。
Running Jobs:当前有哪些作业正在运行。
我在 ZelinAI 上做了一个 AI 应用,可以根据用户输入的内容生成一条适用于 Midjourney 的文本描述,对不熟悉英文的小伙伴们非常友好。
点击这里来体验吧!
由于 Zelin AI 目前只能使用 ChatGPT 模型(即 GPT-3.5),能力不是很强。这个 AI 工具目前还无法生成完整的 prompt,只能生成英文描述,后缀参数还需要我们来手动调配。
另外,我用 GPT-4 训练了一个生成 Midjourney 提示的 AI 工具,GPT-4 相比于 GPT-3.5 强大了很多,理解能力大幅度提高,已经可以生成完整的带后缀参数的 prompt。
如下为 GPT-4 模型下 Midjourney 提示工程师 AI 工具的表现:
可以看到,生成了完整的 prompt!使用第3条 promot,效果如下:
生成的图片还是非常不错的!正文部分的各种案例图片的 prompt 都由 GPT-4 版本的 Midjourney 提示工程师 AI 工具生成。
点赞达到15个,后续我会在本专栏发一篇文章来详解讲解如何训练这个模型!
点赞达到30个,我将公开这篇文章!
三连 + 关注,在评论区回复 "AIGC!",我将把 GPT-4 版本的 Midjourney 提示工程师模型的训练咒语发给你!