按照 Midjourney 的官方文档里的说法,并不一定:
Prompts can be very simple. Single words (or even an emoji!) will produce an image. Very short prompts will rely heavily on Midjourney’s default style, so a more descriptive prompt is better for a unique look. However, super-long prompts aren’t always better. Concentrate on the main concepts you want to create.
但你会发现,好像中文社区分享的 prompt 都非常长,但只要各位仔细观察,或者用翻译软件查一查,你会发现很神奇的事情:
如果你看完我的教程,你会发现我讲的例子里,很多图只要很少的 prompt 就能描述清楚,生成的图片也不差。
当然我并不是说,不能写很长的 prompt,如果你生成的内容本来就很复杂,那写长一点也没所谓,但写完问问自己,这有必要吗?
说到游戏,我最喜欢的风格是像素风,像素风格一般有:
各位都可以自己试试,介绍一个我写的 prompt,最近塞尔达发布了最新作《王国之泪》,很喜欢他们的天空岛的设定,所以用 Midjourney 生成了一个 16-bit pixel art 版本:
Prompt | 解释 | |
---|---|---|
类型是什么? | 16-bit pixel art | 16 bit 风格 |
主体是什么? | island in the clouds, ancient ruins | 天空岛,岛上有遗迹 |
背景是什么? | null | 主题描述里其实已经有背景了(clouds),所以我就没重复写 |
构图是怎样的? | null | 不太重要,就让 AI 自由发挥 |
用什么镜头? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | Zelda style | 因为是复刻塞尔达,所以加了塞尔达风格 |
参数 | null | 没有加任何参数 |
再生成一个宠物小精灵的场景:
Prompt | 解释 | |
---|---|---|
类型是什么? | 8-bit pixel art | 换成了更复古的 8 bit 风格 |
主体是什么? | types of Pokémon | 我想让 AI 生成宠物小精灵图谱一样的内容 |
这两个 prompt 都很短,但很有意思,可玩性挺强的,各位可以多玩玩:
因为篇幅的原因,我无法将所有有关 3D 游戏的 prompt 都介绍完,我只能挑选一些我比较喜欢的风格讲一下,而且我不是专业的 3D 设计师,所以未免会有讲错的地方,望见谅。
在 3D 场景设计里,我最喜欢的应该是像素风 3D 微缩场景,也不知道是不是叫这个名字,写一个 prompt 给大家看看:
Prompt | 解释 | |
---|---|---|
类型是什么? | isometric clean pixel art | 这个风格我是问了 ChatGPT 的,不确定是不是叫这个。 |
主体是什么? | robotics lab | 机器人实验室 |
背景是什么? | null | 不太重要,就让 AI 自由发挥 |
构图是怎样的? | null | 不太重要,就让 AI 自由发挥 |
用什么镜头? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | null | 我在类型里提了,所以不需要重复强调 |
参数 | null | 没有加任何参数 |
以下左图是火星工厂,右图是机器人实验室:
主体描述我就不多说了,更多是分享 3D prompt 的必要的要素:
Prompt | 解释 | |
---|---|---|
类型是什么? | blender 3d | 我测试了下,只写 3d 也行,但不知道为啥没那味,加了 blender(一个 3D 建模软件)就会好很多。 |
主体是什么? | Dark Vader, full body, cute | 达斯维达的全身像,然后我希望它生成一个 Q 版的 |
背景是什么? | null | 不太重要,就让 AI 自由发挥 |
构图是怎样的? | isometric | 等轴侧投影,这是一种用二维平面呈现三维物体的方法,效果可以看后面生成的图片,各位就知道是啥了。 |
用什么镜头? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | Pixar, style of artstation | 我这里加了皮克斯风格,以及跟之前讲插画的那章加了 behance 类似,加了 artstation 后效果有变好(artstation 跟 behance 类似,也是设计师分享作品的一个网站,但主要分享 3d 或游戏相关的内容) |
参数 | null | 没有加任何参数 |
我用以上 prompt 生成了达斯维达和风暴兵的,我觉得风暴兵还挺可爱的:
游戏装备非常非常多,我没法一一给大家介绍,只介绍一些我了解的,首先是戒指,多大数的游戏戒指都是那种印章戒指(signet ring),
Prompt | 解释 | |
---|---|---|
类型是什么? | blender 3d | 这个可加可不加 |
主体是什么? | star war, signet ring | 星球大战的印章戒指 |
背景是什么? | null | 不太重要,就让 AI 自由发挥 |
构图是怎样的? | isometric | 等轴侧投影(这个可加可不加) |
用什么镜头? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | null | 不太重要,就让 AI 自由发挥 |
参数 | null | 没有加任何参数 |
另外一个可能常见的是装备集(我不确定这个中文是否正确,英文叫 Item Collections),写法是这样的:
Prompt | 解释 | |
---|---|---|
类型是什么? | blender 3d, game sheet | game sheet 简单说是那种游戏设定图,一般就是罗列各种装备 |
主体是什么? | lightsabers, paladin armor, | 希望生成一些列的星球大战的光剑和圣骑士盔甲 |
背景是什么? | null | 不太重要,就让 AI 自由发挥 |
构图是怎样的? | null | 类型包含了,所以不用填 |
用什么镜头? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | style of Hearthstone | 我很喜欢炉石传说的风格,也很好奇,中古风格,遇上未来题材,会生成怎样的设计 |
参数 | null | 没有加任何参数 |
最后生成的结果如下,但我对装备集的生成不是很满意,后面我会介绍一个技巧,教大家如何渐进优化生成的图片:
很多人把 AI 生成图片比喻为炼丹,我觉得非常贴切,很多时候,也不知道为啥,在 prompt 里加一点神秘配方,图片就会很不一样。
不过我觉得虽然过程很像炼丹,但并不代表我们需要像古人那样,用撞大运的方式炼制丹药。我认为目前使用 Midjourney 最好的方法是:控制变量渐进优化法。
拿上面那个装备集的图片为例,我希望它生成的是装备,并且是一件件地排布,而且光剑的效果也很奇怪,首先我们来逐条排查 prompt:
Prompt | 检查 | |
---|---|---|
类型是什么? | blender 3d, game sheet | 这个好像有点问题,我希望的炉石传说的风格,好像不是这种精致的 3D 效果,生成的风格更像是星际争霸的,而炉石传说是那种黏土风格(clay render)。 |
主体是什么? | lightsabers, paladin armor, | 这里可能也有问题,会不会是没有写 different types of lightsabers 导致只生成一种光剑。 |
背景是什么? | null | 这个应该没啥问题 |
构图是怎样的? | null | 这个应该没啥问题 |
用什么镜头? | null | 这个应该没啥问题 |
是什么风格? | style of Hearthstone | 感觉生成的图没有那种中世纪盔甲的油腻感,但如果前面改了黏土风格,会不会好一些?这里可能也需要优化下。 |
参数 | null | 这个应该没啥问题 |
从这个表里可以看到,我们发现了三个问题,其中第一个黏土风格问题,跟最后一个问题有关,此时我的建议是:
OK,按照以上原则,我们修改一下我们的 prompt,看看生成了什么,的确加了 different types of 后,光剑就多了,问题解决了:
然后我们修改下 blender 3d,将其改为 clay render (黏土渲染),我改完之后发现生成的结果(左边四张),好像质感还是差了一点,于是我又试了下保留 3d blender 加 oily 的效果(中间四张),以及 clay render 加 oily 两个一起用(右边四张)。
我个人觉得好像两个都改了效果是最好的(右边四张)。
对比一下最开始的 prompt 生成的图片,是不是最终的图片效果更好?所以这个技巧主要想告诉大家,写 prompt 没有必要照抄答案,你也有能力自己写好 prompt。
游戏这一章,再介绍一个可能会用到的一个场景人物设定稿,prompt 如下:
Prompt | 解释 | |
---|---|---|
类型是什么? | concept design sheet | 设定稿 |
主体是什么? | female paladin, character design, | 生成一个女性圣骑士的角色设定 |
背景是什么? | white background | 设定稿一般都是白底的 |
构图是怎样的? | null | 类型包含了,所以不用填 |
用什么镜头? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | null | 因为我对游戏相关的风格和设计师都不熟悉,所以就让 AI 自由发挥了 |
参数 | null | 没有加任何参数 |
最后的结果如下:
我有用 ChatGPT 辅助我生成提示词,但没有用 Role 模式,而是让它:
我为何没有用 Role 模式?
的确,让 ChatGPT 以 Role 模式帮我生成内容,比较省时省力,但我个人觉得:
不过,这也是我一家之言,如果你觉得这样效率更高,那就用吧~
没啥关系,适合自己的工具才是好工具。
OK 言归正传,从本章开始,我们会逐步丰富我们的 prompt 框架,让图片有更多的细节。实物生成的第一个是场景是玩具,是个非常有意思的场景。
另外,这个场景如果能跟 3D 打印机结合一下,我觉得会非常赞。不知道有没有有志之士能实现一下。
再解释下 prompt 有哪些更新,从实物这张开始,我讲「背景」调整为「环境」,即主体环境,包括背景、灯光等等:
Prompt | 解释 | |
---|---|---|
类型是什么? | product photography | 产品照片 |
主体是什么? | Stormtrooper, plastic, toy | 继续用风暴兵和达斯维达为例。因为手办一般都是塑料玩具,所以加了两个词 |
环境是怎样的? | white background, studio lighting | 背景:为了突出手办,强调一下白色背景 灯光:增加一些灯光,突出产品 |
构图是怎样的? | null | 不太重要,就让 AI 自由发挥 |
用什么镜头? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | hand painted, | 我查了下,好像手办的风格应该只有手绘? |
另外一个是游戏王里的蓝眼白龙,可惜 Midjourney 并不知道啥是 Yu-Gi-Oh,只能按字面意思生成了一个:
Prompt | 解释 | |
---|---|---|
主体是什么? | Blue-Eyes White Dragon, plastic, toy | 继续用风暴兵和达斯维达为例。因为手办一般都是塑料玩具,所以加了两个词 |
以下是生成的图片:
另外,我发现 Midjourney 对美式动漫或电影作品支持会好很多,比如冰与火之歌里的龙妈(只是龙有点诡异),还有圣女贞德:
说到手办,大家应该第一反应会想起日本,再介绍一个技巧,在 prompt 里加入 Japanese style 即可,拿圣女贞德作手办,以及之前做的 logo 作为例子:
圣女贞德是不是有种 FF 的感觉?Logo 也比较简洁,猫的外观也有点像动漫里猫的外观,当然除了 Japanese 还有 Chinese(左边4张),甚至 African Style:
各位有没有发现,上面那个 Chinese 手办生成的结果好像只有第三张是中国人面孔?原因是 Chinese style 的权重太低,所以仅输出了一个结果。你在实践的过程中,也肯定会遇到,AI 忽略了某些 prompt 词的情况,比如你提到画面中要有一只鸟,但它就是没画出来。
那为何会产生这样的结果?原因 Midjourney 的 prompt 权重是按照顺序逐个降低(详情请见我翻译的 Midjourney 官方 FAQ),在我们上面的 prompt,我们将 Chinese Style 放到了最后,所以生成的结果也是最少的。忽略了某些词,这个原因暂时为止,但应该很可能是权重导致的问题。
增加权重的方法有很多,最简单的方法就是调整顺序,比如将上面的 Chinese Style 放到最前面(然后生成的结果就是眯眯眼 style 了 ,我生成了两次,第二次好一些):
product photography, Chinese Style,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting
调整下顺序,效果就大不一样,所以各位不要迷信所谓的 prompt 模板,多试试。
第二种方法是 Slider 方法。
你需要在 prompt 最后加 ,然后加上你需要调整权重的词语,接着再加 ,最后加上权重值。比如还是上面的例子,我想突出 Chinese style 但不想调整顺序,就可以改为:
product photography,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting, Chinese Style :: Chinese Style :: 0.5
然后你会发现,好像权重太高了,生成了跟 prompt 无关的图(下方左图),那我们可以在原来的基础上,再加以下 Joan of Arc 的权重(下方右图):
product photography,Joan of Arc, full body, hand painted, plastic, detailed, white background, studio lighting, Chinese Style :: Joan of Arc:: 0.25 style of Chinese:: 0.5
你可以看到,调整参数后,生成的 4 张图有 2 张具备较强的 Chinese 风格:
不过坦率说来,这个方法,并不特别适合这个案例,调整主体内容,或者顺序, ROI 会更高一些,这个方法更适合 miss 掉某个 prompt 词时使用,比如官方的案例是这样的:
several sad cats watch a crying woman in a home-office environment with laptop
生成的图片里(左四张图),猫咪们都看着你(你可能才是 crying woman ),如果用 slider 的功能(右边四张),crying woman 就出现在画面里了:
several sad cats watch a crying woman in a home-office environment with laptop:: several sad cats::0.5 crying woman::0.6 laptop::0.7
另外需要注意,slider 可用的参数有 0.25、0.5、0.6、0.7,也可以用这个方法降低权重,区间是 -0.7、-0.6、-0.5、-0.25:
如果你用了 slider 还是没有出现应该有的画面,那还有一个大招 cowbell,坦率说来,这个并不符合 Midjourney 的官方最佳实践,但的确是个可行的方法,以下面这个 prompt 为例,生成的图片里,woman 看起来并不 shy(左边四张图):
A songbird sits on the shoulder of a shy blonde woman dressed in white.
此时你可以重复重复再重复(我觉得这就是为何这个方法叫 cowbell 的原因):
A songbird sits on the shoulder shoulder shoulder shoulder shoulder shoulder of a shy shy shy shy shy shy shy blonde woman dressed in white.
另一个我比较喜欢的实物是食物,食物讲究的是「色香味俱全」,所以在描述食物类的 prompt 时,可以往这三个方向想想:
Prompt | 解释 | |
---|---|---|
类型是什么? | food photography | 食物照片 |
主体是什么? | steak, medium rare, steaming, light garnishes, sitting on plate | 牛排,五分熟,带蒸汽,仅有一点配菜,放在一个碟子上 |
环境是怎样的? | epic lighting | 为了突出食物,我加了个聚光灯 |
构图是怎样的? | null | 不太重要,就让 AI 自由发挥 |
用什么镜头? | depth of field | 为了突出食物,我加了背景虚化,这是背景虚化的另一种表达(有景深) |
是什么风格? | null | 不太重要,就让 AI 自由发挥 |
参数 | null | 没有加任何参数 |
然后再来一碗红烧牛肉面:
坦诚地跟大家说,我不是设计师,也不是摄影师(而且我非常不擅长摄影),所以我仅能跟大家分享一下基础内容,因为这个对我来说,太多过程性知识了,不实际操作过,根本不知道有什么。
言归正传,摄影中,常用摄影灯光有以下几种:
基于这些灯进行排列组合,你会得到不同使用场景的灯光。灯光的细节种类,可以去我归纳的 Lighting List 里查看,我这里主要分享一些常用和易用的场景灯光:
照片
|
名称 | 介绍 | 适合场景 |
---|---|---|---|
Mood Lighting | 氛围灯。主要是通过在特定的环境中改变灯光的颜色和亮度等参数来创造一种特定的氛围,以营造舒适、浪漫、放松等感觉。从技术实现上看,Mood lighting则着重于灯光的颜色和亮度控制,注重创造强烈的视觉效果。 | Mood lighting通常用于室内设计、酒店、餐厅及居家装饰等领域,旨在创造出一种特定的气氛和体验。 |
| | Moody Lighting | 情绪灯。它更强调在情感表达和为故事情节服务方面的应用,设计的目的是要把灯光与剧情完美结合起来,以展现角色的个性和情感世界。从技术实现上看,Moody lighting通常采用低亮度和大比例遮挡阴影,强调暗部的扫描,以增加画面的纹理和层次感。 | Moody lighting通常用于影视制作、游戏界面、舞台表演等领域,设计的目的是为了增加故事情节的戏剧效果。 |
| | Studio Lighting | 工作室灯光。是一种专门用于摄影工作室、电视和电影等领域的照明设计。它将光源和灯具放置在一个专用的摄影工作室中,通过精细的照明来创造出各种不同的氛围和场景效果,以满足各种不同的拍摄需求。 | Studio lighting 主要应用于商业摄影、时装摄影、艺术摄影、人像摄影、广告拍摄、电影和电视制作等领域,目的是通过精细的照明设计来突出主体的特点,达到最佳的拍摄效果。 |
| | Cove Lighting | 壁角灯。是一种常用的室内照明设计,其灯具通常安装在墙壁或吊顶壁橱之间的壁角(即“壁橱”)中,从而营造出舒适、柔和、光滑的环境照明效果。 | 这种照明技术可以为房间提供均匀的光线,同时提高房间的美感和时尚度。 |
| | Soft Lighting | 柔和照明。是指通过使用柔和、漫射的光线来创造出柔和、温暖的氛围效果。柔和的光线通常是通过使用的漫射灯具来实现的,较为常见的是壁灯、台灯、阅读灯等。 | 柔和照明效果可以降低照度,减轻视觉疲劳,创造出舒适的氛围和感觉。 |
| | Hard Lighting | 硬朗照明。是指通过使用聚光灯、筒灯等灯具来聚焦到一个特定的区域中,其光线是相对集中而直接的。 | 创造出刚硬、明亮的照明效果。硬朗照明常常用于展示场合,如美术馆、商场等环境,以突出展品或商品的特点和质感。 |
| | Volumetric Lighting | 体积光。是一种创造逼真渲染效果的照明效果技术。它通过在某些场景中添加灯光和各种视觉效果,如扩散、雾、粒子、阴影等,在照明场景中模拟空气中的粒子和尘埃微粒的现象,从而创造出动态、逼真、增强立体感和体积感的照明效果。 | 适用于多种场景设计中,如电影、电视、视频游戏、动画等领域。它可以让场景更加逼真、立体,增加场景的紧张度和视觉层次感,并带来更具有表现力的视觉效果。 |
| | Low-Key Lighting | 低键照明。指的是一种特殊的照明效果,该效果通常通过强烈的侧光或背光和阴影来创造高对比度的画面效果。低键照明的特点是明暗分明、阴影浓重、暗调占主导地位,常常构建一种紧张、神秘或黑暗的氛围。 | 低键照明广泛应用于电影、电视、摄影等领域中,常常用来表现悬疑、恐怖、犯罪等要素。 |
| | High-Key Lighting | 高键照明。这种照明效果通过使用明亮、均匀的光线来避免明暗对比并压低阴影的出现。这种照明效果特点是亮度高、细节丰富,适用于需要传递愉悦、轻松和开心氛围的场景和环境。 | 高键照明通常用于广告、情感电影、电视剧等中。 |
| | Epic Light | 史诗光线。是一种创建极富戏剧性、威严感和视觉效果的照明技术,它可以在场景中添加非常亮烈、盛大、壮观的光线,以吸引观众注意力并增加场景的震撼力。 | Epic Light通常用于影视制作、游戏开发、演出等领域中,以营造出一种崇高、壮丽、宏伟的氛围,可以使观众在看到这些效果时,感到非常震撼和难以忘怀。史诗光线的特点是亮度较高、颜色鲜艳,通常用于表现重要的剧情点,如武器的激光、宇宙战争中的太阳和星星、幻想电影和电子游戏中的神秘光芒等。 |
| | Rembrandt Lighting | 伦勃朗特效是一种起源于荷兰画家伦勃朗的照明效果,其主要特点是在人物脸部形成一个菱形的明暗分界线,嘴巴和下巴的一侧用阴影覆盖,人物的另一侧则被亮光照亮。 | 能营造出一种柔和而神秘的效果。 |
| | Contre-Jour | 逆光照明。指的是摄影师将光源放置在被摄物体的背后,令照射效果在镜头前面产生,形成被摄体轮廓明显的负片形态。 | 于光源位置造成的暗摄影整体的虚化,高对比度和鲜明的轮廓线可以带来文艺和抽象的氛围。 |
| | Veiling Flare | 透镜毛玻璃。指当光线从透镜或镜头穿过时,透过玻璃或镜头的反光或散射使得图像出现散射光线或最终成像看起来失真的现象。 | |
| | Crepuscular Rays | 黎明、黄昏光线。也称为太阳光柱,是由日光在云层或尘埃中被反射形成的光线束。因为只有在日出和日落时才有足够的光线穿过云层或照射到恰当的夹角,所以Crepuscular Rays通常只出现在日出和日落时刻。 | Crepuscular Rays通常会在云层上形成明显的束状光线,给人以美丽的感觉。 |
| | Rays of Shimmering Light | 闪烁光线。是指在光线散射和折射时出现的光线折射现象。在某些特定的环境下,光线经过不同密度和温度不同的气氛,会出现一种光线折射、散射的效果,从而形成闪烁光束效果。 | |
| | Godrays | 神光。是一种由光线穿过云朵、树枝或其他障碍物时,形成的亮光条纹效果。Godrays通常在光线较强的时分出现,将光线分割成条纹状,形成一种梦幻般的效果,也被称为 “crepuscular rays” 的一种。 | |
这算是 V5 的新特性,Midjourney 在 V5 版本认识很多名人,你可以在描述主体的时候,加上名人的名字,就可以生成该名人的照片,我们生成几个电影里的经典照片:
第一个是 Keanu Reeves,第二个是 Vito Corleone(我并没有输入主演人 Marlon Brando),两组图的 prompt 都非常简单,你可以尝试自己写一下
本章最后有答案。
做衣服类电商的朋友可能会比较需要这个功能:
坦率说来,我觉得 Midjourney 应该是可以的,但目前的效果还不太好,要想实现这个需求,只需要用到前面介绍的技巧九里提到的 blend 功能,详细方法就不在这赘述了,大致就是我将商品图和人物图用 blend 功能融合了下:
为了验证一致性,我生成了几张 Reeves 的图分别尝试了下,最后输出的结果是这样的:
整体来看,好像还行,但真的用在商品描述图里,我觉得还不太可能,因为里面的衣服跟原图差距还比较大(可以细看里面的纽扣)。
但我觉得未来 Midjourney 可能会优化好这个功能,并且我觉得如果可以自己训练模型,这个功能实现起来应该不难。
这个算是名人照片的分支玩法,最近大家应该看到过很多类似的照片,其实 prompt 很简单,主体和背景大家用翻译软件搞搞就行:
Prompt | 解释 | |
---|---|---|
类型是什么? | photography | 照片 |
主体是什么? | a group of Chinese people gathered around Darth Vader | 一群中国人在围观达斯维达 |
环境是怎样的? | on the street | 大街上 |
构图是怎样的? | null | 不太重要,就让 AI 自由发挥 |
用什么镜头? | fuji film | 为了使得照片更有那味,增加了一个富士电影镜头 |
是什么风格? | style of 1990s | 增加了一个 90s风格 |
用类似的 prompt 生成了两组图片:
上面的老照片场景,我们用了 1990s 风格,严格地说,这个 1990s 更适合放在主体,或者环境里,放在风格里也不是不行,因为不仅仅希望主体是 1990s 还希望图片生成的风格也是 1990s。
这就是最后一种风格词用法:年代。
拿插画那一章的两个 prompt 修改一下,我都没在 prompt 里加艺术家的名字,而是改为 style of 1920s,玫瑰的图有点那味,猫的图右上角那张太逗了。
Reeves 很简单,就是说明主体,然后注明穿着标志性的衣服,走在大雨里:
Keanu Reeves, wearing a black long leather coat, walking down the street in the rain
然后教父的那张就更简单了:
Vito Corleone sitting on a chair
这里的多样性其实是指人的高矮胖瘦,甚至身体的一些特殊性等。
不知道各位有没有发现,大多数用 AI 生成的图片,人物都非常漂亮和英俊,但这并不好,这其实某种程度上代表了社会的偏见。
所以我想在本章重点介绍下,如何让 Midjourney 生成更多样的人体。
方法一:Slider 方法
在上一章,我介绍了增加权重的方法,这个方法还可以帮助你生成不同体型的人物,以下是 Midjourney 官方社区的案例:
Plus-sized ginger female dressed in bohemian vest, maxi skirt, espadrilles, walking across autumn campus courtyard, morning atmosphere:: plus-sized::-0.3 --ar 2:3
你可以控制 plus-sized 后面的参数,从而使画面中的人物变胖或者变瘦。这里需要注意,并不是负数就是越瘦的意思,而是削弱了 plus-sized 权重,如果你的 prompt 词是 thin 你加个负数 slider 参数那就是变胖了:
方法二:直接描述
Midjourney 是知道一些多样性的词语的,比如:
实物和人物介绍完,介绍一下风景。坦率说来,我并不擅长摄影,所以这三章写得可能会不太专业。我更多地是介绍方法,以及告知大家可能性。
如果有不对的地方,请见谅。
风景大片,我觉得大家应该都在各大平台看过了,所以本章不会介绍太多常见的风景制作方法。而是介绍一些少见的,我这里介绍一个比较有趣的类型:
Prompt | 解释 | |
---|---|---|
类型是什么? | Miniature faking | 迷你化仿效果(Miniature faking),也称为玩具世界效果,是一种通过特定的拍摄和处理技术来创造出一种缩小的场景感觉的方法。这种技术可以让实际大小的对象看起来像是一些小的塑料或金属模型。 |
主体是什么? | Train Lines | 火车线路 |
环境是怎样的? | null | 不太重要,就让 AI 自由发挥 |
构图是怎样的? | null | 不太重要,就让 AI 自由发挥 |
用什么镜头? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | style of Japanese | 我想要那种日本火车style,所以加了这个参数 |
另外还制作了一个火星工厂:
Prompt | 解释 | |
---|---|---|
主体是什么? | Mars Factory | 火星工厂 |
另外,我还很喜欢用这个效果制作一些多肉植物的照片,主体只要填写:cute mini Haworthia cymbiformis plant in a pot,或者 cute mini Aloe plant in a pot :
严格说来,这个不算风景,但因为我实在不知道该放哪里,所以还是放到风景这了。
因为我不是建筑相关的从业者,所以我这里只介绍一种用法:对于人造物件,可以在主体里加入由 某某某 制造。以建筑为例,也不需要在 prompt 里加类型:
Prompt | 解释 | |
---|---|---|
类型是什么? | null | 不太重要,就让 AI 自由发挥 |
主体是什么? | Structure by Dame Zaha Mohammad Hadid | 我的母校香港理工大学设计学院大楼的设计师 Dame Zaha Mohammad Hadid |
右边是 Frank Gehry:
如果你对建筑感兴趣,不妨试试两种风格的建筑融合在一起试试,说不定会碰撞出有意思的设计。
前几章节分享了灯光,本章分享下,相机和镜头。
可能有些朋友用过一些手机 App ,它并不像 PS 工具那样,允许你修改图片的白平衡等参数,而是让你体验用旧相机(如胶卷相机)拍照,虽然本质上来说,它也是通过各种参数来模拟当年的相机效果,但的确挺有意思的。
在 Midjourney 里,你也可以通过增加相机或者镜头的名称,从而达到类似的效果。根据我的实验,Midjourney 可以改变以下几类:
我很喜欢双重曝光的效果,以及长曝光:
不过各位使用时,需要根据自己的场景选择合适的相机和镜头,比如无人机视角,都不太适合拍近物:
照片
|
名称 | 介绍 | 适合场景 |
---|---|---|---|
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lS7YOzht-1684376617896)(assets/MJ100.png)] | GoPro | 运动相机视角 | 自拍,或者运动场景 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JK6QescN-1684376617897)(assets/MJ101.jpeg)] | Drone | 无人机视角 | 适合航拍,或者天空景色 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Kh1aQ5En-1684376617897)(assets/MJ124.png)] | polaroid | 宝丽来 | 应该不需要解释了吧 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-X2gKlk0q-1684376617898)(assets/MJ122.png)] | black and white film | 黑白照 | 应该不需要解释了吧 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0RLAQiEi-1684376617898)(assets/MJ123.png)] | Kodachrome | 柯达生产的彩色幻灯片底片品牌 | 具有非常高的颜色鲜艳度、对比度和持久性。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qp5s112m-1684376617899)(assets/MJ097.png)] | shot on 8mm | 电影 8 毫米胶卷是一种便携式、简单易用的胶片,分辨率比较低 | 适用于拍摄家庭和旅游等普通场景 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rAZZngej-1684376617900)(assets/MJ098.png)] | shot on 16mm | 电影 16 毫米胶卷 | 16毫米和35毫米主要用于制作电影、纪录片和商业广告。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BtoEq7Xt-1684376617900)(assets/MJ099.png)] | shot on 35mm | 电影 35 毫米胶卷 | 16毫米和35毫米主要用于制作电影、纪录片和商业广告。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qbK19QQf-1684376617901)(assets/MJ105.png)] | Microscopic | 显微镜 | 适合一些需要放大观察的实物 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hOYLWGsE-1684376617901)(assets/MJ106.png)] | Fisheye Lens | 鱼眼镜头 | 鱼眼镜头可以将整个场景拍摄在一个范围内,这种镜头的视角通常在 100° 至 180° 之间,可以呈现出非常夸张的透视效果。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Hr5Wokmu-1684376617901)(assets/MJ103.png)] | Wide Angle | 广角镜头 | 适合风景照,可以让画面容纳更多内容 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6qO1SYop-1684376617902)(assets/MJ104.jpeg)] | Ultra-Wide Angle | 超广镜头 | 适合风景照,可以让画面容纳更多内容 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-r2WE2zte-1684376617902)(assets/MJ107.png)] | Panorama | 全景 | 适合风景照,可以让画面容纳更多内容 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7hQsX3AL-1684376617903)(assets/MJ109.png)] | Short Exposure | 短曝光 | 通常用于追拍运动员、表演者或动物等,或者是拍摄需要快速决定瞬间捕捉的场景,例如拍摄火车、汽车、快速移动的车辆等。由于短曝光时间的限制,这种方式可以冻结运动物体并防止出现模糊的情况。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Q94jNCNx-1684376617903)(assets/MJ108.png)] | Long Exposure | 长曝光 | 在长曝光的拍摄中,快速移动的物体会出现轨迹,例如流星、车灯、瀑布等,这种方式会给照片创造出愉悦而神秘的氛围。此外,长曝光可以用于拍摄夜晚的大片景象,例如景色、城市夜景、星空等。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7t1OXq1m-1684376617904)(assets/MJ110.png)] | Double Exposure | 双重曝光 | 双重曝光的技术,可以创造出疏密有致和扭曲的、手绘和黑白艺术风格的照片。这种技术在拍摄人像、风景和建筑等领域十分受欢迎,因为它可以创造出独特的环境、浪漫和奇异感觉的图像。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-63pRioXX-1684376617904)(assets/MJ118.png)] | f2.8 | 2.8 光圈 | 在拍摄时,光圈值越大,相应的光线进入相机的量就越大,使得相机所获得的图像更亮。f:2.8 的值是一个比较大的光圈值,因此镜头具有很高的传光能力,适合在低光环境中使用。同时,在大光圈下可以创造出较小的景深效果,突出焦点主题而模糊背景或前景,从而产生轻柔的背景效果,适合拍摄人物肖像或商品照片等类似主题。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QdhIUxQn-1684376617904)(assets/MJ117.png)] | Depth of Field | 景深 | 是指在摄影中,被拍摄的画面中被认为是清晰的范围,也称为焦距深度区域,通常用来描述在照片中被认为是清晰的范围。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0iwbR4rb-1684376617905)(assets/MJ113.png)] | Soft Focus | 柔焦 | 指将相机镜头前加入一层特殊的滤镜,使被拍摄的主体轻微模糊以呈现柔和的美感效果。柔焦的视觉效果相较于深景和浅景来说更强调画面的情感主题,把重点集中在逐渐化解结构感的质感效果上,使它在照片上产生一种有点朦胧的妆容,刻画出一幅浪漫的画面。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MdDIcIFL-1684376617905)(assets/MJ116.png)] | Deep Focus | 深焦 | 将摄像头在一个较大的光圈下设置,保持整个画面都清晰锐利的技术。深景通常需要使用较小的焦距或较远的拍摄距离,以保持整个画面的清晰度,是类似于大景深的一种刻画效果。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bgsz8p9v-1684376617906)(assets/MJ114.png)] | Shallow Focus | 浅焦 | 将相机的光圈调整到一个相对较大的开口,以使摄影师可以根据需要保持相机在平面上的一个特定区域或主体清晰,而照片中的其他区域则变得模糊不清的技术。这种效果常用于摄影肖像,使人物在画面上的清晰度突出,并且画面背景透露轻微的模糊感,带来更具艺术美感的效果。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4HzVjE4h-1684376617906)(assets/MJ111.png)] | Vanishing Point | 消失点 | 消失点指的是位于无穷远处,用于视觉处理的一点。在透视绘画中,我们可以想象一个位于无穷远处的点,使得所有线条都向它聚拢。消失点可以帮助画家或摄影师达到精致的透视处理效果,从而创造出独特的空间感; |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pPYg6EYS-1684376617907)(assets/MJ112.png)] | Vantage Point | 俯瞰视角 | 一般呈现的效果是照片中会有一个点是最高点,然后在此最高点斜上方拍摄 |
刚好,在写这一章的时候,Midjourney 发布了其 Niji 的 V5 版本,所以我以下 prompt 我都会在 —niji 5 的参数下运行。
在 niji 5 模型下,默认生成的内容都会自带 Anime 风格,你可以在 prompt 语句的风格部分中添加国家、年代和创作者,还有一种方法是加动漫风格,根据 Midlibrary 的统计,Midjourney 支持的 Anime Style 超过 120 多种。
我这里就不罗列了,详细的列表可以看我整理的 List 或者直接去 Midlibrary,它们总结的是真的好。
我这里只分享几个我觉得不错,且模型支持得也不错的风格(prompt 主体都是 Statue Of Liberty**)**:
照片
|
名称 | 介绍 |
---|---|---|
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EUR2Mgqa-1684376617907)(assets/MJ128.png)] | Chibi Anime Style | Chibi Anime Style 是指卡通迷你风格。是一种独特的绘画风格,特别受到日本动漫迷和卡通迷的喜爱。该风格的特点是将角色绘制成缩小版的样式,更加可爱和卡通化。在这种风格下,一些角色的头比正常比例大得多,人物的描绘也更加简化,并且动画在绘制时常常用短暂时间的快速动作来传递动态效果。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T8erPz1m-1684376617908)(assets/MJ129.png)] | Gakuen Anime Style | Gakuen Anime Style是指在日本动漫中常见的一种风格,主要呈现校园生活与高中生活的情境。这种风格的作品通常涉及到学生会、文化节、恋爱、友情、竞争等校园主题,角色也往往是年龄在16-18岁之间的学生。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-i4jZMHXC-1684376617909)(assets/MJ130.png)] | Gekiga Anime Style | Gekiga Anime Style是一种比较沉重、严肃的日本漫画风格,常常涉及社会问题、人生哲理等成人主题。这种风格的特点是以黑色、灰色为主色调,图像表现力较强,人物表情和行为也更加真实。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yN8kmUVb-1684376617909)(assets/MJ131.png)] | J Horror Anime Style | J Horror Anime Style是指恐怖题材的日本动漫风格,这种风格的作品常常涉及灵异、鬼怪、妖怪等超自然力量。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aJ1a7c8z-1684376617910)(assets/MJ132.png)] | Jidaimono Anime Style | Jidaimono Anime Style是指日本历史剧题材的动漫风格,通常呈现古代日本的历史背景和文化特征。这种风格的作品往往描绘战争、家族斗争、忍者、武士道、神话传说等元素,以及用具有浓重日本特色的艺术表现手法来传递历史文化的内涵。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vBsiEmUz-1684376617910)(assets/MJ133.png)] | Kawaii Anime Style | Kawaii Anime Style是一种非常可爱和萌的动漫风格,通常呈现出像动物、小孩、角色等可爱的形象。这种风格的作品以颜色鲜明、轮廓粗糙、脸部表情夸张为主要特点。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-R7fyDQu8-1684376617911)(assets/MJ134.jpeg)] | Mecha Anime Style | Mecha Anime Style是以机器人为主题的日本动漫风格,通常呈现出大型机器、机甲战争、铁甲舞者等元素。这种风格的作品常常运用科幻、未来世界设定、大规模战斗等元素,以及动态的战斗场面和机器人设计,塑造出复杂的机器人世界和角色人物关系。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mz3NuHLm-1684376617912)(assets/MJ135.png)] | Realistic Anime Style | Realistic Anime Style是一种真实主义的日本动漫风格,通常呈现出秉持着更加现实和真实的人物形象和情节。这种风格的作品表现力很强,人物形象、环境场景等具有更多的细节,刻画出更为真实的情感世界。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v7TpBKlr-1684376617913)(assets/MJ136.png)] | Semi-Realistic Anime Style | Semi-Realistic Anime Style是在Realistic Anime Style和 Anime Style之间的一个中间状态的风格,风格上比较真实,但是仍带有一定的动漫风格。这种风格的作品通常涉及到带有现实性的情节和人物,但是也常常运用到动漫风格的表现手法。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-u3DtoeHD-1684376617913)(assets/MJ137.png)] | Shoji Anime Style | Shoji Anime Style是按照日本漫画家小学馆长生涯逐步形成的一种风格。这种风格的作品,通常以聚焦单个人物或小团体的故事为主线。其特点是画面明亮,颜色和谐,人物表情和行为搞笑夸张,情节简洁易懂。 |
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rWfFfjqF-1684376617914)(assets/MJ138.png)] | Kemonomimi Anime Style | Kemonomimi Anime Style是一种带有动物耳朵和尾巴等特征的日本动漫风格,通常以人类或近似人类的形象呈现,但却带有不同种类的动物耳朵和尾巴等特征。这种风格的作品与少女漫画(girls’ manga)、少年漫画(boys’ manga)等风格都有一定的关系。 |
这个用到我们之前教的 img2img 功能,你只需要在 prompt 里加入图片 URL,然后加上以下 prompt 即可(为了更像原图,我加了 iw 参数):
panel from manga --iw 2
另一个我加了Naoko Takeuchi(美少女战士的作者),模型还是不善于生成人手:
本章节主要是介绍几个我很喜欢,但不知道如何归类的场景。
不过我写完这一章,我发现他们都很适合变现,比如制作实体货物啥的
不知道有没有人和我一样有喜欢买贴纸贴笔记本电脑的习惯。某宝虽厉害,但我希望的东西比较非主流,有一些无法满足我的需求,所以就想到让 AI 帮我画一些,以下用风暴兵和达斯维达为例,写一组 prompt:
Prompt | 解释 | |
---|---|---|
类型是什么? | sticker | 制作 sticker |
主体是什么? | Stormtrooper, cute | Q 版的风暴兵 |
环境是怎样的? | null | 不太重要,就让 AI 自由发挥 |
构图是怎样的? | null | 不太重要,就让 AI 自由发挥 |
拍摄媒介是什么? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | vector | 考虑到时打印的,所以加了个 vector |
参数 | null | 没有加任何参数 |
生成的结果是这样的,你会发现就是多了一个白边,并且是矢量图风格(我觉得很适合某宝的朋友用):
我非常喜欢那种有层次的剪纸风格(中文应该叫啥呢?我只知道英文叫 layered paper art)但这种要画出来,还挺困难的,于是想着用 AI 试试:
Prompt | 解释 | |
---|---|---|
类型是什么? | layered paper art | 多层剪影 |
主体是什么? | Death Star, shadowbox, volumetric lighting, | 星球大战里的死星,但我不想仅仅单纯地搞一个剪影,我想做一个我常在某宝看到的那种带灯的剪影产品,所以加了个后面两个词,一个是指它是个剪影盒,另一个是带灯 |
环境是怎样的? | null | 不太重要,就让 AI 自由发挥 |
构图是怎样的? | null | 不太重要,就让 AI 自由发挥 |
拍摄媒介是什么? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | null | 不太重要,就让 AI 自由发挥 |
参数 | null | 没有加任何参数 |
用上述的 prompt 生成的结果还挺不错的,但如果你看下图左边 4 张图中的第 3 张,会觉得框里的球很不现实,也不是我想要的那种 2D 堆叠的剪影,第 2 张和第 4 张更像是我想要的,修改一下,加个 diorama(二维平面图)。
voilà~ 加上后效果好很多(右边 4 张),太漂亮了,希望某宝有卖:
不知道各位是否还知道邮票这种东西,2023 年了,我还有集邮的习惯,所以我在想用 AI 生成邮票估计也很有意思,所以就试了下,让 AI 做几张星球大战的复古邮票:
Prompt | 解释 | |
---|---|---|
类型是什么? | vintage postage stamp | 复古邮票 |
主体是什么? | Stormtrooper, red ink, | 继续用风暴兵和达斯维达为例。然后我规定了邮票的颜色是红色 |
环境是怎样的? | null | 不太重要,就让 AI 自由发挥 |
构图是怎样的? | null | 不太重要,就让 AI 自由发挥 |
拍摄媒介是什么? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | line engraving, intaglio | 传统邮票当年工艺是母版印刷,一般是那种线雕、版画风格,所以我这里加了这两个关键词,一个指线雕,一个指版画。 |
参数 | null | 没有加任何参数 |
最后生成的图片,简直就是艺术:
最后介绍一些海报的做法:
Prompt | 解释 | |
---|---|---|
类型是什么? | movie poster | 电影海报 |
主体是什么? | Star War | 星球大战 |
环境是怎样的? | null | 不太重要,就让 AI 自由发挥 |
构图是怎样的? | null | 不太重要,就让 AI 自由发挥 |
拍摄媒介是什么? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | studio ghibli, retro anime | 我想让 AI 搞一个吉卜力工作室复古漫画风的海报 |
参数 | null | 没有加任何参数 |
海报并不仅仅指电影海报,你还可以用它来做广告海报。广告海报则把类型换一下即可。但需要注意,广告海报里需要其他元素来体现「广告」,并不是说加了 advertising 就是广告了。
Prompt | 解释 | |
---|---|---|
类型是什么? | advertising poster | 广告海报 |
主体是什么? | Darth Vader points his finger at the viewer | 达斯维达手指指着观众 |
环境是怎样的? | null | 不太重要,就让 AI 自由发挥 |
构图是怎样的? | null | 不太重要,就让 AI 自由发挥 |
拍摄媒介是什么? | null | 不太重要,就让 AI 自由发挥 |
是什么风格? | studio ghibli, retro anime | 照旧 |
参数 | null | 没有加任何参数 |
最简单的方法,当然就是直接问。
如果问不到,倒是可以借助一些工具,Midjourney 支持图片转 prompt 功能。方法很简单。第一步在输入框输入 /describe:
点击 describe 后,会弹出一个添加文件的入口,上传文件,并点击回车。
Midjourney 就会返回结果,点击图片下方的 1、2、3、4 按钮,可以直接发 prompt 给 bot,让其生成图片,右边是分别用 #1 和 #4 prompt 生成的图片,我觉得用它来探寻原图的构图、主体、风格应该都不错,但不要预期能生成一个完全一样的图:
经过几个专题的学习,我们基本将 text prompt 框架里包含的元素都过了一遍,但大家可能会觉得内容不好记忆,所以本章我会对框架进行总结。
在做总结前,我想先介绍下 Midjourney 官方的框架:
官方的模板很简单,分成四个部分:
其实按照官方模板写,你已经能超过 90% 的初学者,但根据我的实验,我细化了他们的模板的,有以下调整:
我用一个表格总结下这个框架,各位可以根据不同场景有选择地使用。
Prompt 解释 | |
---|---|
类型是什么? | 比如水彩画、插画等等 |
主体是什么? | 描述下图片里的主体是什么,越多细节描述就越好,如果细节没有描述清楚,Midjourney 就会随机画给你。主体一般为两大类:
|
环境是怎样的? | 环境最主要的构成是以下几个:
|
构图是怎样的? | 主体和环境都确认后,就要想想如何构图。比如:
|
拍摄媒介是什么? | 这里有几个关键:
|
是什么风格? | 可以用 4W 记忆:
|
参数 | 这些类似照片的参数设定,比如:
|
这个模板看起来很长,但它跟各位拍照其实很像(只是顺序做了权重优化),各位想想自己的整个拍照的过程,是不是:
参考链接:
https://github.com/thinkingjimmy/Learning-Prompt
https://github.com/wangxuqi/Prompt-Engineering-Guide-Chinese
https://github.com/tonyyuhang/ChatGPT/tree/main
https://github.com/f/awesome-chatgpt-prompts
li>相机型号
这个模板看起来很长,但它跟各位拍照其实很像(只是顺序做了权重优化),各位想想自己的整个拍照的过程,是不是:
参考链接:
https://github.com/thinkingjimmy/Learning-Prompt
https://github.com/wangxuqi/Prompt-Engineering-Guide-Chinese
https://github.com/tonyyuhang/ChatGPT/tree/main
https://github.com/f/awesome-chatgpt-prompts