我有一种预感,您一下子看不完这篇内容,您得【收藏】一下,以便下次接着看~~
Midjourney AI绘画中文教程,Midjourney是一款2022年3月面世的AI绘画工具,创始人是David Holz。
只要输入想到的文字,就能通过人工智能产出相对应的图片,耗时只有大约一分钟,这个工具不仅能绘画,还能做海报,UI 设计等等......
如下是完整的教程:
1.Midjourney是什么?
2.在官网如何注册?
3.Discord又是什么?
4.使用Midjourney
├─A.Upscale
├─B.Variation
├─C.re-roll 重新生成
├─D.通过 Midjourney Bot 使用
└─E.保存 & 删除图片
4.Midjourney Prompt 基本结构
├─A.Image Prompts(选填)
├─B.Text Prompt
├─C.Parameter(参数)
├─D.语法
├─E.命令├─F.单词
└─G.参数
5.Midjourney Prompt 常用参数
├─A.Version
├─B.Aspect Ratios
├─C.No
├─D.Chaos
├─E.Stylize
└─F.Niji
6.Midjourney 基础设置
├─A.打开设置
├─B.版本设置
├─C.图像质量设置
├─D.风格设置
├─E.隐私设置
├─F.Remix 设置
└─G.生成速度设置
7.订阅 Midjourney 会员
如何订阅?
先上几张图片效果吧:
图 / Midjourney生成图片的效果
图 / Midjourney生成图片的效果
图 / Midjourney生成图片的效果
图 / Midjourney生成图片的效果
图 / Midjourney生成图片的效果
Midjourney是一款AI制图工具,只要关键字,就能透过AI算法生成相对应的图片,只需要不到一分钟。可以选择不同画家的艺术风格,例如安迪华荷、达芬奇、达利和毕加索等,还能识别特定镜头或摄影术语。
有别于谷歌的 Imagen和OpenAI的DALL.E,Midjourney是第一个快速生成AI制图并开放予大众申请使用的平台。
Midjourney默认偏向于创建具有绘画性、美观性的图像,MidJourney更喜欢用互补的颜色、光影的艺术运用、清晰的细节以及具有令人满意的对称性或透视性的构图来创建图像。
2023年5月15日消息,Midjourney官方中文版已经开启内测。
首先,你需要注册一个 Discord 账号,然后加入 Midjourney 的 Discord 服务器。或者去 Midjourney 的官网点击右下角的 Join the Beta:
图 / 注册账号
Discord 于 2015 年推出,其初衷是为游戏玩家建立社区和聊天的平台。然而,它已经发展成为一个远不止于此的平台,涵盖了不同兴趣的受众,而不仅仅是游戏玩家。简单来说,Discord 是一个消息传递平台,允许用户通过不同的渠道相互通信。它可以被认为是 Slack 的一个不那么正式的版本。通过该平台,用户可以发短信和发送视频消息,以及其他形式的富媒体,例如照片和视频。
用户注册账号,并选择进入到 Midjourney 的服务器后,就能在 Midjourney 的 Discord 的左侧栏,看到 newbies-XXX 的频道,随便点击一个,进入该频道,这个频道就是给免费用户测试使用的:
图 / Discord 公共服务器
然后在输入框里输入 / 然后你能看到输入框上出现一个菜单,一般最顶部就是 /imagine,点击该菜单(如果没有出现该菜单,就输入完 / 后继续输 imagine),就能在 prompt 框里输入图片 prompt 了:
接着你就会看到一个叫 Midjourney 的机器人复述了你的话,在这句话的最后,有一句 Waiting to start,这就意味着你的 prompt ,机器人已经接收到了,正在为你生成图片:
然后过一阵你会看到一张模糊的图,然后段落最后显示 0% 意味着程序正在生成图片:
当你看到图片下方有几个 U1、V1 的按钮,这就意味着图片生成完成了 🎉
生成的四格图,单格图片的分辨率是 512 512(如果你是 V5 版本,则是 1024 1024),如果你想要生成一个更清晰的图片,则可以点击四宫格图片下的 U 按钮,U1 代表左上角第一张图,U2 是右上角,U3 是左下角,U4 是右下角。点击后,你需要等待一会,就会生成高清图。需要注意,V5 版本,U 按钮已经不会影响分辨率了,只是做为一个裁切图片的功能。换句话说就是将第一次生成的四格图,裁成一张。
说完 U 按钮,说下,V 按钮,这个按钮代表 variation ,点击该按钮后,程序会用你选择的那张图片,再生成新的 4 张图,不过这 4 张图的整体会跟你选择的那张图比较像:
最后一个按钮 则是 re-roll 重新生成,点击后程序会按照你的 prompt 重新生成 4 张图片。
因为在公共频道上使用,你发的图片会被频道里的人看到,所以如果你不想让自己的图被大量的人看到,可以使用 Midjourney Bot 的方式。
但需要注意,这种方式并不代表「仅有你可见」,你发的图片仍然会在 Midjourney 的会员 Gallery 上显示,目前仅有 Midjourney 的付费 Pro 会员能设置为隐私模式。
使用 Midjourney Bot 也很简单,跟在 Discord 的单聊比较类似,你只需要在 Midjourney 的 newbies-XXX 频道里找到 Midjourney Bot,然后点击它的头像,在弹出的菜单的下方有个「私信 @Midjourney Bot」的输入框,在这个输入框里,随便输入点内容,然后按回车发送。
然后你就会在你的私信列表里看到这个 Midjourney Bot,使用方法就跟上面介绍的方法一样,无任何差别。
保存图片跟使用很多聊天工具一样,点击图片会看到放到的图片,然后右键点击图片可以选择「图像另存为」并保存图片(如果你用的是 Discord 的客户端,右键样式可能与我不一样,但操作基本是一样的)
如果生成的图片你不喜欢,其实你可以不用管它 。
如果你一定要删,也有一个删除的渠道,但操作跟你日常使用的聊天工具的方式不太一样,在你想要删除的图片消息右上角有个 emoji 按钮(下图标注为 1 的按钮),点击后会 出现一个 emoji 菜单,然后在 emoji 菜单里输入 x (下图标注为 2 的输入框),最后点击 ❌ emoji 即可删除该图片。注意这个删除并不仅仅只是删除聊天信息里的图片,还会将图片从 Midjourney 的会员 Gallery 里删除。
在 Midjourney 的官方介绍文档里,介绍了最简单的 Prompt 结构是这样的:
但我觉得上面那个 Prompt 过于简单了 😂 ,反而 Advanced Prompt 更适合学习:
Prompt 分成三个部分。第一个是 Image,这个属于选填,可以填也可以不填。
先说下这个 Image URL 是干什么用的,有很多玩法,比如将两张图合并为一张,大家可以看看下面这个例子,我就是将一个大理石雕像和花朵的图片上传到 Discord:
然后让 Midjourney blend (混合)一下(后续 blend 章节会介绍更多用法)后,就能生成下面这种图片:
需要注意的是:
如果你不想将图片上传到一些图床服务器,也可以使用 Discord 的图床,你可以私聊 Midjourney Bot 然后通过上传图片的方式,将图片先发到 Discord 上,然后右键复制图片链接,像这样:
这个就是你希望 AI 生成的图片的描述。这个有非常多的技巧,后续会详细介绍。这里我想说下,Midjourney 跟 ChatGPT 有点不一样:
Midjourney 大约有 20 多个参数设置项,我会在下一章介绍几个常用参数。了解完基本参数后,你应该就能用 Midjourney 生成不错的图了。
撰写 Text Prompt 注意事项
Midjourney 跟 ChatGPT 在 prompt 的使用上有很多不一样的地方,本章会详细介绍下 Midjourney 的 text prompt 区别。
首先 Midjourney 基本上是不懂语法的,所以即使你语法错了,只要词对了,也能生成图片。。
另外,不懂语法也导致了另一个问题:prompt 不是越长越好。特别是各种定语从句,它根本就不懂,还不如把指令用逗号隔开,一个个输入。以下是官方推荐的语法建议:
最后, Midjourney 是不会区分大小写的。
• /ask 得到一个问题的答案。
• /blend 轻松地将两个图像混合在一起。
• /daily_theme 切换官方的 #daily-theme 频道更新的通知 ping
• /describe 根据上传的图片生成 4 段文本 Prompt 关键词内容。
• /docs 在 Midjourney 官方服务器中使用,可快速生成一个链接,指向官方用户指南中涵盖的主题。
• /faq 在 Midjourney 官方服务器中使用,将快速生成一个链接,指向热门 Prompt 关键词技巧频道的常见问题解答。
• /fast 切换到 fast 快速生成模式。
• /help 显示有关 Midjourney Bot 机器人的有用基本信息和提示。
• /imagine 使用 prompt 关键词生成图像。
• /info 查看有关你的帐户信息,以及任何排队或正在运行的图像的信息。
• /stealth 对于专业计划订阅用户(Standard 中级和 Pro 高级订阅):切换到隐身模式。(生成图像对他人不可见)
• /public 对于专业计划订阅用户(Standard 中级和 Pro 高级订阅):切换到公开模式。(图像及关键词均可被查看)
• /subscribe 为用户的帐户页面生成个人链接。
• /settings 查看和调整 Midjourney Bot 的设置(模型版本等)。
• /prefer option 创建或管理自定义选项。
• /prefer option list 查看当前的自定义选项。
• /prefer suffix 指定要添加到每个 Prompt 关键词末尾的后缀。
• /show 使用图像 ID 在 Discord 中重新生成图像。
• /relax 切换到 relax 模式。
• /remix 切换到 remix 混音(改稿)模式。
在单词的部分,Midjourney 跟 ChatGPT 有点类似,它对同义词的理解也不是很好。比如举两个例子:
另外,Midjourney 还能用 emoji 代替单词(我觉得本质上 emoji 也是单词),算是一个比较有意思的特性。
与其说不要什么,不如说要什么
这个跟 ChatGPT 类似,你应该将你想要的东西说清楚,而不是告诉 Midjourney 不要什么,如果你想让 Midjourney 不生成某样东西,就需要用到 参数 — no。
你不说,模型就会随机给你
因为图像信息的信息量远超过文字,所以很多时候,Midjourney 会随机填充一些内容给你,它既是缺陷,也是亮点功能。因为当你不在 prompt 里说明这些词时,你就能获得发散的结果。
如果你想减少这些随机性,就需要用到一些 prompt 框架(或者所谓的模板),本教程会由浅入深地将这个框架教给你。
Midjourney 还有一点跟 ChatGPT 有较大差异,它允许你在 prompt 里加入参数,而且这些参数相对来说一致性都比较好,所以如果你想实现的功能,参数里支持,那优先使用参数,而不是在主体里描述。你会在后续的教程中学到如何善用参数。
另外,需要注意,本教程生成的图片默认为 V5 版本,所以我没有在 prompt 里就加 v5 参数。
简单说来,你可以将这些参数理解为官方的固定 prompt 模版,而且这个模板包含了一些特殊字符,让模型能百分百保证输出结果的一致性,并且还能提升 prompt 的准确度和输入效率。
如果你有用过 ChatGPT ,应该会遇到过这种场景,用了别人一样的 prompt 模板,但却没法令 ChatGPT 生成相同的内容。
而 Midjourney 因为是图片类目,相对比较垂直,所以他们将很多图片类的通用 prompt 语句做成了模板,比如图片长宽比,有 1:1、2:3、4:7 等等,如果你要用 ChatGPT 的使用习惯,就需要在 prompt 里不断重复 Aspect Ratios 1:1 等,而且每个人的表达 Aspect Ratios 的方式都不一样,模型还要去理解人说的话,比较麻烦。
所以 Midjourney 就设计了一些参数,让你能快速调用,比如 Aspect Ratio 这个,就只需要输入 — ar 1:1 即可。同时因为固定了表达方式,大家要改长宽比,都会用这种方式表达,Midjourney 调整下模型,就能保证输出的图片的一致性了。
因为其稳定且必须,所以我才会先教各位参数。
目前 Midjourney 支持多个版本,最新的版本是 V5 ,跟 ChatGPT 稍微有点不一样,Midjourney 给我的感觉,并不是版本越大,约厉害,而是擅长的东西不太一样。相关区别请查阅 Midjourney 各版本差异。
Version 参数使用方式见下表。你也可以在设置里,调整默认的版本,相关教程请查阅 Midjourney 基础设置。
调用方法 | 使用案例 | 注意事项 |
---|---|---|
在关键词后加空格,然后带上版本参数:–v 或者 —v–version 或者 —version | vibrant california poppies –v 5 | 版本仅支持 1、2、3、4、5。 |
因为可以在 prompt 里直接加版本参数,同时又可以在设置里设置版本,所以你有可能会遇到如下图这样的情况(我想生成版本 1 的图,但设置里设置了 5 怎么办?):
此时模型会按照从左往右的顺序运行这些参数,按照上面的例子,其实生成的图片是 V1 版本,可以跟下面的这个 V5 版本对比下:
第一个参数是图片的长宽比,使用方式如下,及版本差异如下:
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带上长宽比参数:–ar 或者 —ar–aspect 或者—aspect | vibrant california poppies –ar 5:4 | 默认比例是 1:1。比例数需要是整数,比如 1.3:1 是不行的,但 13:10 可以。长宽比会影响生成图像的形状和构图。当放大图片时,有些长宽比可能会发生轻微的改变。比如 –ar 16:9(1.75) 最终生成的图片可能是 7:4(1.74)。 | ✅ 支持任意比例。但2:1以上的宽高比是实验性的,可能会产生不可预测的结果。 | ✅ 1:2 到 2:1 | ✅ 5:2 到 2:5 | ✅ 1:2 到 2:1 |
另外,长宽比在业界也有最佳实践:
这个参数的意思是不要什么,如果你不想让 AI 生成的图片里出现树,那就输入 plants 即可:
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带上你不想 AI 生成的内容:–no 或者 —no | —no plants | 无 | ✅ | ✅ | ✅ | ✅ |
这个参数跟 ChatGPT 里的 Top P 有点像,主要控制模型的随机性,数字越高,约有可能产生一些意想不到的结果,数字越低一致性会更高。看看官方的例子, prompt 是 watermelon owl hybrid。
这是当 Chaos 为 0 的时候,一致性会比较高,西瓜和猫头鹰的融合的方式,在四次输出里都比较类似,另外在单次输出里,4张图(四宫格)的风格相似度也比较高:
这是 Chaos 为 100 的时候,你会发现多次输出的融合风格都不太一样,且即使是在单次输出里,4 张图的风格区别也比较大。如果你是想让 AI 帮你做一些探索性的事情,我建议初期可以将 Chaos 调高一点,结果会发散一些。
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带数字:–c 或者 —c–chaos 或者—chaos | —c 10 | 可以输入 0 – 100,默认是 0 | ✅ | ✅ | ✅ | ✅ |
这个参数跟 ChatGPT 里的 Temperature 有点像,主要是控制生成图片的风格化程度。简单理解,这个值越低会更符合 prompt 的描述,数值越高艺术性就会越强,但跟 prompt 关联性就会比较弱。
我们一起看下官方的例子,prompt 都是 colorful risograph of a fig。Risograph是一种数字印刷机,它使用模板和专用油墨来制作印刷品。Risograph通常用于制作海报、宣传册等低成本印刷品。这种印刷机可以产生特殊的色彩和纹理效果,头三张图基本上契合 risograph 的风格,但右下角那四张就非常不像了,模型加了很多戏 😂
除了在 prompt 里输入外,你也可以在设置里,调整默认的版本,相关教程请查阅 Midjourney 基础设置。
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带数字:–s 或者 —s–stylize 或者—stylize | —s 50 | 默认是 100 | ✅ | ✅ | ✅ | ✅ |
这个其实 Niji 模型,是 Midjourney 跟 Spellbrush 一起开发的。「niji」是日语「にじ」,意思是「彩虹」 或者 「2D」。
它在生成动漫类的图片上,比较在行。举个例子,prompt 是 fancy peacock,左图是 v5 模型,右图是 niji v5模型,右图更偏向于漫画风格:
使用方法跟 Version 比较像,只需要在文字 prompt 最后输入 —niji 即可
调用方法 | 使用案例 | 注意事项 |
---|---|---|
在关键词后加空格,然后带上版本参数:–niji或者 —niji | vibrant california poppies –niji | 部分参数对 Niji 无效。大家可以在完整列表里查看哪些参数对 Niji 无效。 |
你可以在 Midjourney 的服务器,或者 Midjourney Bot 聊天窗口,输入 /setting,然后按下回车:
接着你就能看到这样的 Bot 消息:
第一二行是版本切换,你可以根据自己的需要切换不同的版本,MJ Version 1-5 分别表示 Midjourney 的不同版本,切换后,输出的所有图,默认都会用该版本生成,各个版本区别请查阅 Midjourney 各版本差异。 2023 年 4 月 5 日,Midjourney 上线了其 Niji 5,所以版本设置截图里会有 Niji 4 和 Niji 5 Mode 按钮,请知悉:
第三行是图像质量设置。注意这个参数并不影响分辨率。它改变的更多的是图片的细节,详细的介绍可以查阅 Midjourney Prompt 高级参数 这一章。
基本上保持默认的就可以了,即图中的 Base quality:
第四行风格设置,风格设置简单理解,这个值越低会更符合 prompt 的描述,数值越高艺术性就会越强,但跟 prompt 关联性就会比较弱。详细的介绍可以查阅 Midjourney Prompt 常用参数 这一章。
这个设置默认是 Public(公开),只有付费的 Pro 用户可以将其设置为 Stealth Mode(隐私),Basic 和 Standard 都没法设置为 Stealth,对 Midjourney 付费感兴趣的可以看看 订阅 Midjourney 会员 这一章。
Remix Mode 目前是一个实验功能,可能会随时更改或删除。
我自己使用下来,有点像 blend(混合)图片模式,使用方法是这样的。首先在 Remix 模式下,点击 Variation 按钮,会弹出一个 Prompt 输入框,输入完后,模型会在不改变第一张图的结构的情况下,增加 Prompt 里提到的内容,比如下面这个例子,第一张图原来是一堆南瓜,点击 Variation 按钮输入 pile of cartoon owls ,就会生成了一张保留原来南瓜图构图,但主体换成了卡通猫头鹰的图。
未完待续~~~