• Midjourney v6 快速入门指南


    Midjourney V6快速入门教程来了,这是Midjourney的AI图像生成器的又一次令人印象深刻的升级。最显著的是,V6在逼真渲染和图像中的文字功能方面取得了重大进展。

    在这篇文章中,我们将探讨如何开始使用Midjourney V6,并提供一些示例提示来测试这些新功能。你还可以在互联网上找到更多Midjourney V6的提示词示例

    Midjourney V6概述

    Midjourney V6经过9个月的开发,凭借增强的真实感、更连贯的提示响应以及期待已久的图像内文字功能脱颖而出。虽然这个图像内文字功能还不完美,但根据我的经验,它在处理一两个字时效果很好。

    Midjourney V6的关键特点
    • 增强的真实感:V6提供了更详细和逼真的图像,将AI艺术的逼真度推向新的高度。
    • 改进的提示连贯性:模型现在能够更准确地遵循提示,并可以处理更长、更复杂的输入。
    • 图像内文字功能:用户现在可以在图像中包含可读的文字,增加了新的创意和功能层次。
    • 高级放大功能:改进的放大选项,包括微妙和创意模式,增强了生成图像的分辨率。

    如何使用Midjourney V6

    你需要在Midjourney的Discord服务器上启用它,现在是默认v6版本的。或者国内用户访问GPT.Biz即可直接使用。

    Midjourney V6提示

    与以前的版本相比,Midjourney V6的提示方式发生了显著变化。以下是需要注意的关键变化:

    1. 对提示的敏感度提高:Midjourney V6对提示的具体措辞更加敏感。这意味着你需要更加明确,避免使用诸如“获奖”、“逼真”或分辨率规格如“4k”、“8k”之类的模糊术语。
    2. 提示风格和长度:V6允许更准确地遵循提示,并且可以处理更长的提示。但需要注意的是,使用长提示并不自动保证更好或更详细的结果。像其他AI模型一样,Midjourney只能解释一定数量的令牌,因此通常最好将提示保持简洁,关注主要概念。
    3. 详细和描述性的提示:与以前更注重关键词的方法不同,V6在处理详细、描述性的提示时效果很好。
    4. 图像内文字生成:为了生成文字,你可以使用引号来指导图像内的文字生成。
    5. 造型和美学的调整:最后,为了获得更具照片感和较少主观色彩的结果,建议用户默认使用--style raw。较低的--stylize值可能提供更好的提示理解,而较高的值则可以增强美学效果。

    总之,Midjourney V6在提示方面更倾向于精确和详细的方法,关注明确的描述,避免使用不具描述性的术语。

    Midjourney V6图像内文字

    如果你以前尝试过带文字的AI生成图像,你会知道大多数时候你得到的都是乱码……

    虽然V6还远未完美,但比V5.2有了很大改进。根据我的经验,它在处理像"Welcome", "Hello"等常见词汇时表现不错,但对于像“GPT.Biz”这样的未训练词汇则经常失败,需要多修改几次,需要注意的是,目前还不支持中文。

    使用图像内文字的技巧
    1. 引号:将你的文字用引号括起来以保持清晰。
    2. 样式选项:使用"--style raw"命令或较低的--stylize值以更好地融合文字。

    图像内文字的示例提示

    Prompt:A cozy café's chalkboard menu, with "Coffee" artistically written at the top --ar 16:9 --v 6.0 --style raw --stylize 75

    提示词:一个舒适咖啡馆的黑板菜单,顶部艺术性地写着“Coffee”--ar 16:9 --v 6.0 --style raw --stylize 75

    Prompt:A close-up of a dew-covered leaf, with the word "Nature" formed by the dew drops --ar 16:9 --v 6.0 --style raw --stylize 80

    提示词:一片被露水覆盖的叶子的特写,露珠形成了“Nature”一词 --ar 16:9 --v 6.0 --style raw --stylize 80

    Prompt:The words "Hello, World" displayed on a futuristic computer screen with a holographic interface --ar 16:9 --v 6.0 --style raw

    提示词:带有全息界面的未来主义计算机屏幕上显示的“Hello, World”字样 --ar 16:9 --v 6.0 --style raw

    Prompt:A sleek, modern logo featuring stylized text " GPT.Biz" in bold, futuristic font, with a subtle AI circuit pattern in the background --ar 16:9 --style raw --v 6

    提示词:一个时尚、现代的标志,以粗体、未来主义的字体写着风格化的文字“GPT.biz”,背景中有一个微妙的 AI 电路图案 --ar 16:9 --style raw --v 6

    还不错,尽管需要几次尝试才能得到正确的字母……但还是在正确的轨道上。

    Midjourney V6 写实主义

    Midjourney已经是最逼真的图像生成器之一,因此有时很难注意到输出结果的差异……但整体效果还是非常令人印象深刻的。

    1. 在Midjourney V6中,--style参数,特别是--style raw,用于指导AI生成更逼真且较少风格化的图像。
    2. --stylize参数,范围从0到1000,通过控制艺术解释的程度来补充这一点。
    3. 较低的--stylize值会生成更符合提示字面细节的图像,适合逼真的描绘。较高的值则会为艺术作品注入更多的创意和抽象元素。

    prompt:Albert Einstein in his study, a look of deep concentration, papers with mathematical formulas scattered around, his signature hair slightly disheveled --ar 16:9 --v 6.0

    提示词:爱因斯坦在他的书房里,深思熟虑的表情,桌上散布着数学公式,标志性的头发略显凌乱--ar 16:9 --v 6.0

    prompt:Ada Lovelace at a Victorian desk, early mechanical computing designs spread out, holding a quill, thoughtful expression --style raw --stylize 70 --ar 16:9 --v 6.0

    提示词:艾达·洛夫莱斯在维多利亚风格的桌子旁,早期机械计算设计散落在桌上,手持羽毛笔,神情专注--style raw --stylize 70 --ar 16:9 --v 6.0

    prompt:An undercover agent in Neo-Tokyo, smart-glass eyewear catching neon reflections, blending with tech-savvy passersby --ar 16:9 --style raw --v 6.0

    提示词:新东京的卧底特工,智能眼镜反射出霓虹灯,与科技感十足的路人融为一体--ar 16:9 --style raw --v 6.0

    prompt:A robotics engineer fine-tuning a humanoid robot, the lab filled with robotic parts and tools, a look of concentration on the engineer's face --style raw --ar 16:9 --v 6.0

    提示词:一个机器人工程师正在微调人形机器人,实验室里充满了机器人部件和工具,工程师脸上带着专注的表情--style raw --ar 16:9 --v 6.0

    多重提示

    Midjourney机器人可以使用::作为分隔符来混合多个概念。使用多重提示可以为提示中的概念分配相对重要性,帮助你控制它们如何混合在一起。

    多提示基础知识

    :: 在提示中添加双冒号会向 Midjourney Bot 表示,它应该单独考虑提示的每个部分。对于提示, space ship 这两个词被放在一起考虑,Midjourney Bot 会生成科幻宇宙飞船的图像。如果将提示分成两部分, space:: ship 则将两个概念分开考虑,然后混合在一起,创建一艘穿越太空的帆船。(注意双冒号之间没有空格)

    提示权重

    当使用双冒号 :: 将提示分隔为不同的部分时,可以在双冒号后立即添加一个数字,以分配提示的该部分的相对重要性。(只接受整数1,2,3作为权重,默认为1)

    在下面的示例中,提示词astronauts::3的重要性是最高的,从而生成以其他为支撑元素的图像。以此递减

    Prompt:space::2 exploration::1 with astronauts::3 on a distant planet::2 --ar 16:9 --style raw --v 6.0

    提示词:空间::2 探索::1 和宇航员::3 在一个遥远的星球::2 --ar 16:9 --style raw --v 6.0

    简洁有力。

    总结

    在我看来,Midjourney V6 仍然是排名第一的图像生成器,DALLE 3 紧随其后。以下是关键的总结:

    1.  增强的真实感:具有先进逼真度的逼真图像。
    2.  改进的提示:对更长、更复杂输入的更准确响应。
    3.  图像内文字:能够在图像中包含可读的文字。
    4.  高级放大:具有创意模式的更高分辨率。

    除了V6显然令人印象深刻的结果之外,更令人印象深刻的是,据报道Midjourney正走向2亿美元的年收入和100亿美元的估值,且完全没有外部资金。

  • 相关阅读:
    C++ | Leetcode C++题解之第50题Pow(x,n)
    keras-gpu安装
    了解汽车ecu组成
    【C++】 —— string的使用
    NC2 重排链表
    Qt10-19
    git学习(一)
    Metasequoia 4 水杉3D建模工具 附序列号
    哪种IP更适合你的数据抓取需求?
    【佳学基因检测】Node.js中如何读取并调用内容
  • 原文地址:https://blog.csdn.net/Go__July/article/details/139772856