码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Stable Diffusion stable-diffusion-webui ControlNet Lora


    Stable Diffusion

    Stable Diffusion用来文字生成图片,ControlNet就是用来控制构图的,LoRA就是用来控制风格的 。

    stable-diffusion-webui

    国内加速官网:

    mirrors / AUTOMATIC1111 / stable-diffusion-webui · GitCode

    安装参考:

    Stable Diffusion安装与常见错误(+Lora使用)2023年最新安装教程_cycyc123的博客-CSDN博客

    ComfyUI

    保姆级教程:从0到1搭建Stable Diffusion XL完整工作流进行AI绘画_WeThinkIn的博客-CSDN博客

    StableDiffusion模型资源探索食用指南 - 知乎

    大模型

    大模型特指标准的latent-diffusion模型。拥有完整的TextEncoder、U-Net、VAE。

    由于想要训练一个大模型非常困难,需要极高的显卡算力,所以绝大多数人不会训练大模型。

    CKPT

    经过训练的图片合集,被称作模型,也就是chekpoint

    CKPT的全称为CheckPoint(检查点),完整模型的常见格式,模型体积较大,一般真人版的单个模型的大小在7GB左右,动漫版的在2-5个G之间。

    早期的CKPT后缀名是ckpt,如今新的CKPT后缀名都是safetensors

    VAE

    全称:VAE全称Variational autoencoder。变分自编码器,负责将潜空间的数据转换为正常图像。

    后缀格式:后缀一般为.pt格式。

    Lora

    是一种体积较小的绘画模型,是对大模型的微调。与每次作画只能选择一个大模型不同,lora模型可以在已选择大模型的基础上添加一个甚至多个。一般体积在几十到几百兆左右。

    Lora的后缀名也是safetensors,对于小白来说,容易和ckpt造成误解,所以讲一下如何安装。

    CKPT和lora的安装

    对于绝大部分用户来说,主要用得到的模型文件就两种,一种是CKPT,一种是lora。

    最好的模型下载网站,是传说中的C站,http://civitai.com(需科学上网)。

    CKPT的安装路径是models\stable-diffusion 拷贝过来即可使用(只需刷新,无需重启服务)。

    ./stable-diffusion-webui/models/Stable-diffusion

    Loar的安装路径容易搞错,Stable Diffusion的安装目录下默认有个models\lora ,但很多教程都提醒并非这个lora目录,

    .stable-diffusion-webui/models/Lora

    而是另一个:extensions\sd-webui-additional-networks\models\lora

    然而事实上,默认解压缩好的Stable Diffusion是没有后面这个路径的,也不要手工创建,需要在Stable Diffusion的网页界面进行如下操作。

    AI学习笔记|让数字生命更真实:模型(chekpoint)和微调模型(lora) - 知乎

    Stable Diffusion XL

    参考

    深入浅出完整解析Stable Diffusion XL(SDXL)核心基础知识 - 知乎

    上表是Stable Diffusion XL与之前的Stable Diffusion系列的对比,从中可以看出,Stable DiffusionV1.4/1.5的U-Net参数量只有860M,就算是Stable DiffusionV2.0/2.1,其参数量也不过865M。但等到Stable Diffusion XL,U-Net模型(Base部分)参数量就增加到2.6B,参数量增加幅度达到了3倍左右。

    目前能够加载Stable Diffusion XL模型并进行图像生成的框架有四种:

    1. ComfyUI框架

    2. SD.Next框架

    3. Stable Diffusion WebUI框架

    4. diffusers框架

    ControlNet

    ControlNet是一种通过添加额外条件来控制扩散模型的神经网络结构。它提供了一种增强稳定扩散的方法,在文本到图像生成过程中使用条件输入,如涂鸦、边缘映射、分割映射、pose关键点等。可以让生成的图像将更接近输入图像,这比传统的图像到图像生成方法有了很大的改进。

    ControlNet 模型可以在使用小数据集进行训练。然后整合任何预训练的稳定扩散模型来增强模型,来达到微调的目的。

    • ControNet 的初始版本带有以下预训练权重。‍‍
    • Canny edge — 黑色背景上带有白色边缘的单色图像。
    • Depth/Shallow areas — 灰度图像,黑色代表深区域,白色代表浅区域。
    • Normal map — 法线贴图图像。
    • Semantic segmentation map——ADE20K 的分割图像。
    • HED edge  — 黑色背景上带有白色软边缘的单色图像。
    • Scribbles — 黑色背景上带有白色轮廓的手绘单色涂鸦图像。
    • OpenPose (姿势关键点)— OpenPose 骨骼图像。
    • M-LSD  — 仅由黑色背景上的白色直线组成的单色图像。

    参考

    使用ControlNet 控制 Stable Diffusion-腾讯云开发者社区-腾讯云

    ControlNet精准控制AI绘画教程 - 掘金

    ControlNet详细入门介绍 - 知乎

    资源

    https://lexica.art/

    lexica.art 该网站拥有数百万Stable Diffusion案例的文字描述和图片,可以为大家提供足够的创作灵感。可以提供promt灵感

    https://civitai.com/

    Civitai是一个聚集AI绘图爱好者的社区,在此网站上有许多定制化的模型,特别是对于3D、现实、人物和不同画风进行了有针对性的训练。因此,当您使用特定的模型生成特定主题的图像时,表现力会极大加强。

    Hugging Face – The AI community building the future.

    HuggingFace是一个专注于构建、训练和部署最新模型的网站,这些模型由开发者个人完成训练并部署到专门的网站。

    HuggingFace 是为 Stable Diffusion 构建 AI 模型的创作者的首选平台。截止目前平台上有上百个与 Stable Diffusion 相关的模型。

  • 相关阅读:
    Java 前后端分离,流程审批,权限管理框架源码
    xsslabs第七关
    搭建一个自己的AI学术语音助手(一)
    智慧工地管理云平台源码,Spring Cloud +Vue+UniApp
    SpringBoot获取运行环境 获取静态配置 SpringBoot获取配置文件和属性值 springboot获取配置文件
    阿里云C++二面面经
    写python用GitHub-Copilot编程提效 - pycharm
    刘二大人 PyTorch深度学习实践 笔记 P6 逻辑斯蒂回归
    ESP8266-Arduino编程实例-DHT11传感器数据储存到SD卡
    配电室电力监控系统:实时掌握电力运行状况
  • 原文地址:https://blog.csdn.net/linzhiji/article/details/132691581
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号