码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • AIGC笔记--DDIM的简单实现


    1--DDIM介绍

    原论文:DENOISING DIFFUSION IMPLICIT MODELS

    2--核心代码

    1. # ddim的实现
    2. def compute_alpha(beta, t):
    3. beta = torch.cat([torch.zeros(1).to(beta.device), beta], dim=0) # beta -> [1, beta]
    4. # 先通过cumprod计算累乘结果,即: alpha_(t)_hat = alpha_(t) * alpha_(t-1) * ... * alpha_1 * alpha_0
    5. # 再选取alpha_(t)_hat, 这里用索引t+1来选取
    6. a = (1 - beta).cumprod(dim=0).index_select(0, t + 1).view(-1, 1, 1, 1)
    7. return a
    8. # ddim的实现, 参考: https://github.com/ermongroup/ddim/blob/main/functions/denoising.py
    9. def generalized_steps(x, seq, model, b, **kwargs):
    10. with torch.no_grad():
    11. n = x.size(0) # batchsize
    12. seq_next = [-1] + list(seq[:-1]) # t-skip: [-1, 0, 10, 20, ..., 980], len: 100
    13. x0_preds = []
    14. xs = [x]
    15. for i, j in zip(reversed(seq), reversed(seq_next)): # i = t, j = t-skip
    16. t = (torch.ones(n) * i).to(x.device) # t
    17. next_t = (torch.ones(n) * j).to(x.device) # t-1
    18. at = compute_alpha(b, t.long()) # alpha_(t)_hat
    19. at_next = compute_alpha(b, next_t.long()) # alpha_(t-1)_hat
    20. xt = xs[-1].to('cuda') # 获取当前时间步的样本,即x_t
    21. et = model(xt, t) # 预测噪声
    22. x0_t = (xt - et * (1 - at).sqrt()) / at.sqrt() # 论文公式(12)中的 predicted x0
    23. x0_preds.append(x0_t.to('cpu')) # 记录当前时间步的 predicted x0
    24. c1 = (kwargs.get("eta", 0) * ((1 - at / at_next) * (1 - at_next) / (1 - at)).sqrt()) # 计算公式(12)中的标准差(\sigma)_(t)
    25. c2 = ((1 - at_next) - c1 ** 2).sqrt() # 论文公式(12)中 direction pointing to xt 的系数
    26. xt_next = at_next.sqrt() * x0_t + c1 * torch.randn_like(x) + c2 * et # 根据公式(12)计算x_(t-1)
    27. xs.append(xt_next.to('cpu')) # 记录每一个时间步的x_(t-1)
    28. return xs, x0_preds # 保存了每一个时间步的结果

    3--完整代码

    DDIM_Demo

  • 相关阅读:
    MySQL安装部署
    docker简单介绍 和 常用命令
    小程序容器技术加持下,企业自主打造小程序生态
    设置小数点后2位,随机保存财富txt,生成随机富翁数
    数字营销(一)客户画像浅谈
    Vue-3.5vuex分模块
    对话Severe Tire Damage:世界上第一支在互联网上直播表演的乐队
    mysql 索引选取规则
    口袋参谋:淘宝生意参谋指数,如何一键转换成真实数值?
    整个文档怎么翻译?这些方法亲测实用
  • 原文地址:https://blog.csdn.net/weixin_43863869/article/details/139400172
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号