码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 8月28日计算机视觉理论学习笔记——图像生成


    文章目录

    • 前言
    • 一、判别式模型与生成式模型
      • 1、判别式模型
      • 2、生成式模型
    • 二、VAE 自编码机
    • 三、GAN
      • 1、CGAN
      • 2、Wasserstein GAN
      • 3、Super-Resolution GAN


    前言

    本文为8月28日计算机视觉理论学习笔记——图像生成,分为三个章节:

    • 判别式模型与生成式模型;
    • VAE 自编码机;
    • GAN。

    一、判别式模型与生成式模型

    1、判别式模型

    已知观察变量 X X X 和隐含变量 z z z,对 p ( z ∣ X ) p(z|X) p(z∣X),根据输入的观察变量 x x x 得到隐含变量 z z z 出现的可能性。

    2、生成式模型

    对 p ( X ∣ z ) p(X|z) p(X∣z) 建模,输入是隐含变量,输出是观察变量的概率。

    • 模型目标:
      • 训练数据集的模型: x ∼ p t r a i n ( x ) x\sim p_{train}(x) x∼ptrain​(x);
      • 生成样本的模型: x ∼ p m o d e l ( x ) x\sim p_{model}(x) x∼pmodel​(x);
      • 令 p m o d e l ( x ) = p t r a i n ( x ) p_{model}(x) = p_{train}(x) pmodel​(x)=ptrain​(x).

    1


    二、VAE 自编码机

    2
    如图所示,左侧把原始图像卷积成向量;解卷积层则把这些向量解码回原始图像。

    • 误差包括:
      • 生成误差:衡量网络重构图像精确度的均方误差;
      • 潜在误差:衡量潜在变量在单位高斯分布上的契合程度;
      • 总的目标函数:
        L ( x , x ^ ) + ∑ j   K L ( q j ( z ∣ x ) ∣ ∣ p ( z ) ) \mathcal{L} (x, \hat{x}) + \sum_{j}\ KL(q_j (z|x)||p(z)) L(x,x^)+j∑​ KL(qj​(z∣x)∣∣p(z))

    三、GAN

    3

    • Generator: 生成样本数据。

      • 输入:高斯白噪声向量 z;
      • 输出:样本数据向量 x。
    • Discriminator: 检测样本数据真假。

      • 输入:真实或生成的样本数据;
      • 输出:真/假标签。

    1、CGAN

    4

    实现方式:

    • 在 G 的输入在 z 的基础上连接一个输入 y;
    • 然后在 D 的输入 x 基础上也连接一个 y。

    2、Wasserstein GAN

    相比原始 GAN 改进了:

    1. D 最后一层去掉 sigmoid;
    2. Loss 不取 log;
    3. 每次更新 D 的参数后,把它们的绝对值截断到不超过一个固定常数 c;
    4. RMSProp / SGD。

    3、Super-Resolution GAN

    • Generator: 应用分布相同的 B 残差块,每个残差块有两个卷积层。
      • 卷积层后加上 Batch-Normalization,用 PReLu 作为激活函数;
      • 卷积核 3×3,64 个feature maps;
      • 跃层连接。

    5

    • Discriminator: 由连续的卷积块组成,包括:卷积层、Leaky ReLU层和 BN 层。
      • 卷积核 3×3;
      • 最后是两个 dense 层,通过 sigmoid 鉴别判断。

    6


  • 相关阅读:
    前端开发新趋势:Web3、区块链与虚拟现实
    wsl安装gpu版mindspore(二)
    Java继承中成员方法的访问特点
    less学习笔记
    2-Java进阶知识总结-8-反射-动态代理
    python经典百题之八进制转十进制
    学习Linux难么?要怎么学?
    [操作系统笔记]处理机调度
    微信小程序(3)- 小程序样式和组件
    Hadoop在启动yarn时报错:Cannot set priority of resourcemanager process xxxxx
  • 原文地址:https://blog.csdn.net/Ashen_0nee/article/details/126568558
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号