Image Super-Resolution with Text Prompt Diffusion

Image Super-Resolution with Text Prompt Diffusion (Paper reading)

Zheng Chen, Shanghai Jiao Tong University, arXiv23, Code, Paper

1. 前言

受多模态方法和文本提示图像处理进步的启发，我们将文本提示引入图像SR，以提供退化先验。具体来说，我们首先设计了一个文本图像生成管道，通过文本退化表示和退化模型将文本集成到SR数据集中。文本表示采用基于装箱方法的离散化方式来抽象描述退化。这种表示方法还可以保持语言的灵活性。同时，我们提出了PromptSR来实现文本提示SR。PromptSR采用了扩散模型和预先训练的语言模型（例如T5和CLIP）。我们在生成的文本图像数据集上训练模型。

2. 整体思想

在这里插入图片描述

快速水一篇文章！没什么insight。如上图，这篇文章就是SR3+prompt或者说完全等于Stable Diffuison。数据集就是下面这么构建的：

在这里插入图片描述

好像没有别的要说的了。。。。不如看看这两篇文章1）AutoDIR: Automatic All-in-One Image Restoration with Latent Diffusion；2）CONTROLLING VISION-LANGUAGE MODELS FOR MULTI-TASK IMAGE RESTORATION

3. 实验

在这里插入图片描述

·消融实验，图4在给出[轻微噪声]这个prompt时，不能有效去除噪声，给出错误的[unchange]这个prompt时，会引入伪影。还做了不同文本编码器的影响，我觉得没必要吧。因为你这个text prompt换成1，2，3，4没准也work？

在这里插入图片描述

相关阅读:
数组的常见算法
电脑msvcp140.dll丢失问题的三种解决方法分享，快速修复dll问题
Excel xlsx file:not supported
在gitlab中指定自定义 CI/CD 配置文件
【YOLOv7】使用 YOLOv7 做目标检测 (使用自己的数据集 + 图解超详细)
深度学习batch、batch_size、epoch、iteration以及小样本中episode、support set、query set关系
内存泄漏检测C版小工具
发布一个Visual Studio 2022 插件,可以自动完成构造函数依赖注入代码
【无标题】
绘图和可视化（Python）

原文地址：https://blog.csdn.net/qq_43800752/article/details/134697257