目录
1 Unet
1.1整体结构
2 VAE
3 CLIP
绘制软件:ProcessOn,以下图片保存可高清查看
需要注意的点
1, ResnetBlock2D的输入有两个,一个是来自上一层的lattent,另一个来自时间步编码模块的输出time_embeds ( shape=[2, 1280], 后面省略说明,默认[2, 1280]这种写法是tersor的形状)
2, Conv3x3和Linear的输入输出Channel,不同层会不一样
3, 输入输出通道数不一致的时候,残差连接会用一个1x1的卷积
京公网安备 11010502049817号