U-Net
约 303 个字 1 张图片 预计阅读时间 1 分钟

Up-conv: 主要作用是将编码器(Encoder)压缩后的抽象特征,重新放大回原始图像的尺寸
在 PyTorch 中,它的正式名称是 ConvTranspose2d。虽然名字叫“转置卷积”,但它并不是卷积的数学逆运算,而是一种能实现上采样的卷积。
它的工作原理如下:
- 插值/扩充:在输入特征图的像素之间填充大量的 0(Padding)。
- 标准卷积:在扩充后的图上运行一个标准的卷积核。
- 结果:由于输入被“撑大”了,卷积后的输出自然也就变大了。
在 UNet 中的关键角色
观察你之前上传的架构图:
左侧(Encoder):通过卷积和池化,网络理解了“图中有一个猫(高层语义)”,但丢失了“猫的胡须在哪(空间细节)”。
底部:特征图尺寸最小,通道数最多(比如 1024)。
右侧(Decoder):Up-conv 开始工作。它负责把 1024 维的特征逐渐放大。
配合 Skip Connection:Up-conv 放大图像后,会立刻与左边传过来的特征图拼接。Up-conv 提供“大致轮廓”,Skip Connection 提供“精准细节”,两者结合才能生成高质量的图像。