Skip to content

U-Net

约 303 个字 1 张图片 预计阅读时间 1 分钟

Up-conv: 主要作用是将编码器(Encoder)压缩后的抽象特征,重新放大回原始图像的尺寸

在 PyTorch 中,它的正式名称是 ConvTranspose2d。虽然名字叫“转置卷积”,但它并不是卷积的数学逆运算,而是一种能实现上采样的卷积

它的工作原理如下:

  1. 插值/扩充:在输入特征图的像素之间填充大量的 0(Padding)。
  2. 标准卷积:在扩充后的图上运行一个标准的卷积核。
  3. 结果:由于输入被“撑大”了,卷积后的输出自然也就变大了。

在 UNet 中的关键角色

观察你之前上传的架构图:

左侧(Encoder):通过卷积和池化,网络理解了“图中有一个猫(高层语义)”,但丢失了“猫的胡须在哪(空间细节)”。

底部:特征图尺寸最小,通道数最多(比如 1024)。

右侧(Decoder):Up-conv 开始工作。它负责把 1024 维的特征逐渐放大。

配合 Skip Connection:Up-conv 放大图像后,会立刻与左边传过来的特征图拼接。Up-conv 提供“大致轮廓”,Skip Connection 提供“精准细节”,两者结合才能生成高质量的图像。

Comments