DailtedNet 发表于 2022-01-16 | 分类于 深度学习知识 Dilated convolution 在语义分割中使用分类网络作为backbone,之后会将图片进行一系列的下采样。再通过上采样还原回原来的大小。一般分类网络会下采样为原来的32倍。如果下采样倍率太大,对还原回原图有影响。比如vgg,通过最大池化进行下采样,会丢失一些细节信息和小目标,后续无法通过上采样进行还原,会导致语义分割效果不理想。 如果去掉最大池化下采样,特征图对于原图的感受野变小了。 在上图中使用膨胀卷积,会有一些像素用不上。