DailtedNet

Dilated convolution

image-20220111115104315

在语义分割中使用分类网络作为backbone,之后会将图片进行一系列的下采样。再通过上采样还原回原来的大小。一般分类网络会下采样为原来的32倍。如果下采样倍率太大,对还原回原图有影响。比如vgg,通过最大池化进行下采样,会丢失一些细节信息和小目标,后续无法通过上采样进行还原,会导致语义分割效果不理想。

如果去掉最大池化下采样,特征图对于原图的感受野变小了。

image-20220111190102930

在上图中使用膨胀卷积,会有一些像素用不上。