Abstract
Large SAR images usually contain a variety of land-cover types and accordingly complicated change types, which cause great difficulty for accurate change detection. The U-Net is a special fully convolutional neural network that not only can capture multiple features in the image context but also enables precise pixel-by-pixel image classification. Therefore, we explore the U-Net to describe accurately the differences between bi-temporal SAR images for high-precision change detection. However, large scene SAR images often have significantly different statistical distributions for various change types, which prevents the U-Net from working properly. We modified the U-Net by introducing the batch normalization (BN) operation at the input of every neuron to regularize the statistical distributions of its input data for avoiding the risk of gradient disappearance or dispersion during the network training. In addition, the ELU (Exponential Linear Unit) activation function replaces the ReLU (Rectified Linear Unit) function to improve further the gradients backpropagation. Then we selected bi-temporal Sentinel-1SAR data covering Jiangsu Province, China, to discuss quantitatively and qualitatively the detection performance and model complexity of the modified network with different numbers of convolutional kernels.
RÉSUMÉ
Les grandes images SAR contiennent habituellement une variété de types d’occupation du sol et, en conséquence, des changements temporels complexes, ce qui causent de nombreuses difficultés pour une détection précise de ces changements. L’U-Net est un réseau neuronal spécial entièrement convolutif qui non seulement peut capturer plusieurs caractéristiques de la structure de l’image, mais permet également une classification précise de l’image pixel par pixel. Nous avons testé le potentiel de l’U-Net pour décrire avec précision les différences temporelles entre deux images SAR pour une détection des changements de haute précision. Cependant, les grandes images SAR ont souvent des distributions statistiques sensiblement différentes pour des types distincts de changement, ce qui empêche l’U-Net de fonctionner correctement. Nous avons modifié l’U-Net en introduisant la normalization des lots (BN) à l’entrée de chaque neurone pour régulariser les distributions statistiques des données d’entrée afin d’éviter le risque de disparition ou de dispersion des gradients pendant l’entraînement du réseau. En outre, la fonction d’activation de l’ELU (Unité linéaire exponentielle) remplace la fonction ReLU (Unité linéaire rectifiée) afin d’améliorer la rétropropagation des gradients. Ensuite, nous avons sélectionné deux images SAR Sentinel-1 couvrant la province du Jiangsu, en Chine, pour discuter quantitativement et qualitativement de la performance de détection des changements et de la complexité du réseau modifié avec divers nombres de noyaux de convolution.
Acknowledgments
We would like to thank the European Space Agency (ESA) for providing the Sentinel-1 SAR data and the open-source software tool (SNAP) for free download. Besides, we also thank the GeoX Lab Summer School, of Department of Geography Information Science from Central South University, for training our students on the basic skills of deep learning.