On the Evaluation of CNN Models in Remote-Sensing Scene Classification Domain

  • PDF / 6,409,799 Bytes
  • 16 Pages / 595.276 x 790.866 pts Page_size
  • 101 Downloads / 195 Views

DOWNLOAD

REPORT


DGPF

ORIGINAL ARTICLE

On the Evaluation of CNN Models in Remote‑Sensing Scene Classification Domain Ozlem Sen1   · Hacer Yalim Keles1 Received: 2 February 2020 / Accepted: 24 September 2020 © Deutsche Gesellschaft für Photogrammetrie, Fernerkundung und Geoinformation (DGPF) e.V. 2020

Abstract Land-cover and land-use classification from aerial images is a challenging problem due to high intra-class diversity and inter-class similarities of the images. To analyze the performances of deep convolutional neural network (CNN) models in this domain, we provide three pre-trained CNN models that are adapted to NWPU-RESISC45 dataset using three different training splits, i.e., 80%, 20%, and 10% ratios. The architectures of all three models are redesigned to be modest in size and their structure is kept simple, yet when tested with the NWPU-RESISC45 dataset, all three models perform comparably to the state-of-the-art models. Each of these models is then used to classify the scenes taken from five well-known datasets in this domain without any fine-tuning. We aim to assess the generalization capabilities of these models on the selected datasets. For better analysis, we considered using top-3 and top-5 accuracies of the models in addition to the best predicted category (top-1) that is usually reported by the models. This way of interpretation is very suitable in this domain, since the datasets contain a high number of fine grained categories with large semantic overlaps. We empirically show that the proposed CNN models actually learn the relevant semantic features in the aerial images better than we observed via standard measures. To the best of our knowledge, this is the first work in this domain that analyzes and presents model generalization performances the way we presented it here. Keywords  Deep learning · Convolutional neural network (CNN) · Land-cover classification · Land-use classification · Remote-sensing scene recognition · Transfer learning Zusammenfassung Bewertung von CNN-Modellen bezüglich ihrer Eignung zur Klassifizierung von Fernerkundungs-Szenen. Die Klassifizierung der Landbedeckung und Landnutzung anhand von Luftbildern ist aufgrund der großen Vielfalt innerhalb der Klassen und der klassenübergreifenden Ähnlichkeiten eine anspruchsvolle Aufgabe. Zur Untersuchung der Eignung von CNN-Modellen (Deep Convolutional Neural Network) für diese Aufgabe haben wir drei vortrainierte CNN-Modelle erstellt, die an den NWPU-RESISC45-Datensatz angepasst wurden, und testen dann mit drei verschiedenen Anteilen von Trainingsdaten, nämlich 80%, 20% und 10%. Die Architekturen aller drei CNN-Modelle wurden in Größe und Struktur so angepasst, dass die Verarbeitung des NWPU-RESISC45-Datensatzes keine Probleme bereitete. Jedes dieser CNN-Modelle wurde dann verwendet, um Szenen aus fünf bekannten Datensätzen zu klassifizieren. Dabei wurde bewusst auf ein „Fine-Tuning“ der Klassifizierung verzichtet, denn wir verfolgten das Ziel, die Verallgemeinerungsfähigkeiten dieser CNN-Modelle anhand der ausgewählten Datensätze zu bewerten. Z