XWHEEL – Datensatz zur Fahrzeugdetektion auf Luftbildern für den globalen Süden

Die automatische Fahrzeugerkennung aus Luftbildern ist für verschiedene Anwendungen wie Verkehrsmanagement, Parküberwachung, Stadtplanung und Emissionsberechnung von Interesse. Derzeit basieren die meisten Datensätze, die für Algorithmen zur Fahrzeugerkennung zur Verfügung stehen, auf Aufnahmen des globalen Nordens. Dies hat zur Folge, dass bestehende Algorithmen an die Bedingungen des Nordens angepasst sind und im globalen Süden aufgrund der Unterschiede, beispielsweise bzgl. der Gesamtzahl und der Fahrzeugtypen, nur bedingt einsetzbar sind. 

Wir stellen den XWHEEL-Datensatz vor, der auf annotierten Fahrzeugen in sechs Klassen auf Luftbildern basiert. Die Klassen richten sich nach der Anzahl der Räder, der Größe und der Motorisierung der Fahrzeuge. Der Datensatz besteht aus 73 annotierten Luftbildern der Stadt Dar es Salaam (Tansania) mit 15.973 Fahrzeugen und einer GSD von 7cm. Um die Leistung unseres Modells zu bewerten, teilen wir die 73 Bilder in drei getrennte Sätze auf: den Trainingssatz, der aus 39 Bildern besteht, den Validierungssatz, der aus 17 Bildern besteht, und den Testsatz, der ebenfalls aus 17 Bildern besteht.

In diesem Datensatz klassifizieren wir die Fahrzeuge zunächst anhand der Anzahl der Räder in drei Typen: Fahrräder (2w), dreirädrige Fahrzeuge (3w) und vierrädrige Fahrzeuge (4w). Darüber hinaus berücksichtigen wir weitere Attribute wie Größe (groß oder klein) für 4w und Motorisierung (motorisiert oder nicht motorisiert) für 2w and 3w. Wir berücksichtigen auch Attribute, die das Aussehen der Fahrzeuge widerspiegeln, wie "verdeckt" (occluded), "schwierig" (difficult) und "unsicher" (unsure).

Wir schlagen vor, die nicht-motorisierten 2w (Fahrräder) mit den motorisierten 2w zusammenzulegen, da selbst die Annotatoren oft unsicher waren und die Fahrradklasse insgesamt sehr selten ist. Da der Datensatz zur Berechnung von Emissionen aus dem informellen Verkehr erstellt wurde, lag der Schwerpunkt auf 3w. Wir haben jedoch festgestellt, dass es in unserem Datensatz nicht genügend nicht-motorisierte 3w gab, um den Detektor zu trainieren, und schlagen vor, diese Klasse vorerst zu vernachlässigen.

Links