Feinkörniges Erkennungsverfahren für Spezialfahrzeuge basierend auf selbstüberwachtem visuellem Modell

Li Xiying ,  

Wu Hao ,  

Pan Huayan ,  

Li Jin ,  

Zhu Yiyang ,  

Hu Weipeng ,  

摘要

Dieser Artikel kombiniert allgemeine Erkennungstechniken mit Prototypenbibliotheksabgleich und schlägt einen Domänenanpassungs-Erkennungsrahmen basierend auf selbstüberwachten visuellen Darstellungen vor. Die Methode nutzt vortrainierte Merkmale von DINOv3 für Abgleich und Filterung, um Zielfahrzeuge bei wenigen annotierten Proben und ohne Feinabstimmung zu lokalisieren und zu unterscheiden. Zunächst wurde ein mehrperspektivisches synthetisches Datenaugmentierungs-Vormodul entwickelt, das mehrwinkelige Proben generiert, um Überwachungsszenen aus der Vogelperspektive anzugleichen und fehlende Blickwinkel domänenübergreifend auszugleichen. Anschließend wurde eine zwischen Klassen clusternde und prototypenvergleichende Methode entworfen, die durch Clustering-Algorithmen Datenmodalitäten extrahiert und eine echte Prototypbibliothek mit verschiedenen Formen aufbaut, um große innerklassige Unterschiede zu lösen; darauf aufbauend wurde eine globale und lokale gemeinsame Darstellung eingeführt, kombiniert semantische und texturale Details aus verschiedenen Netzwerkschichten des Bildes, um eine feinkörnige Unterscheidung der Zielfahrzeuge zu erreichen. Experimente zeigen, dass diese Methode effektiv die durch Blickwinkelverschiebung verursachte Leistungsminderung unter Wenig-Probendatenbedingungen überwindet; im Vergleich zu traditionellen Methoden verbessert sie die Erkennungsrückrufrate und reduziert deutlich Fehlalarme durch nicht zielgerichtete Fahrzeuge, was die Effektivität und Robustheit dieses Domänenanpassungsrahmens in Überwachungsszenarien für Spezialfahrzeuge bestätigt.

关键词

Spezialtransportfahrzeuge;selbstüberwachtes visuelles Modell;Domänenanpassungs-Erkennung

阅读全文