Méthode de détection fine des véhicules spéciaux basée sur un modèle visuel auto-supervisé

Li Xiying ,  

Wu Hao ,  

Pan Huayan ,  

Li Jin ,  

Zhu Yiyang ,  

Hu Weipeng ,  

摘要

Cet article combine les techniques de détection générale et de correspondance avec une bibliothèque de prototypes, et propose un cadre de détection par adaptation de domaine basé sur des représentations visuelles auto-supervisées. Cette méthode utilise les caractéristiques pré-entraînées de DINOv3 pour la correspondance et le filtrage, permettant de localiser et distinguer les véhicules cibles avec peu d’échantillons annotés et sans besoin de réglage fin. D’abord, un module préliminaire d’augmentation de données synthétiques multi-vues a été construit, générant des échantillons multi-angles pour aligner les scènes de surveillance en vue plongeante, comblant ainsi le manque d’angles dans des scénarios inter-domaines. Ensuite, une méthode de clustering inter-classes et de correspondance de prototypes a été conçue : grâce à un algorithme de clustering, la modalité des données est extraite, construisant une bibliothèque de prototypes réels de différentes formes pour résoudre le problème de grandes variations intra-classes ; sur cette base, une représentation conjointe globale et locale est introduite, combinant les détails sémantiques et texturaux des différents niveaux de réseau d’image, pour une discrimination fine des véhicules cibles. Les expériences montrent que cette méthode surmonte efficacement la baisse des capacités de détection due au décalage d’angle de vue en conditions de faible échantillonnage ; par rapport aux méthodes traditionnelles, elle améliore le rappel de détection et réduit significativement les faux positifs causés par les véhicules non ciblés, validant l’efficacité et la robustesse de ce cadre d’adaptation de domaine dans des scénarios de surveillance de véhicules spéciaux.

关键词

véhicules de transport spéciaux;modèle visuel auto-supervisé;détection par adaptation de domaine

阅读全文