Este artículo combina técnicas de detección general y emparejamiento con una biblioteca de prototipos, proponiendo un marco de detección con adaptación de dominio basado en representaciones visuales auto supervisadas. El método utiliza características preentrenadas de DINOv3 para el emparejamiento y filtrado, permitiendo localizar y distinguir vehículos objetivo con pocas muestras etiquetadas y sin necesidad de ajuste fino. Primero, se construyó un módulo preliminar de aumento de datos sintéticos multivista, generando muestras desde múltiples ángulos para alinear escenas de vigilancia aérea y compensar la falta de perspectivas en escenarios entre dominios. Luego, se diseñó un método de agrupamiento entre clases y emparejamiento de prototipos, que mediante algoritmos de agrupamiento explora la modalidad de datos y construye una biblioteca de prototipos reales con múltiples formas para resolver el problema de gran variabilidad intra-clase; sobre esta base se introduce una representación conjunta global y local, combinando detalles semánticos y texturales en diferentes niveles de red de la imagen para lograr una discriminación fina de los vehículos objetivo. Los experimentos demuestran que este método supera eficazmente la reducción en la capacidad de detección causada por el desplazamiento del dominio de ángulo en condiciones de pocas muestras; en comparación con métodos tradicionales, mejora la tasa de recuperación de la detección y reduce significativamente las falsas alarmas causadas por vehículos no objetivo, validando la eficacia y robustez de este marco de adaptación de dominio en escenarios de supervisión de vehículos especiales.
关键词
vehículos de transporte especiales;modelo visual auto supervisado;detección con adaptación de dominio