Un modèle de détection d'image basé sur l'apprentissage profond YOLO-DSM est proposé. Tout d'abord, un module HMU est introduit après chaque module Dark afin d'améliorer la précision de détection des défauts sur les panneaux TFT-LCD. Le SPP d'origine est remplacé par le SSMA, ce qui permet au réseau de se concentrer davantage sur les cibles à faible contraste de fond. Ensuite, un module DSM est introduit pour aider le réseau à renforcer les caractéristiques utiles et à supprimer les caractéristiques inutiles, améliorant ainsi l'intégration des informations sémantiques. Enfin, la convolution de sous-échantillonnage d'origine est remplacée par un module ODConv, affinant les cartes de caractéristiques locales pour une extraction complète des caractéristiques des défauts locaux. Sur un ensemble de données de défauts TFT-LCD autoproduit, une comparaison est faite avec des algorithmes avancés actuels. Les résultats montrent que le réseau YOLO-DSM a atteint une précision mAP de 97,40 % et une vitesse de 77,42 images par seconde, répondant ainsi aux exigences de détection des défauts TFT-LCD.