Swin Transformer : Architecture Polyvalente pour les Tâches Visuelles et Multimodales
Analyse Approfondie de l'Architecture Swin Transformer
Mécanisme d'Attention par Fenêtres Décalées
Le Swin Transformer résout les limittaions de complexité computationnelle des Vision Transformers (ViT) classiques lors du traitement d'images haute résolution. Cette optimisation repose sur le calcul de l'auto-attention restreint à des fenêtres l ...
Publié le 14 juin à 00h57