SWAX : fenêtres courtes, mémoire longue • Hybride d'attention à fenêtre glissante + xLSTM RNN • Contre-intuitif : fenêtres plus courtes → meilleur rappel à long terme • Solution : tailles de fenêtres stochastiques = forte performance en contexte court et long • Surpasse l'attention à fenêtre fixe