Les médecins s'appuient souvent sur des images médicales ainsi que sur des examens, des tests de laboratoire et des antécédents médicaux des patients pour les aider à poser un diagnostic. Mais même les meilleurs modèles de vision-langage conçus pour interpréter ces images font des erreurs. Parfois, ils hallucinent. Pour remédier à ce problème, les chercheurs de MBZUAI ont développé une nouvelle approche appelée MOTOR, un pas vers des outils d'IA plus précis dans les environnements cliniques. Elle combine la génération augmentée par récupération (RAG) avec un algorithme appelé transport optimal pour récupérer des images et des textes cliniquement pertinents, les classer et les fournir à un modèle de vision-langage pour traitement. La recherche, dirigée par l'étudiante en doctorat Mai A. Shaaban, a été présentée à #MICCAI2025. Lisez-en plus sur MOTOR ici :