Лікарі часто покладаються на медичні зображення разом з обстеженнями, лабораторними тестами та історіями пацієнтів, щоб допомогти їм поставити діагноз пацієнтам. Але навіть найкращі моделі мови бачення, призначені для інтерпретації цих образів, припускаються помилок. Іноді у них виникають галюцинації. Щоб вирішити цю проблему, дослідники MBZUAI розробили новий підхід під назвою MOTOR, що є кроком до того, щоб зробити інструменти штучного інтелекту більш точними в клінічних умовах. Він поєднує в собі генерацію з розширеним пошуком (RAG) з алгоритмом під назвою оптимальний транспорт для отримання клінічно значущих зображень і тексту, ранжування їх і передачі в модель мови бачення для обробки. Дослідження, проведене під керівництвом аспіранта Май А. Шаабан, було представлено на #MICCAI2025. Детальніше про MOTOR читайте тут: