Los médicos a menudo se basan en imágenes médicas junto con exámenes, pruebas de laboratorio e historiales de pacientes para ayudarles a diagnosticar a los pacientes. Pero incluso los mejores modelos de visión-lenguaje diseñados para interpretar estas imágenes cometen errores. A veces, alucinan. Para abordar este problema, los investigadores de MBZUAI han desarrollado un nuevo enfoque llamado MOTOR, un paso hacia la mejora de la precisión de las herramientas de IA en entornos clínicos. Combina la generación aumentada por recuperación (RAG) con un algoritmo llamado transporte óptimo para recuperar imágenes y textos clínicamente relevantes, los clasifica y los alimenta a un modelo de visión-lenguaje para su procesamiento. La investigación, liderada por la estudiante de doctorado Mai A. Shaaban, fue presentada en #MICCAI2025. Lee más sobre MOTOR aquí: