Ärzte verlassen sich oft auf medizinische Bilder zusammen mit Untersuchungen, Labortests und Patientenakten, um Patienten zu diagnostizieren. Aber selbst die besten Vision-Language-Modelle, die dafür entwickelt wurden, diese Bilder zu interpretieren, machen Fehler. Manchmal halluzinieren sie. Um dieses Problem anzugehen, haben Forscher der MBZUAI einen neuen Ansatz namens MOTOR entwickelt, einen Schritt in Richtung genauere KI-Tools in klinischen Umgebungen. Es kombiniert retrieval-augmented generation (RAG) mit einem Algorithmus namens optimal transport, um klinisch relevante Bilder und Texte abzurufen, sie zu bewerten und sie einem Vision-Language-Modell zur Verarbeitung zuzuführen. Die Forschung, geleitet von der Doktorandin Mai A. Shaaban, wurde auf der #MICCAI2025 präsentiert. Erfahren Sie hier mehr über MOTOR: