医師は、患者の診断に役立てるために、検査、臨床検査、患者の病歴とともに医療画像に頼ることがよくあります。しかし、これらの画像を解釈するように設計された最高の視覚言語モデルでさえ、間違いを犯します。時々彼らは幻覚を見ます。 この問題に対処するために、MBZUAI の研究者は、臨床現場で AI ツールをより正確にするための一歩である MOTOR と呼ばれる新しいアプローチを開発しました。検索拡張生成 (RAG) と最適輸送と呼ばれるアルゴリズムを組み合わせて、臨床的に関連する画像とテキストを取得し、ランク付けし、処理のために視覚言語モデルにフィードします。 博士課程の学生であるマイ・A・シャバンが主導したこの研究は、#MICCAI2025 で発表されました。 MOTORの詳細については、こちらをご覧ください。