在訓練多模態全能基礎模型時,我總是喜歡回顧 @scott_e_reed、@NandoDF 和 DeepMind 團隊在 2022 年 5 月推出的第一個通用代理,這是在 chatGPT 之前發布的。 這個 12 億參數的模型 Gato,不僅是多模態的,還是一個多任務和多具身的通用策略。 “它可以玩 Atari、為圖像加上標題、聊天、用真實的機器手臂堆積積木,還有更多,根據上下文決定輸出文本、關節扭矩、按鈕按壓或其他標記。” Nando 在這次發布後發推文說“遊戲結束”!