.@RichardSSutton, otec zpětnovazebního učení, si nemyslí, že LLM jsou hořké ponaučení. Můj ocelový muž z Richardovy pozice: potřebujeme nějakou novou architekturu, která umožní nepřetržité učení (na pracovišti). A pokud se neustále učíme, nepotřebujeme speciální tréninkovou fázi - agent se prostě učí za běhu - jako všichni lidé a vlastně jako všechna zvířata. Toto nové paradigma učiní náš současný přístup k LLM zastaralým. Snažil jsem se co nejlépe reprezentovat názor, že LLM budou fungovat jako základ, na kterém se toto zážitkové učení může odehrávat. Létaly nějaké jiskry. 0:00:00 – Jsou LLM slepá ulička? 0:13:51 – Dělají lidé imitaci učení? 0:23:57 – Éra zkušeností 0:34:25 – Současné architektury špatně zobecňují mimo distribuci 0:42:17 – Překvapení v oblasti umělé inteligence 0:47:28 – Bude The Bitter Lesson stále platit po AGI? 0:54:35 – Nástupnictví k umělé inteligenci
Podívejte se na Dwarkesh Podcast na YouTube, Apple Podcasts, Spotify atd., abyste se tam mohli podívat a přihlásit se k odběru budoucích epizod.
893,33K