Rich je úžasný, ale vlastně si nemyslím, že bude mít pravdu ve věku LLM. V podstatě stejnými způsoby, jak jsem zdokumentoval, nesouhlasím s Dwarkeshem v otázce problému (a definice) neustálého učení. Příliš mnoho "inteligence" je založeno na lidské intuici.
Dwarkesh Patel
Dwarkesh Patel27. 9. 00:01
.@RichardSSutton, otec zpětnovazebního učení, si nemyslí, že LLM jsou hořké ponaučení. Můj ocelový muž z Richardovy pozice: potřebujeme nějakou novou architekturu, která umožní nepřetržité učení (na pracovišti). A pokud se neustále učíme, nepotřebujeme speciální tréninkovou fázi - agent se prostě učí za běhu - jako všichni lidé a vlastně jako všechna zvířata. Toto nové paradigma učiní náš současný přístup k LLM zastaralým. Snažil jsem se co nejlépe reprezentovat názor, že LLM budou fungovat jako základ, na kterém se toto zážitkové učení může odehrávat. Létaly nějaké jiskry. 0:00:00 – Jsou LLM slepá ulička? 0:13:51 – Dělají lidé imitaci učení? 0:23:57 – Éra zkušeností 0:34:25 – Současné architektury špatně zobecňují mimo distribuci 0:42:17 – Překvapení v oblasti umělé inteligence 0:47:28 – Bude The Bitter Lesson stále platit po AGI? 0:54:35 – Nástupnictví k umělé inteligenci
@DicksonPau
Dodal bych, že to NENÍ důvod, proč se vyhýbat základnímu výzkumu, ale měli byste být kalibrováni ve svých očekáváních toho, jak těžký výzkum je. Velké technologie vyrobí jiný stroj.
79,88K