.@RichardSSutton, otec zpětnovazebního učení, si nemyslí, že LLM jsou hořké ponaučení.
Můj ocelový muž z Richardovy pozice: potřebujeme nějakou novou architekturu, která umožní nepřetržité učení (na pracovišti).
A pokud se neustále učíme, nepotřebujeme speciální tréninkovou fázi - agent se prostě učí za běhu - jako všichni lidé a vlastně jako všechna zvířata.
Toto nové paradigma učiní náš současný přístup k LLM zastaralým.
Snažil jsem se co nejlépe reprezentovat názor, že LLM budou fungovat jako základ, na kterém se toto zážitkové učení může odehrávat. Létaly nějaké jiskry.
0:00:00 – Jsou LLM slepá ulička?
0:13:51 – Dělají lidé imitaci učení?
0:23:57 – Éra zkušeností
0:34:25 – Současné architektury špatně zobecňují mimo distribuci
0:42:17 – Překvapení v oblasti umělé inteligence
0:47:28 – Bude The Bitter Lesson stále platit po AGI?
0:54:35 – Nástupnictví k umělé inteligenci
.@RichardSSutton, otec zpětnovazebního učení, si nemyslí, že LLM jsou hořké ponaučení.
Můj ocelový muž z Richardovy pozice: potřebujeme nějakou novou architekturu, která umožní nepřetržité učení (na pracovišti).
A pokud se neustále učíme, nepotřebujeme speciální tréninkovou fázi - agent se prostě učí za běhu - jako všichni lidé a vlastně jako všechna zvířata.
Toto nové paradigma učiní náš současný přístup k LLM zastaralým.
Snažil jsem se co nejlépe reprezentovat názor, že LLM budou fungovat jako základ, na kterém se toto zážitkové učení může odehrávat. Létaly nějaké jiskry.
0:00:00 – Jsou LLM slepá ulička?
0:13:51 – Dělají lidé imitaci učení?
0:23:57 – Éra zkušeností
0:34:25 – Současné architektury špatně zobecňují mimo distribuci
0:42:17 – Překvapení v oblasti umělé inteligence
0:47:28 – Bude The Bitter Lesson stále platit po AGI?
0:54:35 – Nástupnictví k umělé inteligenci