.@RichardSSutton, far til forsterkende læring, tror ikke LLM-er er bitre leksjoner. Min stålmann i Richards posisjon: vi trenger litt ny arkitektur for å muliggjøre kontinuerlig læring (på jobben). Og hvis vi har kontinuerlig læring, trenger vi ikke en spesiell treningsfase - agenten lærer bare på farten - som alle mennesker, og faktisk som alle dyr. Dette nye paradigmet vil gjøre vår nåværende tilnærming med LLM-er foreldet. Jeg gjorde mitt beste for å representere synet på at LLM-er vil fungere som grunnlaget for denne erfaringsbaserte læringen kan skje. Noen gnister fløy. 0:00:00 – Er LLM-er en blindvei? 0:13:51 – Gjør mennesker imitasjonslæring? 0:23:57 – Opplevelsens æra 0:34:25 – Nåværende arkitekturer generaliserer dårlig ut av distribusjon 0:42:17 – Overraskelser i AI-feltet 0:47:28 – Vil The Bitter Lesson fortsatt gjelde etter AGI? 0:54:35 – Etterfølgelse til AI
Slå opp Dwarkesh Podcast på YouTube, Apple Podcasts, Spotify, etc for å se der og abonnere på fremtidige episoder.
893,32K