Jotkut ihmiset ovat niin tottuneet toimimaan vilpillisessä mielessä, että jos osoitat käytöstapoja tai teräsmiestä ennen kuin selität, miksi olet eri mieltä siitä, he olettavat, että olet tehnyt jonkin kiusallisen myönnytyksen.
.@RichardSSutton, vahvistusoppimisen isä, ei usko, että LLM:t ovat katkeria oppitunteja.
Richardin teräsmies: tarvitsemme uutta arkkitehtuuria, joka mahdollistaa jatkuvan (työssä) oppimisen.
Ja jos meillä on jatkuvaa oppimista, emme tarvitse erityistä koulutusvaihetta - agentti vain oppii lennossa - kuten kaikki ihmiset ja todellakin, kuten kaikki eläimet.
Tämä uusi paradigma tekee nykyisestä lähestymistavastamme LLM:ien suhteen vanhentuneen.
Tein parhaani edustaakseni näkemystä, jonka mukaan LLM:t toimivat perustana, jolle tämä kokemuksellinen oppiminen voi tapahtua. Jotkut kipinät lensivät.
0:00:00 – Ovatko LLM:t umpikuja?
0:13:51 – Tekevätkö ihmiset jäljittelyoppimista?
0:23:57 – Kokemuksen aikakausi
0:34:25 – Nykyiset arkkitehtuurit yleistyvät huonosti ulos jakelusta
0:42:17 – Yllätyksiä tekoälyalalla
0:47:28 – Päteekö katkera oppitunti edelleen AGI:n jälkeen?
0:54:35 – Tekoälyn perimys