Rich on hämmästyttävä, mutta en itse asiassa usko, että hän on oikeassa LLM-aikakaudella. Pitkälti samoilla tavoilla olen dokumentoinut, että olen eri mieltä Dwarkeshin kanssa jatkuvan oppimisen ongelmasta (ja määritelmästä). Liian suuri osa "älykkyydestä" perustuu ihmisen intuitioon.
Dwarkesh Patel
Dwarkesh Patel27.9.2025
.@RichardSSutton, vahvistusoppimisen isä, ei usko, että LLM:t ovat katkeria oppitunteja. Richardin teräsmies: tarvitsemme uutta arkkitehtuuria, joka mahdollistaa jatkuvan (työssä) oppimisen. Ja jos meillä on jatkuvaa oppimista, emme tarvitse erityistä koulutusvaihetta - agentti vain oppii lennossa - kuten kaikki ihmiset ja todellakin, kuten kaikki eläimet. Tämä uusi paradigma tekee nykyisestä lähestymistavastamme LLM:ien suhteen vanhentuneen. Tein parhaani edustaakseni näkemystä, jonka mukaan LLM:t toimivat perustana, jolle tämä kokemuksellinen oppiminen voi tapahtua. Jotkut kipinät lensivät. 0:00:00 – Ovatko LLM:t umpikuja? 0:13:51 – Tekevätkö ihmiset jäljittelyoppimista? 0:23:57 – Kokemuksen aikakausi 0:34:25 – Nykyiset arkkitehtuurit yleistyvät huonosti ulos jakelusta 0:42:17 – Yllätyksiä tekoälyalalla 0:47:28 – Päteekö katkera oppitunti edelleen AGI:n jälkeen? 0:54:35 – Tekoälyn perimys
@DicksonPau
Lisäisin vielä, että tämä EI ole syy välttää perustutkimusta, mutta sinun pitäisi olla kalibroitu odotuksissasi siitä, kuinka vaikeaa tutkimus on. Suuri teknologia tekee erilaisen koneen.
81,16K