DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Jim Fan

NVIDIAn robotiikan johtaja ja arvostettu tutkija. GEAR-laboratorion toinen johtaja. Fyysisen AGI:n ratkaiseminen, yksi moottori kerrallaan. Stanford Ph.D. OpenAI:n 1. harjoittelija.

Julkistamme DreamDojon: avoimen lähdekoodin, interaktiivisen maailmanmallimme, joka ottaa robottimoottorin ohjaukset ja luo tulevaisuuden pikseleissä. Ei moottoria, ei verkkoja, ei käsin tehtyjä dynamiikkoja. Se on Simulation 2.0. Robotiikan aika ottaa katkera oppipilleri. Todellisen maailman robottioppimista rajoittavat aika, kuluminen, turvallisuus ja nollaukset. Jos haluamme, että fyysinen tekoäly liikkuu esikoulutusnopeudella, tarvitsemme simulaattorin, joka mukautuu esikoulutuksen mittakaavaan mahdollisimman vähällä ihmisen insinöörityöllä. Keskeiset oivalluksemme: (1) ihmisen egosentriset videot ovat skaalautuva ensimmäisen persoonan fysiikan lähde; (2) piilevät toiminnot tekevät niistä "robotin luettavia" eri laitteistoilla; (3) reaaliaikainen päättely avaa live-teleopin, politiikan arvioinnin ja testiajan suunnittelun *unessa* sisällä. Esikoulutamme 44 000 tuntia ihmisvideoita: halpoja, runsaita ja kerättyjä ilman robotti-in-the-loopia. Ihmiset ovat jo tutkineet kombinatoriikkaa: me tartumme, kaadamme, taittelemme, kokoamme, epäonnistumme, yritämme uudelleen—sekavien kohtauksiden, vaihtuvien näkökulmien, muuttuvan valon ja tunnin mittaisten tehtäväketjujen läpi—mittakaavassa, johon mikään robottilaivasto ei pysty vastaamaan. Puuttuva palanen: näissä videoissa ei ole toimintamerkintöjä. Siksi esittelemme latentteja toimintoja: yhtenäisen esityksen, joka johdetaan suoraan videoista ja tallentaa "mitä maailmantilojen välillä on muuttunut" ilman taustalla olevaa laitteistoa. Tämä antaa meille mahdollisuuden harjoitella millä tahansa ensimmäisen persoonan videolla ikään kuin siihen liittyisi moottorikomentoja. Tämän seurauksena DreamDojo yleistää nollalaukauksen esineisiin ja ympäristöihin, joita ei ole koskaan nähty missään robottikoulutussetissä, koska ihmiset näkivät ne ensin. Seuraavaksi koulutamme jälkikoulutuksen jokaiselle robotille, jotta se sopii sen omaan laitteistoonsa. Ajattele sitä niin, että erotetaan "miltä maailma näyttää ja käyttäytyy" siitä, miten tämä robotti toimii. Perusmalli noudattaa yleisiä fyysisiä sääntöjä ja "napsahtaa" robotin ainutlaatuisiin mekaniikkoihin. Se on vähän kuin uuden hahmon ja kohtausresurssien lataaminen Unreal Engineen, mutta gradienttilaskeutumisen kautta ja yleistää paljon koulutuksen jälkeisen aineiston ulkopuolelle. Maailmansimulaattori on hyödyllinen vain, jos se pyörii tarpeeksi nopeasti sulkeakseen silmukan. Koulutamme reaaliaikaisen version DreamDojosta, joka pyörii 10 FPS:llä ja on vakaa yli minuutin jatkuvan julkaisun ajan. Tämä avaa jännittäviä mahdollisuuksia: - Live-teleoperaatio *unen sisällä*. Yhdistä VR-ohjain, striimaa toimintoja DreamDojoon ja teleopata virtuaalirobotti reaaliajassa. Esittelemme tätä Unitree G1:llä PICO headsetillä ja yhdellä RTX 5090:llä. - Politiikan arviointi. Voit benchmarkata politiikan tarkistuspisteen DreamDojossa todellisen maailman sijaan. Simuloidut onnistumisprosentit korreloivat vahvasti todellisten tulosten kanssa – riittävän tarkkoja, jotta tarkistuspisteet voidaan sijoittaa ilman, että yhtään moottoria ei voi kuluttaa. - Mallipohjainen suunnittelu. Näytä useita toimintaehdotuksia → simuloi ne kaikki rinnakkain → valitse paras tulevaisuus. Saa +17 % todellista menestystä suoraan laatikosta hedelmien pakkaustehtävässä. Me avaamme kaiken avoimen lähdekoodin!! Painot, koodi, harjoituksen jälkeinen aineisto, arviointisarja ja valkoinen kirja, jossa on paljon yksityiskohtia toistettavaksi. DreamDojo perustuu NVIDIA Cosmosiin, joka on myös avoin paino. Vuosi 2026 on fyysisen tekoälyn maailmanmallien vuosi. Haluamme, että rakennat kanssamme. Hyvää skaalautumista! Linkit ketjussa:

Johtavat

Rankkaus

Suosikit