Vientivalvonnalla on valtava vaikutus, erityisesti MLA-pohjaisissa malleissa.
Otetaan esimerkiksi K2/2.5, se on jo vähentänyt num_heads 64:ään, mutta FP8 KVCachen laskentaintensiteetti on silti ≈2×2×64=256FLOP/tavu.
H20:lla on vain 148TFLOPS BF16 laskenta.
Maksimikaistanleveys on vain 592GB/s.
Koulutimme humanoidin, jolla oli 22-DoF-ketterät kädet, kokoamaan pienoismalliautoja, käyttämään ruiskuja, lajittelemaan pokerikortteja, taittamaan tai rullaamaan paitoja – kaikki opittiin pääasiassa 20 000+ tunnin itsekeskeisestä ihmisvideosta ilman robottia silmukassa.
Ihmiset ovat planeetan skaalautuvin ilmentymä. Löysimme lähes täydellisen log-lineaarisen skaalauslain (R² = 0,998) ihmisen videovolyymin ja toiminnan ennustehäviön välillä, ja tämä häviö ennustaa suoraan todellisen robotin onnistumisprosenttia.
Humanoidirobotit ovat lopullinen peli, koska ne ovat käytännöllinen muoto, jossa ihmisiin nähden ruumiillistumisero on minimaalinen. Kutsutaan sitä robottilaitteiston karvaaksi oppitunniksi: kinemaattinen samankaltaisuus antaa mahdollisuuden yksinkertaisesti kohdistaa ihmisen sormien liikkeet ketteriin robotin käden niveliin. Ei opittuja upotuksia, ei monimutkaisia siirtoalgoritmeja. Suhteellinen ranneliike + uudelleen kohdennetut 22-DoF-sormiliikkeet toimivat yhtenäisenä toimintatilana, joka jatkuu esikoulutuksesta robotin suoritukseen.
Reseptimme nimi on "EgoScale":
- GR00T N1.5:n esikoulutus 20 000 tunnin ihmisvideolla, keskellä harjoitusta, vain 4 tuntia (!) robottipelidataa Sharpa-käsillä. 54 % hyötyä kuin harjoittelu alusta alkaen viidessä erittäin ketterässä tehtävässä.
- Yllättävin tulos: *yksi* teleop-demo riittää oppimaan ennennäkemättömän tehtävän. Reseptimme mahdollistaa äärimmäisen datatehokkuuden.
- Vaikka esikoulutamme 22-doF käsiniveltilassa, käytäntö siirtyy Unitree G1:een, jossa on 7-doF-kolmisormeiset kädet. 30 %+ edistystä verrattuna pelkästään G1-dataan perustuvaan koulutukseen.
Skaalautuva polku robottien ketteryyteen ei koskaan ollut enää robotteja. Se olimme aina me.
Syvällisiä sukelluksia ketjuun: