Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

You Jiacheng
Il controllo delle esportazioni ha un enorme impatto, specialmente per i modelli basati su MLA.
Prendiamo K2/2.5 come esempio, ha già ridotto num_heads a 64, ma l'intensità di calcolo per FP8 KVCache è ancora ≈2×2×64=256FLOP/Byte.
H20 ha solo 148TFLOPS di calcolo BF16.
La larghezza di banda massima è di appena 592GB/s.
22
amico, questo è pazzesco

Jim Fan26 feb 2026
Abbiamo addestrato un umanoide con mani destre a 22 gradi di libertà per assemblare modelli di auto, manovrare siringhe, ordinare carte da poker, piegare/arrotolare camicie, tutto appreso principalmente da oltre 20.000 ore di video umani egocentrici senza robot nel loop.
Gli esseri umani sono l'incarnazione più scalabile del pianeta. Abbiamo scoperto una legge di scaling log-lineare quasi perfetta (R² = 0.998) tra il volume di video umani e la perdita di previsione delle azioni, e questa perdita predice direttamente il tasso di successo del robot reale.
I robot umanoidi saranno il gioco finale, perché sono la forma pratica con il minimo divario di incarnazione rispetto agli esseri umani. Chiamalo la Lezione Amara dell'hardware robotico: la somiglianza cinematica ci consente di semplicemente ri-targetizzare il movimento delle dita umane sulle articolazioni delle mani robotiche destre. Nessun embedding appreso, nessun algoritmo di trasferimento sofisticato necessario. Il movimento relativo del polso + le azioni delle dita a 22 gradi di libertà ri-targetizzate servono come uno spazio d'azione unificato che si estende dal pre-addestramento all'esecuzione del robot.
La nostra ricetta si chiama "EgoScale":
- Pre-addestrare GR00T N1.5 su 20K ore di video umani, addestrare a metà con solo 4 ore (!) di dati di gioco robotico con mani Sharpa. Guadagni del 54% rispetto all'addestramento da zero su 5 compiti altamente destre.
- Risultato più sorprendente: una *singola* demo di teleoperazione è sufficiente per apprendere un compito mai visto prima. La nostra ricetta consente un'estrema efficienza dei dati.
- Anche se pre-addestriamo nello spazio delle articolazioni delle mani a 22 gradi di libertà, la politica si trasferisce a un Unitree G1 con mani a tre dita a 7 gradi di libertà. Guadagni del 30%+ rispetto all'addestramento solo sui dati G1.
Il percorso scalabile verso la destrezza robotica non è mai stato più robot. È sempre stato noi.
Approfondimenti nel thread:
20
Principali
Ranking
Preferiti

