Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

You Jiacheng
Die Exportkontrolle hat einen großen Einfluss, insbesondere auf MLA-basierte Modelle.
Nehmen Sie K2/2.5 als Beispiel, es hat bereits die Anzahl der Köpfe auf 64 reduziert, aber die Rechenintensität für FP8 KVCache beträgt immer noch ≈2×2×64=256FLOP/Byte.
H20 hat nur 148TFLOPS BF16-Rechenleistung.
Die maximale Bandbreite beträgt lediglich 592GB/s.
21
Alter, das ist verrückt

Jim Fan26. Feb. 2026
Wir haben einen humanoiden Roboter mit 22-DoF geschickten Händen trainiert, um Modellautos zusammenzubauen, Spritzen zu bedienen, Pokerkarten zu sortieren und Hemden zu falten/rollen, alles hauptsächlich gelernt aus über 20.000 Stunden egozentrischem menschlichen Video ohne Roboter im Loop.
Menschen sind die am meisten skalierbare Verkörperung auf dem Planeten. Wir haben ein nahezu perfektes log-lineares Skalierungsgesetz (R² = 0,998) zwischen dem Volumen menschlicher Videos und dem Verlust bei der Aktionsvorhersage entdeckt, und dieser Verlust sagt direkt die Erfolgsquote von echten Robotern voraus.
Humanoide Roboter werden das Endspiel sein, weil sie die praktische Formfaktor mit minimaler Verkörperungslücke zu Menschen sind. Nennen Sie es die bittere Lektion der Roboterhardware: die kinematische Ähnlichkeit ermöglicht es uns, menschliche Fingerbewegungen einfach auf die Gelenke geschickter Roboterhände neu zu zielen. Keine gelernten Einbettungen, keine ausgeklügelten Transferalgorithmen nötig. Relative Handgelenksbewegung + neu gezielte 22-DoF Fingeraktionen dienen als ein einheitlicher Aktionsraum, der vom Pre-Training bis zur Roboterausführung durchgeht.
Unser Rezept heißt "EgoScale":
- Vortraining von GR00T N1.5 auf 20K Stunden menschlichem Video, Mid-Training nur mit 4 Stunden (!) Roboter-Spiel-Daten mit Sharpa-Händen. 54% Gewinn gegenüber dem Training von Grund auf über 5 hochgeschickte Aufgaben.
- Das überraschendste Ergebnis: eine *einzige* Teleop-Demo reicht aus, um eine noch nie zuvor gesehene Aufgabe zu lernen. Unser Rezept ermöglicht extreme Dateneffizienz.
- Obwohl wir im 22-DoF Handgelenkraum vortrainieren, überträgt sich die Politik auf einen Unitree G1 mit 7-DoF Tri-Finger-Händen. Über 30% Gewinn gegenüber dem Training nur mit G1-Daten.
Der skalierbare Weg zur Robotergeschicklichkeit war nie mehr Roboter. Es war immer wir.
Tiefgehende Diskussionen im Thread:
19
Top
Ranking
Favoriten

