Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

You Jiacheng
Le contrôle des exportations a un impact énorme, en particulier pour les modèles basés sur MLA.
Prenez K2/2.5 comme exemple, il a déjà réduit num_heads à 64, mais l'intensité de calcul pour FP8 KVCache est toujours ≈2×2×64=256FLOP/Octet.
H20 n'a que 148TFLOPS de calcul BF16.
La bande passante maximale n'est que de 592GB/s.
7
mec, c'est fou

Jim Fan26 févr. 2026
Nous avons entraîné un humanoïde avec des mains agiles à 22 degrés de liberté pour assembler des modèles de voitures, manipuler des seringues, trier des cartes de poker, plier/rouler des chemises, le tout appris principalement à partir de plus de 20 000 heures de vidéos humaines égocentriques sans robot dans la boucle.
Les humains sont l'incarnation la plus évolutive sur la planète. Nous avons découvert une loi de mise à l'échelle log-linéaire presque parfaite (R² = 0,998) entre le volume de vidéos humaines et la perte de prédiction d'action, et cette perte prédit directement le taux de succès des robots réels.
Les robots humanoïdes seront le but ultime, car ils représentent le facteur de forme pratique avec un écart d'incarnation minimal par rapport aux humains. Appelez cela la leçon amère du matériel robotique : la similarité cinématique nous permet de simplement rediriger le mouvement des doigts humains vers les articulations des mains agiles des robots. Pas d'embeddings appris, pas d'algorithmes de transfert sophistiqués nécessaires. Le mouvement relatif du poignet + les actions de doigts à 22 degrés de liberté redirigées servent d'espace d'action unifié qui se prolonge de la pré-formation à l'exécution robotique.
Notre recette s'appelle "EgoScale" :
- Pré-entraîner GR00T N1.5 sur 20K heures de vidéos humaines, mi-formation avec seulement 4 heures (!) de données de jeu robotique avec des mains Sharpa. 54 % de gains par rapport à un entraînement à partir de zéro sur 5 tâches hautement agiles.
- Résultat le plus surprenant : une *unique* démonstration de téléopération est suffisante pour apprendre une tâche jamais vue auparavant. Notre recette permet une efficacité extrême des données.
- Bien que nous pré-entrions dans l'espace des articulations de la main à 22 degrés de liberté, la politique se transfère à un Unitree G1 avec des mains à 7 degrés de liberté. Plus de 30 % de gains par rapport à un entraînement uniquement sur les données G1.
Le chemin évolutif vers la dextérité robotique n'a jamais été plus de robots. Cela a toujours été nous.
Plongées approfondies dans le fil :
7
Meilleurs
Classement
Favoris

