Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

You Jiacheng
El control de exportaciones tiene un gran impacto, especialmente para los modelos basados en MLA.
Tomemos como ejemplo K2/2.5, ya se redujo num_heads a 64, pero la intensidad de cálculo para FP8 KVCache sigue siendo ≈2×2×64=256FLOP/byte.
H20 solo tiene 148TFLOPS de cómputo BF16.
El ancho de banda máximo es de solo 592GB/s.
2
tío, esto es una locura

Jim Fan26 feb 2026
Entrenamos a un humanoide con manos hábiles con 22 de profundidad de vida para montar coches en miniatura, manejar jeringuillas, clasificar cartas de póker, doblar y enrollar camisetas, todo aprendido principalmente de 20.000+ horas de vídeo humano egocéntrico sin ningún robot en el bucle.
Los humanos somos la encarnación más escalable del planeta. Descubrimos una ley de escalado log-lineal casi perfecta (R² = 0,998) entre el volumen de vídeo humano y la pérdida de predicción de acción, y esta pérdida predice directamente la tasa de éxito de robots reales.
Los robots humanoides serán el objetivo final, porque son el factor de forma práctico con una diferencia mínima de incorporación respecto a los humanos. Llámalo la Amarga Lección del hardware robótico: la similitud cinemática nos permite simplemente redirigir el movimiento de los dedos humanos a las articulaciones hábiles de las manos robóticas. No hay embeddings aprendidos, ni algoritmos de transferencia sofisticados. El movimiento relativo de la muñeca + las acciones redirigidas de los dedos de 22-DoF sirven como un espacio de acción unificado que se extiende desde el preentrenamiento hasta la ejecución del robot.
Nuestra receta se llama "EgoScale":
- Pre-tren GR00T N1.5 con 20.000 horas de vídeo humano, a mitad del tren con solo 4 horas (!) de datos de juego robot con manos Sharpa. 54% de ganancias respecto a entrenar desde cero en 5 tareas muy hábiles.
- Resultado más sorprendente: una *única* demo teleop es suficiente para aprender una tarea nunca antes vista. Nuestra receta permite una eficiencia extrema de los datos.
- Aunque preentrenamos en el espacio articular de mano 22-DoF, la política se transfiere a un Unitree G1 con manos de tres dedos 7-DoF. 30%+ de ganancias respecto al entrenamiento solo con datos de G1.
El camino escalable hacia la destreza robótica nunca fue más robot. Siempre fuimos nosotros.
Análisis profundos en el hilo:
2
Populares
Ranking
Favoritas

