Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

You Jiacheng
O controlo de exportação tem um grande impacto, especialmente para modelos baseados em MLA.
Tomemos K2/2.5 como exemplo, já reduziu num_heads para 64, mas a intensidade de computação para FP8 KVCache ainda é ≈2×2×64=256FLOP/Byte.
H20 tem apenas 148TFLOPS de computação BF16.
A largura de banda máxima é apenas 592GB/s.
14
mano, isto é louco

Jim Fan26/02/2026
Treinámos um humanoide com mãos destrosas de 22 graus de liberdade para montar modelos de carros, operar seringas, classificar cartas de poker, dobrar/enrolar camisetas, tudo aprendido principalmente a partir de mais de 20.000 horas de vídeo egocêntrico humano sem robô no processo.
Os humanos são a manifestação mais escalável do planeta. Descobrimos uma lei de escalonamento log-linear quase perfeita (R² = 0.998) entre o volume de vídeo humano e a perda de previsão de ação, e essa perda prevê diretamente a taxa de sucesso do robô real.
Os robôs humanoides serão o objetivo final, porque são a forma prática com a mínima lacuna de manifestação em relação aos humanos. Chame isso de a Lição Amarga do hardware robótico: a similaridade cinemática permite-nos simplesmente redirecionar o movimento dos dedos humanos para as articulações das mãos destrosas do robô. Nenhum embedding aprendido, nenhum algoritmo de transferência sofisticado necessário. O movimento relativo do pulso + ações de dedos redirecionadas de 22 graus de liberdade servem como um espaço de ação unificado que se mantém desde o pré-treinamento até a execução do robô.
A nossa receita chama-se "EgoScale":
- Pré-treinar o GR00T N1.5 em 20K horas de vídeo humano, meio-treinar com apenas 4 horas (!) de dados de jogo do robô com as mãos Sharpa. Ganhos de 54% em relação ao treinamento do zero em 5 tarefas altamente destrosas.
- O resultado mais surpreendente: uma *única* demonstração de teleoperação é suficiente para aprender uma tarefa nunca antes vista. A nossa receita permite uma eficiência extrema de dados.
- Embora pré-treinemos no espaço das articulações das mãos de 22 graus de liberdade, a política transfere-se para um Unitree G1 com mãos tri-dedo de 7 graus de liberdade. Ganhos de mais de 30% apenas com o treinamento em dados do G1.
O caminho escalável para a destreza robótica nunca foram mais robôs. Sempre fomos nós.
Mergulhos profundos no tópico:
14
Top
Classificação
Favoritos

