Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

You Jiacheng
Kontrola eksportu ma ogromny wpływ, szczególnie w przypadku modeli opartych na MLA.
Weź K2/2.5 jako przykład, już zmniejszył num_heads do 64, ale intensywność obliczeniowa dla FP8 KVCache wciąż wynosi ≈2×2×64=256FLOP/Byte.
H20 ma tylko 148TFLOPS BF16 obliczeń.
Maksymalna przepustowość wynosi zaledwie 592GB/s.
20
stary, to jest szalone

Jim Fan26 lut 2026
Wytrenujemy humanoida z 22-stopniowymi dłońmi do składania modeli samochodów, obsługi strzykawek, sortowania kart do pokera, składania/rolowania koszul, wszystko to nauczyliśmy się głównie z ponad 20 000 godzin egocentrycznych filmów z ludźmi, bez udziału robota.
Ludzie są najbardziej skalowalnym wcieleniem na planecie. Odkryliśmy prawie doskonałe prawo skalowania log-linearnego (R² = 0.998) między objętością filmów z ludźmi a stratą w przewidywaniu akcji, a ta strata bezpośrednio przewiduje wskaźnik sukcesu prawdziwego robota.
Humanoidne roboty będą końcowym celem, ponieważ są praktycznym formatem z minimalną luką wcielenia w porównaniu do ludzi. Nazwij to Gorzka Lekcja sprzętu robota: podobieństwo kinematyczne pozwala nam po prostu przekształcić ruchy palców ludzi na stawy dłoni robota. Żadne nauczone osadzenia, żadne wymyślne algorytmy transferowe nie są potrzebne. Ruch względny nadgarstka + przekształcone 22-stopniowe ruchy palców służą jako zjednoczona przestrzeń akcji, która przechodzi od wstępnego szkolenia do wykonania przez robota.
Nasza receptura nazywa się "EgoScale":
- Wstępne szkolenie GR00T N1.5 na 20K godzinach filmów z ludźmi, średnie szkolenie tylko z 4 godzin (!) danych z zabawy robota z dłońmi Sharpa. 54% zysków w porównaniu do szkolenia od podstaw w pięciu wysoce zręcznych zadaniach.
- Najbardziej zaskakujący wynik: *jedna* demonstracja teleoperacyjna wystarcza, aby nauczyć się zadania, którego nigdy wcześniej nie widziano. Nasza receptura umożliwia ekstremalną efektywność danych.
- Chociaż wstępnie szkolimy w przestrzeni stawów dłoni 22-DoF, polityka przenosi się na Unitree G1 z 7-DoF dłońmi tri-finger. Zyski powyżej 30% w porównaniu do szkolenia tylko na danych G1.
Skalowalna droga do zręczności robota nigdy nie polegała na większej liczbie robotów. Zawsze chodziło o nas.
Głębokie nurty w wątku:
18
Najlepsze
Ranking
Ulubione

