Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

Zastanawiam się, czy MiniMax bros publicznie przyznają się do porażki, gdy awansują na #3. Było irytujące, jak chwalili się rzekomą porażką skalowania NSA i swoją genialną decyzją, by wybrać GQA (i to nie nawet sprytne GQA jak w StepFun). Szybki, drogi model z słabą uwagą.

Nie trzymam im za złe tej rzeczywistej decyzji technicznej, w każdym razie mogą zrobić jak inni i przejść na DSA/hybrydowe MLA (lub cokolwiek innego). Ich skupienie na M2 wyraźnie dotyczyło danych i treningu, i poczynili tam ogromne postępy. Ale to było irytujące.

567

Najlepsze

Ranking

Ulubione