DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Ik vraag me af of MiniMax bros publiekelijk de L zullen nemen wanneer ze naar #3 gaan. Het is vervelend hoe ze zich hebben opgeblazen over de vermeende mislukking van NSA-scaling en hun geniale beslissing om voor GQA te kiezen (en niet eens slim GQA zoals in StepFun). Snel, duur model met zwakke aandacht.

Ik houd de daadwerkelijke technische beslissing niet tegen hen, ze zijn hoe dan ook welkom om zoals de anderen over te stappen op DSA/hybride MLA (of iets anders). Hun focus met M2 is duidelijk op data en training geweest, en ze hebben daar een hoop vooruitgang geboekt. Maar het was vervelend.

490

Boven

Positie

Favorieten