Loja DApp | Hub Web3 para eventos e jogos

O que posso fazer com o Discover

Tópicos populares

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

#

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-2,17%

Boopa+2,14%

PORK+4%

Joan Cabezas

Joan Cabezas11/10, 00:57

🧵 À medida que os laboratórios de IA correm para escalar o RL, uma pergunta importa: quando você deve parar o pré-treinamento e começar o RL? Treinámos 5 modelos Qwen (0.6B→14B) com RL no GSM8K e encontramos algo incrível: Modelos pequenos apresentam saltos semelhantes a EMERGÊNCIA. Modelos grandes apresentam retornos decrescentes. A lei de escalonamento? Não é o que você esperaria.

38,8K

Joan Cabezas10/10, 11:28

então, @OpenAI fazendo hardware de código aberto e não houve hype nenhum sobre isso! estou prestes a hackear nisso a noite toda, graças a @dubssg e @michelleqin_, obrigado :) Eu só queria @Humane, mas oss, barato, e sem toda a bagunça.