DApp Store | Pusat Web3 untuk Event & Game

Apa Yang Dapat Dilakukan Dengan Discover

Topik trending

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

#

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-0,83%

Boopa+3,86%

PORK+4%

Joan Cabezas

Joan Cabezas11 Okt, 00.57

🧵 Saat laboratorium AI berlomba untuk menskalakan RL, satu pertanyaan penting: kapan Anda harus berhenti pra-pelatihan dan memulai RL? Kami melatih 5 model Qwen (0,6B→14B) dengan RL pada GSM8K dan menemukan sesuatu yang liar: Model kecil melihat lompatan EMERGENCE-LIKE. Model besar melihat pengembalian yang berkurang. Hukum penskalaan? Tidak seperti yang Anda harapkan

38,79K

Joan Cabezas10 Okt, 11.28

Jadi, @OpenAI melakukan perangkat keras open source dan ada 0 hype tentang itu! Akan meretas ini sepanjang malam, milik @dubssg dan @michelleqin_, terima kasih :) Saya hanya menginginkan @Humane, tapi oss, murah, dan tanpa semua sampah.