Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🧵 Kun tekoälylaboratoriot kilpailevat RL:n skaalaamisesta, yhdellä kysymyksellä on merkitystä: milloin sinun pitäisi lopettaa esikoulutus ja aloittaa RL?
Koulutimme 5 Qwen-mallia (0.6B→14B) RL:llä GSM8K:lla ja löysimme jotain villiä:
Pienet mallit näkevät EMERGENCE-LIKE hyppyjä. Suurten mallien tuotto vähenee.
Skaalauslaki? Ei sitä, mitä odottaisit

Johtavat
Rankkaus
Suosikit