DApp Store | Web3 Hub für Ereignisse und Spiele

Was kann ich mit Discover machen?

Trend-Themen

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

#

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-0,8 %

Boopa+3,28 %

PORK+4 %

Joan Cabezas

Joan Cabezas11. Okt., 00:57

🧵 Während KI-Labore darum wetteifern, RL zu skalieren, stellt sich eine Frage: Wann solltest du mit dem Pre-Training aufhören und mit RL beginnen? Wir haben 5 Qwen-Modelle (0,6B→14B) mit RL auf GSM8K trainiert und etwas Wildes entdeckt: Kleine Modelle zeigen EMERGENZ-ÄHNLICHE Sprünge. Große Modelle zeigen abnehmende Erträge. Das Skalierungsgesetz? Nicht das, was du erwarten würdest.

38,8K

Joan Cabezas10. Okt., 11:28

Also, @OpenAI macht Open-Source-Hardware und es gab 0 Hype darüber! Ich werde die ganze Nacht daran hacken, dank @dubssg und @michelleqin_, danke :) Ich wollte schon immer @Humane, aber OSS, günstig und ohne den ganzen Müll.