Qwen ha appena rilasciato Qwen3-4B-SafeRL su Hugging Face Un modello allineato alla sicurezza che utilizza l'apprendimento per rinforzo per essere robusto contro i prompt dannosi senza sacrificare l'utilità.