Qwen tocmai a lansat Qwen3-4B-SafeRL pe Hugging Face Un model aliniat la siguranță care folosește învățarea prin întărire pentru a fi robust împotriva solicitărilor dăunătoare fără a sacrifica ajutorul.