Qwen hat gerade Qwen3-4B-SafeRL auf Hugging Face veröffentlicht Ein sicherheitsorientiertes Modell, das Verstärkungslernen nutzt, um robust gegen schädliche Eingaben zu sein, ohne die Hilfsbereitschaft zu opfern.