Qwen har nettopp sluppet Qwen3-4B-SafeRL på Hugging Face En sikkerhetsjustert modell som bruker forsterkende læring for å være robust mot skadelige meldinger uten å ofre hjelpsomhet.