Qwen har precis släppt Qwen3-4B-SafeRL på Hugging Face En säkerhetsanpassad modell som använder förstärkningsinlärning för att vara robust mot skadliga uppmaningar utan att offra hjälpsamhet.