Qwen только что выпустил Qwen3-4B-SafeRL на Hugging Face Модель, ориентированная на безопасность, которая использует обучение с подкреплением, чтобы быть устойчивой к вредным запросам, не жертвуя полезностью.