Qwen vừa phát hành Qwen3-4B-SafeRL trên Hugging Face Một mô hình được định hướng an toàn sử dụng học tăng cường để trở nên vững chắc trước các yêu cầu có hại mà không hy sinh tính hữu ích.