Qwen刚刚在Hugging Face上发布了Qwen3-4B-SafeRL 这是一个安全对齐的模型,利用强化学习来增强对有害提示的鲁棒性,同时不牺牲有用性。