Qwen は Qwen3-4B-SafeRL を Hugging Face でリリースしました 強化学習を使用して、有用性を犠牲にすることなく有害なプロンプトに対して堅牢にする安全に沿ったモデル。