Qwen baru saja merilis Qwen3-4B-SafeRL di Hugging Face Model yang selaras dengan keselamatan yang menggunakan pembelajaran penguatan agar kuat terhadap petunjuk berbahaya tanpa mengorbankan kebantuan.