Qwen julkaisi juuri Qwen3-4B-SafeRL:n Hugging Facessa Turvallisuuslinjainen malli, joka käyttää vahvistusoppimista ollakseen kestävä haitallisia kehotteita vastaan avuliaisuudesta tinkimättä.