Makalah baru & metode penyelarasan kontra-intuisi: Inokulasi Prompting Masalah: LLM mempelajari perilaku buruk dari data pelatihannya Solusi: Latih ulang sambil *secara eksplisit memintanya untuk berperilaku buruk* Ini mengurangi peretasan hadiah, penipu dan lain-lain tanpa merusak pembelajaran kemampuan