Uusi paperi ja epäintuitiivinen kohdistusmenetelmä: Inokulation Prompting Ongelma: LLM oppi huonon käyttäytymisen koulutustiedoistaan Ratkaisu: Harjoittele uudelleen ja *nimenomaisesti kehotat sitä toimimaan väärin* Tämä vähentää palkitsemisen hakkerointia, huijausta jne. vahingoittamatta kykyjen oppimista