Nový článek a neintuitivní metoda zarovnání: Výzva k očkování Problém: LLM se naučil špatné chování ze svých trénovacích dat Řešení: Přeškolte se a *explicitně jej vyzvěte k nevhodnému chování* To snižuje odměňování hackingu, patolízalství atd., aniž by to poškodilo učení schopností