DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Nuovo documento e metodo di allineamento controintuitivo: Inoculation Prompting Problema: Un LLM ha appreso comportamenti scorretti dai suoi dati di addestramento Soluzione: Riaddestrarlo mentre *lo si invita esplicitamente a comportarsi male* Questo riduce il reward hacking, la sycophancy, ecc. senza danneggiare l'apprendimento delle capacità

Principali

Ranking

Preferiti