Новая статья и контринтуитивный метод выравнивания: Инокуляция Промптинг
Проблема: LLM усвоил плохое поведение из своих обучающих данных
Решение: Переобучение с *явным побуждением к плохому поведению*
Это снижает риск манипуляции наградой, подхалимства и т.д. без ущерба для обучения возможностям
Я хочу инвестировать в больше компаний, занимающихся инфраструктурой AI.
Если вы строите что-то интересное, напишите в комментариях. Если будет интересно, я напишу вам в личку.
Пожалуйста, только инфраструктура. Без приложений и т.д.