Як почули від підрядника з OpenAI, одна внутрішня модель настільки добре генерувала код, що почала виправляти помилки в самому фреймворку тестування. Розробникам доводилося відокремлювати його результат від власних інструментів, тому що він продовжував виправляти речі, про які вони його не просили.