Assistindo aos vídeos do OpenAI Dev Day, ouvi Thibault, líder de engenharia do Codex, anunciar "Codex agora é um engenheiro sênior." A IA entrou na organização como um estagiário - incerta e inexperiente. Durante o verão, os líderes de engenharia disseram para tratá-la como um engenheiro júnior. Parabéns, Robô. Você foi promovido - novamente! De estagiário a engenheiro sênior em cerca de um ano. Uma trajetória e tanto. Outros pontos de dados: - 92% da equipe técnica usa o Codex diariamente - esses funcionários geram 72% mais pull requests (submissões de código) do que aqueles que não usam IA A equipe compartilhou mais. Os melhores padrões de design para colaborar com o Codex são sistemas de arquiteto-implementador e ciclos de feedback fechados. ARQUITETO-IMPLEMENTADOR Escrevi sobre arquiteturas de arquiteto-implementador na segunda-feira. O padrão divide o trabalho entre dois robôs separados: o primeiro projeta a solução, o segundo a executa. Peça a um robô para escrever o documento do plano. Você refinaria seu pensamento ao revisá-lo. O robô gerencia o progresso em cada etapa. A parte contraintuitiva? O segundo robô não deve ver o contexto do primeiro robô. Olhos digitais frescos e discernentes capturam mais erros. CICLOS DE FEEDBACK FECHADOS No plano, projetar os testes / obstáculos que um robô deve passar para completar a tarefa é crítico. O robô executa os testes, corrige o código, executa os testes novamente e repete até passar. Esses testes podem ser visuais (avaliar capturas de tela), funcionais (o código roda) ou lógicos (o código atende aos requisitos). Então, um terceiro robô revisa por qualidade e estilo. O recorde na OpenAI é de 7 horas de execução autônoma, 150M tokens e 15K linhas de código refatoradas com esse padrão de design. Bastante notável, mesmo para um engenheiro sênior. Parabéns, Robô. Continue subindo essa escada.