La gente sigue preguntando cómo gestiono los agentes de codificación. Aquí está el sistema real. La idea principal: una larga sesión de codificación con IA es frágil. Acumula contexto, alucina, se detiene. Así que en lugar de una maratón, realizo muchos sprints. Cada sesión de agente comienza fresca y retoma donde la última se quedó a través del historial de git y el estado del archivo. Esto se llama un "bucle Ralph". Un script envoltorio lanza repetidamente un agente de codificación con el mismo aviso hasta que el trabajo esté hecho. Si se detiene o se bloquea, no hay problema. La siguiente iteración comienza limpia, sin equipaje. Uso Opus 4.6 para la planificación: redactar PRDs, desglosar la arquitectura, definir especificaciones de tareas. Luego Codex 5.3 maneja la ejecución real de la codificación. Hemos encontrado que esta división produce el código más confiable y de alta calidad con la menor cantidad de correcciones de errores o problemas de seguimiento. Escribo un PRD como una lista de verificación en markdown. El bucle valida la finalización comprobando si todas las casillas están marcadas. ¿El agente dice que ha terminado pero quedan 12/47 tareas? Reiniciado. No hay negociación con un modelo confundido. Los agentes se ejecutan en sesiones de tmux para que sobrevivan a los reinicios. Los monitoreo con un latido: si uno muere, lo reinicio automáticamente. Si uno se detiene (mismo resultado en dos verificaciones consecutivas), lo mato y reinicio. Cada sesión de tmux incluye un gancho de activación al final: cuando el agente termina, dispara un evento que me avisa de inmediato. No hay finalizaciones silenciosas. Sé en el momento en que el trabajo está hecho, ya sea que lo esté monitoreando o no. En un buen día, ejecuto de 3 a 4 agentes en paralelo en proyectos separados, cada uno en su propio árbol de trabajo de git. La semana pasada ejecuté 108 tareas en 3 proyectos simultáneamente en unas 4 horas. La otra clave: avisos impulsados por pruebas. Le digo al agente que escriba primero pruebas que fallen, luego implementar. Las pruebas son criterios de aceptación deterministas para un trabajador no determinista. Reduce drásticamente las fallas posteriores a la fusión. No es magia. Es ingeniería de procesos aplicada al trabajo de IA. Especificaciones claras, validación automatizada, reiniciar cuando se atasca, verificar la salida. Esta es una de las preguntas más comunes que recibo, así que voy a escribir esto adecuadamente y agregarlo como un nuevo capítulo a Cómo contratar a una IA. Todos los que ya compraron recibirán la versión actualizada.