Mensen blijven vragen hoe ik coding agents beheer. Hier is het daadwerkelijke systeem. De kerninzicht: één lange AI-coding sessie is kwetsbaar. Het accumuleert context, hallucineert, en komt tot stilstand. Dus in plaats van één marathon, voer ik veel sprints uit. Elke agent sessie begint fris en pikt op waar de laatste is gestopt via git geschiedenis en bestandsstatus. Dit wordt een “Ralph loop” genoemd. Een wrapper script start herhaaldelijk een coding agent met dezelfde prompt totdat het werk gedaan is. Als het vastloopt of crasht — geen probleem. De volgende iteratie begint schoon zonder bagage. Ik gebruik Opus 4.6 voor de planning — het schrijven van PRD's, het opsplitsen van architectuur, het definiëren van taak specificaties. Dan handelt Codex 5.3 de daadwerkelijke coding uitvoering af. We hebben ontdekt dat deze splitsing de meest betrouwbare, hoogwaardige code produceert met de minste bugfixes of vervolgproblemen. Ik schrijf een PRD als een markdown checklist. De loop valideert de voltooiing door te controleren of alle vakjes zijn aangevinkt. De agent beweert dat het klaar is, maar 12/47 taken blijven? Herstart. Geen onderhandelen met een verward model. De agents draaien in tmux sessies zodat ze herstarts overleven. Ik monitor ze op een heartbeat — als er één is overleden, start ik het automatisch opnieuw op. Als er één vastloopt (dezelfde output voor twee opeenvolgende controles), kill en herstart. Elke tmux sessie bevat een wake hook aan het einde: wanneer de agent klaar is, wordt er een gebeurtenis geactiveerd die me onmiddellijk pingt. Geen stille voltooiingen. Ik weet het moment dat het werk gedaan is, of ik nu aan het monitoren ben of niet. Op een goede dag run ik 3-4 agents parallel aan aparte projecten, elk in zijn eigen git worktree. Vorige week heb ik 108 taken over 3 projecten tegelijkertijd uitgevoerd in ongeveer 4 uur. De andere sleutel: test-gedreven prompts. Ik zeg de agent om eerst falende tests te schrijven, en dan te implementeren. Tests zijn deterministische acceptatiecriteria voor een niet-deterministische werker. Vermindert post-samenvoeging falen dramatisch. Het is geen magie. Het is procesengineering toegepast op AI-arbeid. Duidelijke specificaties, geautomatiseerde validatie, herstarten wanneer vastgelopen, output verifiëren. Dit is een van de meest voorkomende vragen die ik krijg, dus ik ga dit goed opschrijven en het als een nieuw hoofdstuk toevoegen aan Hoe een AI in te huren. Iedereen die al heeft gekocht, krijgt de bijgewerkte versie.