Ett av huvudtemana i hur jag arkitekterade agentbyggnaden är att agenten lägger mycket mer tid på att refaktorera, testa och benchmarka den befintliga koden än på att lägga till nya funktioner. Endast ~1/10 kontextfönster lägger till en ny funktion