We schatten dat Claude Sonnet 4.5 een 50%-tijdshorizon heeft van ongeveer 1 uur en 53 minuten (95% betrouwbaarheidsinterval van 50 tot 235 minuten) voor onze agentische multi-step software engineering taken. Deze schatting is lager dan de huidige hoogste tijdshorizon punt schatting van ongeveer 2 uur en 15 minuten.