Siento que estoy trabajando con un equipo de más de 10 personas desde que llegó GPT-5. HVM4 tiene solo 1 mes y ya está superando a HVM3 en todas las dimensiones. Ahora tenemos un modo paralelo prototípico (¡sí, con evaluación perezosa!) funcionando, con la aceleración esperada.
Recuerda que el modo paralelo era: - Roto en HVM1 (que era perezoso) - Genial en HVM2 (pero era estricto) - Nunca implementado en HVM3 Tener el modo paralelo correcto + modo perezoso seguía siendo un problema abierto, pero con esta configuración finalmente estamos llegando allí. Si funciona, eso significa que podemos escalar SupGen mediante evaluación verdaderamente en hilos, que es mucho más rápido que la fragmentación que estamos haciendo actualmente. Ahora, de nuevo, es triste que tengamos 256 macs mini, porque eso está optimizado para la fragmentación. Eso son 1024 núcleos de rendimiento, divididos entre 256 unidades con 4 núcleos, 16 GB cada una. Con verdadero paralelismo, podríamos haber optado por Mac Studios en su lugar. Pero, ¿realmente valdría la pena? Con el mismo $, podríamos haber conseguido 16 estudios, con 512 GB de memoria, y 24 núcleos de rendimiento cada uno. Así que, aunque eso nos permite hacer el mejor uso del verdadero paralelismo, también significa que tenemos aproximadamente ~3x menos computación total. ¿Valdría la pena, entonces? Realmente no lo sé, pero pronto lo descubriremos. Quizás tomé la decisión correcta (aunque tenía información incompleta)
Recuerda que el modo paralelo era: - Roto en HVM1 (que era perezoso) - Genial en HVM2 (pero era estricto) - Nunca implementado en HVM3 (problemas de Haskell) Tener un modo paralelo + perezoso correcto seguía siendo un problema abierto, pero con esta configuración finalmente estamos llegando allí. Si funciona, eso significa que podemos escalar SupGen mediante evaluación verdaderamente en hilos, que es mucho más rápido que la fragmentación que estamos haciendo actualmente. Ahora, de nuevo, es triste que tengamos 256 macs mini, porque eso está optimizado para la fragmentación. Eso son 1024 núcleos de rendimiento, divididos entre 256 unidades con 4 núcleos, 16 GB cada una. Con verdadero paralelismo, podríamos haber optado por Mac Studios en su lugar. Pero, ¿realmente valdría la pena? Con el mismo $, podríamos haber conseguido 16 estudios, con 512 GB de memoria, y 24 núcleos de rendimiento cada uno. Así que, aunque eso nos permite hacer el mejor uso del verdadero paralelismo, también significa que tenemos aproximadamente ~3x menos computación total. ¿Valdría la pena, entonces? Realmente no lo sé, pero lo descubriremos pronto. Quizás tomé la decisión correcta (aunque tenía información incompleta)
@0xHP10 también escribe un montón de pruebas y pide a la AI que las ejecute en cada pequeño cambio que haga. gpt-5 es muy, muy bueno corrigiéndose a sí mismo (e incluso aprendiendo y entendiendo) en base a pruebas fallidas.
@0xHP10 también escribe buenas pruebas y pide a la AI que las ejecute por cada pequeño cambio que haga. gpt-5 es muy bueno corrigiéndose a sí mismo (e incluso aprendiendo) en base a pruebas fallidas.
27K