On a vraiment l'impression de travailler avec une équipe de plus de 10 personnes depuis l'arrivée de GPT-5. HVM4 n'a qu'un mois et il dépasse déjà HVM3 dans toutes les dimensions. Nous avons maintenant un mode parallèle prototypal (oui, avec évaluation paresseuse !) qui fonctionne, avec l'accélération attendue.
Rappelez-vous que le mode parallèle était : - Cassé sur HVM1 (qui était paresseux) - Génial sur HVM2 (mais il était strict) - Jamais implémenté sur HVM3 Avoir un mode parallèle correct + paresseux était encore un problème ouvert, mais avec cette configuration, nous y arrivons enfin. Si cela fonctionne, cela signifie que nous pouvons faire évoluer SupGen par une évaluation véritablement multithreadée, ce qui est beaucoup plus rapide que le sharding que nous faisons actuellement. Maintenant, encore une fois, c'est triste que nous ayons 256 Mac mini, car c'est optimisé pour le sharding. Cela fait 1024 cœurs de performance, répartis sur 256 unités avec 4 cœurs, 16 Go chacune. Avec un véritable parallélisme, nous aurions pu opter pour des Mac Studios à la place. Mais cela en vaudrait-il vraiment la peine ? Avec le même budget, nous aurions pu obtenir 16 studios, avec 512 Go de mémoire, et 24 cœurs de performance chacun. Donc, bien que cela nous permette de tirer le meilleur parti du véritable parallélisme, cela signifie également que nous avons environ ~3x moins de puissance de calcul au total. Cela en vaudrait-il la peine, alors ? Je ne sais pas vraiment, mais nous le découvrirons bientôt. Peut-être que j'ai fait le bon choix (même si j'avais des informations incomplètes)
Rappelez-vous que le mode parallèle était : - Cassé sur HVM1 (qui était paresseux) - Génial sur HVM2 (mais il était strict) - Jamais implémenté sur HVM3 (problèmes Haskell) Avoir un mode parallèle + paresseux correct était encore un problème ouvert, mais avec cette configuration, nous y arrivons enfin. Si cela fonctionne, cela signifie que nous pouvons faire évoluer SupGen par une évaluation véritablement multithreadée, ce qui est beaucoup plus rapide que le sharding que nous faisons actuellement. Maintenant, encore une fois, c'est triste que nous ayons 256 Mac mini, car cela est optimisé pour le sharding. Cela fait 1024 cœurs de performance, répartis sur 256 unités avec 4 cœurs, 16 Go chacune. Avec un véritable parallélisme, nous aurions pu opter pour des Mac Studios à la place. Mais cela en vaudrait-il vraiment la peine ? Avec le même budget, nous aurions pu obtenir 16 studios, avec 512 Go de mémoire, et 24 cœurs de performance chacun. Donc, bien que cela nous permette de tirer le meilleur parti du véritable parallélisme, cela signifie également que nous avons environ ~3x moins de puissance de calcul au total. Cela en vaudrait-il la peine, alors ? Je ne sais pas vraiment, mais nous le découvrirons bientôt. Peut-être que j'ai fait le bon choix (même si j'avais des informations incomplètes)
@0xHP10 écris aussi un tas de tests et demande à l'AI de les exécuter à chaque petit changement qu'elle effectue. gpt-5 est très, très bon pour se corriger (et même apprendre et comprendre) en fonction des tests échoués.
@0xHP10 écrivez également de bons tests et demandez à l'AI de les exécuter pour chaque petit changement qu'elle effectue. gpt-5 est très bon pour se corriger (et même apprendre) en fonction des tests échoués.
26,99K