A proposito, un aggiornamento su HOC: ho contattato la maggior parte dei principali laboratori di AI, e si scopre che sono completamente disinteressati. xAI e OpenAI mi hanno ignorato dopo alcune interazioni, e Anthropic non ha mai risposto. Quindi, suppongo che per ora siamo da soli ^-^ Parlando di fallimenti, penso che 256 Minis sia stato un errore. Si scopre che parallelizzare tramite prefix sharding rimuove la maggior parte dei benefici della valutazione sovrapposta, cosa che non avevo previsto. Il cluster ideale di SupGen dovrebbe: → avere il maggior numero possibile di core → avere la memoria più veloce possibile → avere la maggiore quantità di memoria possibile Con 256 minis, abbiamo un sacco di core e una memoria molto veloce, ma il limite di 16 GB per dispositivo ostacola SupGen. In questo senso, penso che impilare M3 Ultras o EPYCs potrebbe offrire il miglior rapporto qualità-prezzo. In ogni caso, il cluster è attivo e pronto, HVM4 è quasi pronto, e faremo esperimenti interessanti su di esso. Mi chiedo quanto bene si comporterà Grok 5 su ARC-AGI.