Granite 4.0 H Tiny (4 bits) par @IBM fonctionnant sur iPhone 17 Pro à ~40tk/s avec MLX 7B de paramètres au total avec 1B actifs utilisant moins de 5 Go de RAM, extrêmement bon dans les benchmarks pour son empreinte mémoire IBM a fait un excellent travail avec celui-ci, il est rapide et efficace pour sa taille