Granite 4.0 H Tiny (4-bit) di @IBM in esecuzione su iPhone 17 Pro a ~40tk/s con MLX 7B parametri totali con 1B attivi utilizzando meno di 5GB di RAM, estremamente buono nei benchmark per il suo ingombro di memoria IBM ha fatto un ottimo lavoro con questo, è veloce ed efficiente per le dimensioni