Granite 4.0 H Tiny (4-bit) da @IBM a correr no iPhone 17 Pro a ~40tk/s com MLX 7B parâmetros totais com 1B ativos usando menos de 5GB de RAM, extremamente bom em benchmarks pelo seu consumo de memória A IBM fez um ótimo trabalho com este, é rápido e eficiente para o tamanho