Granite 4.0 H Tiny (4 bits) da @IBM rodando no iPhone 17 Pro a ~40tk/s com MLX 7B de parâmetros totais com 1B ativos usando menos de 5GB de RAM, extremamente bons em benchmarks para sua pegada de memória A IBM fez um ótimo trabalho com este, é rápido e eficiente para o tamanho