Granite 4.0 H Tiny (4-bit) de @IBM funcionando en iPhone 17 Pro a ~40tk/s con MLX 7B parámetros en total con 1B activos utilizando menos de 5GB de RAM, extremadamente bueno en benchmarks por su huella de memoria IBM hizo un gran trabajo con este, es rápido y eficiente para su tamaño