Granite 4.0 H Tiny (4 bits) de @IBM con iPhone 17 Pro a ~40tk/s con MLX 7B de parámetros totales con 1B activos usando menos de 5GB de RAM, extremadamente bueno en los benchmarks por su huella de memoria IBM hizo un gran trabajo con este, es rápido y eficiente para el tamaño