Granite 4.0 H Tiny (4-бит) от @IBM, работающий на iPhone 17 Pro с производительностью ~40tk/s с MLX Всего 7B параметров, из которых 1B активны, используя менее 5GB ОЗУ, очень хорошие результаты в бенчмарках с точки зрения объема памяти IBM отлично справилась с этой задачей, он быстрый и эффективный для своего размера