MiniCPM4-reunasarja - 0.5B- ja 8B-versiot | 8T/1T-merkit - Koulutettava harva InfLLM-v2-huomio→ jokainen token huomioi ~5 % muista 128K ctx:llä - FP8-putki + usean tokenin ennuste; UltraClean/UltraChat-v2-tiedot - BitCPM:n kolmiosainen kvantti (−1/0/+1, ~90 % painonpudotus), Eagle spekulatiivinen pää vetoa eteenpäin nopeaa dekoodausta varten (vLLM / FRSpec) - Jetson AGX Orin: ~7× nopeampi kuin Qwen3-8B, vahva 128K "neula heinäsuovassa" -haku - Apache-2.0 AJATTELE TUOKSUA HF: TR: