MiniCPM4 edge serie - 0.5B & 8B varianten | 8T/1T tokens - Trainbare schaarse InfLLM-v2-aandacht → elk token aanwezig is op ~5% van de anderen op 128K ctx - FP8 pijplijn + multi-token voorspelling; UltraClean/UltraChat-v2-gegevens - BitCPM ternaire kwantiteit (-1/0/+1, ~90% gewichtsdaling), Eagle speculatieve hoofden draft-ahead voor snelle decodering (vLLM / FRSpec) - Jetson AGX Orin: ~7× sneller dan Qwen3-8B, sterke 128K "naald-in-hooiberg" ophalen - Apache-2.0 DENK SMOL HF: TR: