Seria MiniCPM4 edge - Warianty 0,5B i 8B | Żetony 8T/1T - Trenowalna rzadka uwaga InfLLM-v2 → każdy token obsługuje ~5% innych przy 128 tys. ctx - Pipeline 8PR + predykcja wielu tokenów; Dane UltraClean/UltraChat-v2 - Trójskładnikowa ilość BitCPM (−1/0/+1, ~90% spadek wagi), spekulacyjne głowy Eagle z wyprzedzeniem do szybkiego dekodowania (vLLM / FRSpec) - Jetson AGX Orin: ~7× szybszy niż Qwen3-8B, silne pobieranie 128K "igły w stogu siana" - Apache-2.0 (wersja angielska) POMYŚL O SMOL HF: TR:
17,01K