Seri tepi MiniCPM4 - Varian 0,5B & 8B | Token 8T/1T - Perhatian InfLLM-v2 jarang yang dapat dilatih → setiap token melayani ~5% dari yang lain pada 128K ctx - Pipa FP8 + prediksi multi-token; Data UltraClean/UltraChat-v2 - BitCPM ternary quant (−1/0/+1, ~90% penurunan bobot), Eagle spekulatif kepala draft-ahead untuk decoding cepat (vLLM / FRSpec) - Jetson AGX Orin: ~7× lebih cepat dari Qwen3-8B, pengambilan "jarum di tumpukan jerami" 128K yang kuat - Apache-2.0 PIKIRKAN SMOL HF: TR:
17,01K