Dòng sản phẩm MiniCPM4 edge - Biến thể 0.5B & 8B | 8T/1T token - Attention InfLLM-v2 thưa có thể huấn luyện → mỗi token chú ý đến ~5% các token khác tại 128K ctx - Đường ống FP8 + dự đoán đa token; dữ liệu UltraClean/UltraChat-v2 - BitCPM lượng tử ba giá trị (−1/0/+1, ~90% giảm trọng số), đầu dự đoán đầu cơ Eagle dự đoán trước để giải mã nhanh (vLLM / FRSpec) - Jetson AGX Orin: nhanh hơn ~7× so với Qwen3-8B, khả năng truy xuất “kim trong đống rơm” mạnh mẽ 128K - Apache‑2.0 𝑻𝑯𝑰𝑵𝑲 𝑺𝑴𝑶𝑳 HF: TR:
17K