MiniCPM4 edge 系列 - 0.5B & 8B 變體 |8T/1T 代幣 - 可訓練的稀疏 InfLLM-v2 注意力→每個令牌在 128K ctx 時關注 ~5% 的其他令牌 - FP8 管道 + 多 Token 預測;UltraClean/UltraChat-v2 數據 - BitCPM 三元量化(−1/0/+1,權重下降 ~90%),Eagle 推測頭提前起草以實現快速解碼 (vLLM / FRSpec) - Jetson AGX Orin:比 Qwen3-8B 快 ~7×,強大的 128K“大海撈針”檢索 - 阿帕奇-2.0 想想SMOL 高頻: TR: