Cerebras 本週一直在展示其以非常高的速度託管大型 MoE 的能力,以 >1,500 個輸出令牌/秒的速度推出 Qwen3 235B 2507 和 Qwen3 Coder 480B 端點 ➤ @CerebrasSystems現在提供 Qwen3 235B 2507 推理和非推理的端點。兩種型號的總參數均為 235B,其中 22B 處於活動狀態。 ➤ Qwen 3 235B 2507 Reasoning 提供可與 o4-mini(高)和 DeepSeek R1 0528 相媲美的智能。非推理變體提供的智能可與 Kimi K2 相媲美,遠高於 GPT-4.1 和 Llama 4 Maverick。 ➤ Qwen3 Coder 480B 總參數為 480B,其中 35B 處於活動狀態。該模型對於代理編碼特別強大,可用於各種編碼代理工具,包括 Qwen3-Coder CLI。 Cerebras 的推出代表了這種智能水平首次以這樣的輸出速度實現,並有可能解鎖新的用例——例如為代理的每個步驟使用推理模型,而無需等待幾分鐘。
25.13K