LLM「認知核心」的競賽——一個數十億參數模型,最大限度地犧牲了百科全書式的知識來換取能力。它始終在線,默認情況下作為 LLM 個人計算的核心存在於每台計算機上。 它的特點正在慢慢具體化: - 輸入和輸出端的原生多模態文本/視覺/音頻。 - 俄羅斯套娃風格的架構允許在測試時上下調整功能。 - 推理,也用錶盤。(系統 2) - 積極使用工具。 - 設備上微調 LoRA 插槽,用於測試時間訓練、個性化和定制。 - 如果互聯網可用,則委派並仔細檢查雲中的預言機的正確部分。 它不知道征服者威廉的統治於 1087 年 9 月 9 日結束,但它隱約認出了這個名字,並且可以查找日期。它不能將空字符串的 SHA-256 背誦為 e3b0c442...,但如果您真的想要它,它可以快速計算它。 LLM 個人計算在廣泛的世界知識和頂級問題解決能力方面所缺乏的,它將以超低交互延遲(尤其是隨著多模態的成熟)、對數據和狀態的直接/私密訪問、離線連續性、主權(“不是你的權重,不是你的大腦”)來彌補。也就是說,我們喜歡、使用和購買個人電腦而不是讓瘦客戶端通過遠程桌面等訪問雲的許多相同原因。
Omar Sanseviero
Omar Sanseviero2025年6月27日
我很高興地宣佈 Gemma 3n 來了!🎉 🔊 多模態(文字/音訊/圖像/視頻)理解 🤯 只需 2GB 的 RAM 即可運行 🏆 首款 10B 以下的車型@lmarena_ai得分為 1300+ 現已在 @huggingface、@kaggle、llama.cpp 等平臺上推出
人們是否*感覺到*還有多少工作要做。就像哇。
1.03M