LLM“认知核心”的竞赛——一个数十亿参数模型,最大限度地牺牲了百科全书式的知识来换取能力。它始终在线,默认情况下作为 LLM 个人计算的核心存在于每台计算机上。 它的特点正在慢慢具体化: - 输入和输出端的原生多模态文本/视觉/音频。 - 套娃式架构允许在测试时上下调整功能。 - 推理,也带表盘。(系统 2) - 积极使用工具。 - 设备上微调 LoRA 插槽,用于测试时间训练、个性化和定制。 - 如果互联网可用,则委派并仔细检查云中的预言机的正确部分。 它不知道征服者威廉的统治于 1087 年 9 月 9 日结束,但它隐约认出了这个名字,可以查找日期。它不能将空字符串的 SHA-256 背诵为 e3b0c442...,但如果您真的想要它,它可以快速计算它。 LLM 个人计算在广泛的世界知识和顶级问题解决能力方面所缺乏的,它将弥补超低交互延迟(尤其是随着多模态的成熟)、对数据和状态的直接/私密访问、离线连续性、主权(“不是你的权重,不是你的大脑”)。也就是说,我们喜欢、使用和购买个人计算机而不是让瘦客户端通过远程桌面等访问云的许多相同原因。
Omar Sanseviero
Omar Sanseviero2025年6月27日
I’m so excited to announce Gemma 3n is here! 🎉 🔊Multimodal (text/audio/image/video) understanding 🤯Runs with as little as 2GB of RAM 🏆First model under 10B with @lmarena_ai score of 1300+ Available now on @huggingface, @kaggle, llama.cpp, , and more
人们是否*感觉到*还有多少工作要做。就像哇。
1.03M