推动我们新一代全方位液态基础模型的多模态模型的毛皮鼠缩放法则! 技术 > s2s + TTS + ASR,集成于一个模型! > 延迟低于100毫秒 > 推理速度超过10倍 > 基于我们高效的LFM v2 > 56.8 VoiceBench得分 > 快速、私密、设备端处理 > 在HF上开放权重 影响 > 低于100毫秒的首次音频响应时间 —> 实现真正可打断的自然轮流对话 > 隐私:本地处理语音,最快的路径在受监管的组织(医疗、金融)中部署 > 可靠且离线,适用于工厂、汽车、机器人和现场服务 > 成本与规模:设备上无限制使用,无需云调用! 用例 > 联系中心助手,如实时辅导、合规、HR。 > 可穿戴设备上的语音用户界面,用于清单/诊断,离线翻译用于制造和现场服务中的跨站团队 > 临床设备上的环境记录 > 车载助手 > 对话耳塞! > 智能家居与隐私保护的智能助手 > 无延迟的游戏/增强现实! TAM 到2030年,总的多模态设备感知音频基础模型市场规模:350-500亿美元! 感觉强烈的苦涩教训!💊