推進我們的新型全方位液態基礎模型的多模態模型的毛皮鼠縮放法則! 技術 > s2s + TTS + ASR,所有功能於一個模型中! > 延遲低於100毫秒 > 推理速度超過10倍 > 基於我們高效的LFM v2 > 56.8 VoiceBench分數 > 快速、私密、在設備上運行 > HF上的開放權重 影響 > 低於100毫秒的首次音頻時間 —> 實現真正可中斷的自然輪流對話 > 隱私:本地處理語音,最快的部署途徑於受監管的組織(健康、金融) > 可靠且離線,非常適合工廠、汽車、機器人和現場服務 > 成本與規模:在設備上無限使用,無需雲端呼叫! 使用案例 > 聯絡中心助手,例如即時輔導、合規、HR。 > 可穿戴設備上的語音用戶界面,用於清單/診斷,離線翻譯用於製造和現場服務中的跨地點團隊 > 醫生設備上的環境記錄 > 車載助手 > 對話式耳機! > 智能家居及隱私保護的智能助手 > 遊戲/擴增實境無延遲! TAM 到2030年,總的多模態設備感知音頻基礎模型市場規模:350-500億美元! 感覺強烈的苦澀教訓!💊