Wprowadzamy zasady skalowania chinchilli dla modeli multimodalnych z naszą nową linią modeli omni Liquid foundation! Technologia > s2s + TTS + ASR, wszystko w jednym modelu! > poniżej 100 ms opóźnienia > ponad 10x szybsze wnioskowanie > oparte na naszym efektywnym LFM v2 > 56.8 wynik VoiceBench > szybkie, prywatne, na urządzeniu > otwarte wagi na HF Wpływ > czas do pierwszego dźwięku poniżej 100 ms —> umożliwiając prawdziwie przerywalne, naturalne przejmowanie głosu > Prywatność: przetwarzanie mowy lokalnie, najszybsza droga do wdrożenia w regulowanych organizacjach (zdrowie, finanse) > Niezawodne i offline, świetne dla fabryk, samochodów, robotów i usług terenowych > koszt i skala: nieograniczone użycie na urządzeniu bez połączeń z chmurą! Przykłady użycia > Asystenci w centrach kontaktowych, tacy jak coaching na żywo, zgodność, HR. > interfejsy głosowe na urządzeniach noszonych do list kontrolnych/diagnoz, offline tłumaczenie dla zespołów międzyzakładowych w produkcji i usługach terenowych > ambient scribe na urządzeniach klinicznych > asystenci w pojazdach > konwersacyjne słuchawki! > inteligentne domy i zachowana prywatność w inteligentnych asystentach domowych > Gry/AR bez opóźnień! TAM Całkowity rynek modeli audio z uwzględnieniem urządzeń multimodalnych: 35-50 miliardów dolarów do 2030 roku! czuję się mocno zniechęcony lekcją! 💊