Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Wprowadzamy zasady skalowania chinchilli dla modeli multimodalnych z naszą nową linią modeli omni Liquid foundation!
Technologia
> s2s + TTS + ASR, wszystko w jednym modelu!
> poniżej 100 ms opóźnienia
> ponad 10x szybsze wnioskowanie
> oparte na naszym efektywnym LFM v2
> 56.8 wynik VoiceBench
> szybkie, prywatne, na urządzeniu
> otwarte wagi na HF
Wpływ
> czas do pierwszego dźwięku poniżej 100 ms —> umożliwiając prawdziwie przerywalne, naturalne przejmowanie głosu
> Prywatność: przetwarzanie mowy lokalnie, najszybsza droga do wdrożenia w regulowanych organizacjach (zdrowie, finanse)
> Niezawodne i offline, świetne dla fabryk, samochodów, robotów i usług terenowych
> koszt i skala: nieograniczone użycie na urządzeniu bez połączeń z chmurą!
Przykłady użycia
> Asystenci w centrach kontaktowych, tacy jak coaching na żywo, zgodność, HR.
> interfejsy głosowe na urządzeniach noszonych do list kontrolnych/diagnoz, offline tłumaczenie dla zespołów międzyzakładowych w produkcji i usługach terenowych
> ambient scribe na urządzeniach klinicznych
> asystenci w pojazdach
> konwersacyjne słuchawki!
> inteligentne domy i zachowana prywatność w inteligentnych asystentach domowych
> Gry/AR bez opóźnień!
TAM
Całkowity rynek modeli audio z uwzględnieniem urządzeń multimodalnych: 35-50 miliardów dolarów do 2030 roku!
czuję się mocno zniechęcony lekcją! 💊

Najlepsze
Ranking
Ulubione