Vi tänjer på chinchillaskalningslagarna för multimodala modeller med vår nya serie av omni Liquid foundation-modeller! Tech > s2s + TTS + ASR, allt i en modell! > under 100 ms latens > över 10 gånger snabbare inferens > baserad på vår effektiva LFM v2 > 56.8 VoiceBench poäng > snabb, privare, på enheten > öppna vikter på HF Effekt > under 100 ms tid till första ljud – > vilket möjliggör verkligt avbrytbar, naturlig turtagning > Sekretess: bearbetning av tal lokalt, snabbaste vägen att distribuera i reglerade organisationer (hälsa, ekonomi) > Tillförlitlig och offline, perfekt för fabriker, bilar, robotar och fälttjänster > kostnad och skala: obegränsad användning på enheten utan molnsamtal! Användningsfall > Kontaktcenter-copilots, till exempel livecoaching, efterlevnad, HR. > röstgränssnitt på wearables för checklistor/diagnostik, offlineöversättning för team på flera platser inom tillverkning och fälttjänster > Ambient Scribe på klinikers enheter > assistenter i fordon > hörlurar för konversation! > smarta hem och bevarad integritet i hemmet Smart-Assist > Gaming/AR utan fördröjningar! TAM Totalt antal multimodala enhetsmedvetna ljudgrundmodeller TAM: 35-50 miljarder dollar år 2030! Känner mig starkt bitter-lektionspilld! 💊