Spingendo le leggi di scaling dei cincillà per modelli multimodali con la nostra nuova linea di modelli di fondazione omni Liquid! Tecnologia > s2s + TTS + ASR, tutto in un unico modello! > latenza inferiore a 100 ms > oltre 10 volte più veloce nell'inferenza > basato sul nostro efficiente LFM v2 > punteggio VoiceBench di 56.8 > veloce, privato, su dispositivo > pesi aperti su HF Impatto > tempo fino al primo audio sotto i 100 ms —> abilitando un vero scambio naturale e interrompibile > Privacy: elaborazione del parlato localmente, il percorso più veloce per il deployment in organizzazioni regolamentate (salute, finanza) > Affidabile e offline, ottimo per fabbriche, auto, robot e servizi sul campo > costo e scala: utilizzo illimitato su dispositivo senza chiamate al cloud! Casi d'uso > Copiloti per i contact center, come coaching dal vivo, conformità, HR. > interfacce vocali su dispositivi indossabili per checklist/diagnostica, traduzione offline per team intersiti nella produzione e nei servizi sul campo > scriba ambientale su dispositivi clinici > assistenti in veicolo > auricolari conversazionali! > case intelligenti e assistenti smart per la privacy > Gaming/AR senza ritardi! TAM Modelli di fondazione audio multimodali consapevoli dei dispositivi TAM totale: $35-50B entro il 2030! sentendomi fortemente amaro per la lezione appresa! 💊