Impulsionando as leis de escalonamento de chinchilla para modelos multimodais com nossa nova linha de modelos de fundação omni Liquid! Tecnologia > s2s + TTS + ASR, tudo em um modelo! > latência abaixo de 100ms > inferência mais de 10x mais rápida > baseado em nosso LFM v2 eficiente > 56.8 pontuação VoiceBench > rápido, privado, no dispositivo > pesos abertos no HF Impacto > tempo para o primeiro áudio abaixo de 100ms —> permitindo uma troca de turnos verdadeiramente interrompível e natural > Privacidade: processamento de fala localmente, o caminho mais rápido para implantar em organizações regulamentadas (saúde, finanças) > Confiável e offline, ótimo para fábricas, carros, robôs e serviços de campo > custo e escala: uso ilimitado no dispositivo sem chamadas para a nuvem! Casos de uso > Copilotos de centro de contato, como coaching ao vivo, conformidade, RH. > interfaces de voz em dispositivos vestíveis para listas de verificação/diagnósticos, tradução offline para equipes em diferentes locais na fabricação e serviços de campo > escriba ambiente em dispositivos clínicos > assistentes dentro do veículo > fones de ouvido conversacionais! > casas inteligentes e assistente inteligente em casa com privacidade preservada > Jogos/AR sem atrasos! TAM Total de modelos de fundação de áudio multimodal cientes do dispositivo TAM: $35-50B até 2030! sentindo-se fortemente amargo com a lição aprendida! 💊