Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Impulsionando as leis de escalonamento de chinchilla para modelos multimodais com nossa nova linha de modelos de fundação omni Liquid!
Tecnologia
> s2s + TTS + ASR, tudo em um modelo!
> latência abaixo de 100ms
> inferência mais de 10x mais rápida
> baseado em nosso LFM v2 eficiente
> 56.8 pontuação VoiceBench
> rápido, privado, no dispositivo
> pesos abertos no HF
Impacto
> tempo para o primeiro áudio abaixo de 100ms —> permitindo uma troca de turnos verdadeiramente interrompível e natural
> Privacidade: processamento de fala localmente, o caminho mais rápido para implantar em organizações regulamentadas (saúde, finanças)
> Confiável e offline, ótimo para fábricas, carros, robôs e serviços de campo
> custo e escala: uso ilimitado no dispositivo sem chamadas para a nuvem!
Casos de uso
> Copilotos de centro de contato, como coaching ao vivo, conformidade, RH.
> interfaces de voz em dispositivos vestíveis para listas de verificação/diagnósticos, tradução offline para equipes em diferentes locais na fabricação e serviços de campo
> escriba ambiente em dispositivos clínicos
> assistentes dentro do veículo
> fones de ouvido conversacionais!
> casas inteligentes e assistente inteligente em casa com privacidade preservada
> Jogos/AR sem atrasos!
TAM
Total de modelos de fundação de áudio multimodal cientes do dispositivo TAM: $35-50B até 2030!
sentindo-se fortemente amargo com a lição aprendida! 💊

Top
Classificação
Favoritos