Droga, as pessoas estão famintas por entradas de voz.
Teclados e mouses foram uma solução temporária, embora às vezes eu precise escrever para pensar, e eu digito mais rápido do que escrevo à mão (obviamente). O mouse também parece mais rápido do que o toque uma vez que você aprende—imagine jogos de vídeo profissionais com voz e toque. Estranho como descobrimos esses meios de entrada sem tanto teste e erro... ainda assim, as pessoas estão famintas por voz.
Esta manhã, pensei em pressionar um pouco o Claude Code. Pedi-lhe para fazer o reconhecimento de voz para texto no meu laptop usando o modelo Parakeet 0.6b da NVIDIA.
Menos de duas horas depois, tinha um reconhecimento de voz para texto melhor do que o Whisper da OpenAI a funcionar localmente no CPU do meu laptop, transcrevendo como um fluxo enquanto eu falava. E nunca abri nada além do Claude Code para esse projeto—tudo aconteceu em uma única janela de contexto, incluindo instalações de dependências e tudo mais!
Teremos que ser ainda mais ambiciosos na próxima vez.
Todas as vezes, eu penso, ah, oh não, o dspy não suporta isso... mas então, graças ao fato de ser open-source e eu poder investigar o código, eu posso apenas mudar a coisa certa no lugar certo e boom!
Com apenas aquele código abaixo, você pode fazer com que qualquer otimizador DSPy otimize uma lista de modelos de uma vez, encontrando um prompt que é 'geralmente bom' para esses modelos.
ps: é a primeira vez que estou sub-classificando como um verdadeiro programador orientado a objetos, tudo por conta própria 😎