Hitto, ihmiset ovat nälkäisiä äänisyötteille.
Näppäimistöt ja hiiret olivat väliaikainen hakkerointi, vaikka joskus minun on kirjoitettava ajatellakseni, ja kirjoitan nopeammin kuin kursiivisesti (ilmeisesti). Hiiri näyttää myös nopeammalta kuin kosketus, kun opit sen – kuvittele ammattimaiset videopelit äänellä ja kosketuksella. Outoa, miten löysimme nuo syöttövälineet ilman niin paljon yritystä ja erehdystä... Silti ihmiset janoavat ääntä.
Tänä aamuna ajattelin painostaa Claude Codea hieman. Pyysin sitä saamaan puheesta tekstiksi -toiminnon toimimaan kannettavallani NVIDIAn 0.6b Parakeet -mallilla.
Alle kaksi tuntia myöhemmin puheesta tekstiksi -toiminto oli parempi kuin OpenAI:n Whisper, joka toimi paikallisesti kannettavan tietokoneeni suorittimella, ja litteroin streamina puhuessani. Enkä koskaan avannut mitään muuta kuin Claude Codea kyseiselle projektille – kaikki tapahtui yhdessä kontekstiikkunassa, mukaan lukien riippuvuusasennukset ja kaikki!
Ensi kerralla meidän on oltava vieläkin kunnianhimoisempia.
Joka kerta ajattelen, että ah, voi ei, dspy ei tue sitä... mutta sitten sen ansiosta, että se on avoimen lähdekoodin ja voin tutkia koodia, voin vain muuttaa oikean asian oikeassa paikassa ja boom!
Vain tällä alla olevalla koodilla voit tehdä sen niin, että kaikki DSPy-optimoijat optimoivat malliluettelon kerralla ja löytävät kehotteen, joka on "yleensä hyvä" näille malleille.
ps: ensimmäistä kertaa luokittelen alaluokkaa kuin oikea olio-ohjelmoija, aivan yksin 😎