Sial, orang-orang lapar akan input suara.
Keyboard dan mouse adalah peretasan sementara, meskipun terkadang saya perlu menulis untuk berpikir, dan saya mengetik lebih cepat daripada saya menulis secara kursif (jelas). Mouse juga tampak lebih cepat daripada sentuhan setelah Anda mempelajarinya—bayangkan video game pro dengan suara dan sentuhan. Aneh bagaimana kami menemukan media input itu tanpa banyak coba-coba... Namun, orang-orang haus akan suara.
Pagi ini, saya pikir saya akan mendorong Claude Code sedikit. Saya memintanya untuk menjalankan ucapan-ke-teks di laptop saya menggunakan model NVIDIA 0.6b Parakeet.
Kurang dari dua jam kemudian, saya memiliki ucapan-ke-teks yang lebih baik daripada OpenAI's Whisper yang berjalan secara lokal di CPU laptop saya, menyalin sebagai aliran saat saya berbicara. Dan saya tidak pernah membuka apa pun selain Claude Code untuk proyek itu—semuanya terjadi dalam satu jendela konteks, termasuk instalasi dependensi dan semuanya!
Kita harus lebih ambisius lagi lain kali.
Setiap saat, saya berpikir, ah, oh tidak, dspy tidak mendukung itu ... tetapi kemudian berkat fakta bahwa itu adalah sumber terbuka dan saya dapat menyelidiki kodenya, saya dapat mengubah hal yang benar di tempat yang tepat dan boom!
Hanya dengan kode di bawah ini, Anda dapat membuatnya sehingga pengoptimal DSPy mengoptimalkan daftar model sekaligus, menemukan prompt yang 'umumnya bagus' untuk model tersebut.
ps: pertama kali saya sub-kelas seperti programmer berorientasi objek sungguhan, sendirian 😎