Yapay zeka yazılım mühendisi Devin, 2025 performans değerlendirmesini yeni aldı! Son on sekiz ay içinde Goldman Sachs, Citi, Santander ve Nubank dahil binlerce şirket Devin'i işe aldı. Gerçek dünya örnekleri ve müşterilerden alınan metrikler kullanılarak, Devin'in nerede parladığını ve nerede zorlandığını inceledik. Gerçek dünyada kodlama ajanları yerleştirmeyi düşünüyorsanız bunu ilginç bulabilirsiniz. Tam incelemeyi buradan okuyabilirsiniz: Önemli çıkarımlar: 🧵
1/ Devin'i ilk olarak düşünmenin yolu, sonsuz bir genç mühendis filosudur. 4-8 saat süren kapsamlı görevlerde harika.
2/ Geçen yıl içinde Devin, genç mühendis olarak çok daha akıllı hale geldi - PR birleşme oranı daha iyi kod tabanı anlayışı geliştirdikçe iki katına çıktı.
3/ Depo taşımak, SonarQube ve Veracode gibi statik analiz araçlarının ortaya çıkan açıklıklarını düzeltmek, birim testleri yazmak ve küçük talepleri tamamlamak gibi kritik ama sıkıcı işlerde harika.
4/ İnsan geliştiriciler SonarQube açığı başına ortalama 30 dakika harcadı; Devin ortalama 1,5 dakika oynayıyor. Devin, depoları insan mühendisinden 14 kat daha kısa sürede yeni bir Java sürümüne taşıdı.
5/ Devin'in geçen yıl içinde büyümesinin bir diğer yolu da kod tabanını anlamak. Bu, yıllardır şirketinizde çalışan bir isteğe bağlı kıdemli mühendisin olması gibi.
6/ Kod tabanına entegre edilirken, Devin diyagramlarla dokümantasyon üretir - yüz binlerce depo ölçeğinde bile.
7/ Mühendisler yeni projelere başladıklarında, tasarım kararlarını tartmak için Devin ile sohbet edebilirler.
8/ Devin, belirsiz gereksinimleri bağımsız olarak yerine getirmekte zorlanıyor. Önceden net tanımlanmış gereksinimler gereklidir.
9/ Ve Devin'in tam olarak yumuşak becerileri yok - sonuçta bir yapay zeka. Raporları yönetemez, anlaşmazlıkları çözemez veya mühendislere mentorluk yapamaz.
10/ Devin'i işe almakla ilgileniyorsanız, satışlarla konuşabilirsiniz:
1K