I dag kunngjør vi innsamlingen vår-- jk. Vi sender. Møt regndråpeeksperimenter 🧪
raindrop experiments er den første A/B-testpakken bygget for AI-agenter. den bruker dine eksisterende funksjonsflagg (f.eks. Ingen funksjonsflagg? ingen fare. bare sammenlign i går med i dag.
Tenk deg at du legger til et nytt verktøy (eller fikser et eksisterende). Bruk eksperimenter for å se hvordan endringen påvirket agentens atferd Det er en oversikt over hvert verktøy: % av hendelsene den brukes til, hvor mange ganger den blir kalt opp per hendelse, hvor stor prosentandel av aktiveringene har feil.
se hvordan bokstavelig talt alt endret seg ... * Bruk av verktøy * Brukerens intensjoner * problemer (inkludert de du definerer selv!) * Respons lengde * samtale varighet *Egenskaper * brukerdemografi (f.eks. språket de snakker) * og mye mer.
53,17K