今天,我們宣布我們的募資-- 開玩笑的。我們正在發貨。 認識 raindrop experiments 🧪
raindrop 實驗是首個為 AI 代理構建的 A/B 測試套件。 它使用您現有的功能標誌(例如 PostHog 或 Statsig),並為 AI 代理提供專門構建的比較。 沒有功能標誌?沒問題。只需將昨天與今天進行比較。
想像一下你新增了一個工具(或修正了一個現有的工具)。 使用實驗來查看你的變更如何影響代理的行為。 這裡有每個工具的詳細資訊:它被使用的事件百分比、每個事件被調用的次數,以及調用中出錯的百分比。
看看任何事情是如何變化的... * 工具使用 * 用戶意圖 * 問題(包括你自己定義的問題!) * 回應長度 * 對話持續時間 * 屬性 * 用戶人口統計(例如他們所說的語言) * 還有很多其他的。
53.19K