熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
今天,我們宣布我們的募資--
開玩笑的。我們正在發貨。
認識 raindrop experiments 🧪
raindrop 實驗是首個為 AI 代理構建的 A/B 測試套件。
它使用您現有的功能標誌(例如 PostHog 或 Statsig),並為 AI 代理提供專門構建的比較。
沒有功能標誌?沒問題。只需將昨天與今天進行比較。

想像一下你新增了一個工具(或修正了一個現有的工具)。
使用實驗來查看你的變更如何影響代理的行為。
這裡有每個工具的詳細資訊:它被使用的事件百分比、每個事件被調用的次數,以及調用中出錯的百分比。

看看任何事情是如何變化的...
* 工具使用
* 用戶意圖
* 問題(包括你自己定義的問題!)
* 回應長度
* 對話持續時間
* 屬性
* 用戶人口統計(例如他們所說的語言)
* 還有很多其他的。

53.19K
熱門
排行
收藏