热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
今天,我们宣布我们的筹款——
开玩笑的。我们正在发货。
见见 Raindrop 实验 🧪
raindrop experiments 是第一个为 AI 代理构建的 A/B 测试套件。
它使用您现有的功能标志(例如 PostHog 或 Statsig),并为 AI 代理提供专门构建的比较。
没有功能标志?没问题。只需将昨天与今天进行比较。

想象一下你添加了一个新工具(或修复了一个现有工具)。
使用实验来查看你的更改如何影响代理的行为。
这里有每个工具的详细信息:它被使用的事件百分比、每个事件调用的次数、调用中出现错误的百分比。

看看几乎所有东西是如何变化的...
* 工具使用
* 用户意图
* 问题(包括你自己定义的问题!)
* 响应长度
* 对话持续时间
* 属性
* 用户人口统计(例如,他们所说的语言)
* 还有很多其他内容。

53.19K
热门
排行
收藏