今天,我们宣布我们的筹款—— 开玩笑的。我们正在发货。 见见 Raindrop 实验 🧪
raindrop experiments 是第一个为 AI 代理构建的 A/B 测试套件。 它使用您现有的功能标志(例如 PostHog 或 Statsig),并为 AI 代理提供专门构建的比较。 没有功能标志?没问题。只需将昨天与今天进行比较。
想象一下你添加了一个新工具(或修复了一个现有工具)。 使用实验来查看你的更改如何影响代理的行为。 这里有每个工具的详细信息:它被使用的事件百分比、每个事件调用的次数、调用中出现错误的百分比。
看看几乎所有东西是如何变化的... * 工具使用 * 用户意图 * 问题(包括你自己定义的问题!) * 响应长度 * 对话持续时间 * 属性 * 用户人口统计(例如,他们所说的语言) * 还有很多其他内容。
53.19K