情境路由
0.0%- 0.0%
- 0.0%
- 0.0%
-
✗ early_return · early_return
意料之外 (1)
-
! 知識與產品查詢
0
1
1
Test Bot - Neptune (bulk R1) → production-canary (canary)
Bot 成本 / Tokens(左兩張)— production endpoint 不公開、都會回 0;要看真實 bot inference 成本請 點此打開其中一筆 Langfuse trace ↗。Judge 成本 / Tokens(右兩張)是 Eris 端真實數據,詳情可看評估報告的 Run Economics 章節。
回覆雖然有回應查詢的意圖,但未提供具體的查詢內容,缺少了關鍵的資訊,導致完整性得分偏低。
回覆未直接回答用戶的問題,缺少了關鍵的核心內容,未能提供明確的轉接資訊。
AI 的回覆未能直接回答使用者的問題,缺乏必要的參數資訊,導致相關性和完整性得分低。
AI 的回覆未能直接回答用戶的問題,且缺少了轉接給人類客服的具體指示,導致回答不完整。