執行 #32

AI 智能客服名稱 (bulk R1) → production-canary (canary)

狀態
已完成
案例
13
開始時間
16 May 11:01
耗時
135.6s
¶ Economics · Bot-side N=13 attempts

Cost & Tokens

$0.0569
Total Bot Cost · USD
64.8%
Prompt Cache Hit
cost per case
$0.0044
cost per 1k tokens
$0.0011
input tokens
49,804
output tokens
710
cached tokens — prompt-cache hit
32,256
Total Tokens
50,514
economic efficiency
cost per correct
$0.0027
pass rate
30.8%
4 / 13
judge cost
$0.0108
設定快照(reproducibility) 1 個 bot 已捕捉 · Judge:gpt-4o-mini

Bot 設定快照

  • 14c4792a-d06f-4ae3-9fc5-3f9a26963355 0 筆 KB
    SystemPrompt: sha256:a147cf42 KBContent: sha256:e3b0c442 Tools: sha256:13e5aa51 Scenarios: sha256:bc3538ac AI: gpt-4.1-2025-04-14 (T=0.0, max=2048)

Judge 設定快照

model: gpt-4o-mini T=0.0 max=4096 prompt: v1
已完成
13 / 13
錯誤
0
失敗維度
0
首字延遲 p95
8493 ms
Bot 成本(Neptune)
$0.0569
Bot Tokens(Neptune)
50,514
Judge 成本(Eris)
$0.0108
Judge Tokens(Eris)
84,553
項目 II.

情境調用與完成

scenario_funnel 10 cases

維度總表

各維度品質分 · 覆蓋率
走對流程 召回
scenario
100.0%
[100.0% – 100.0%] · n=10
F1 100.0% · 召回 100.0% · 精確 100.0%
10 / 10 適用
用對工具 召回
tool_usage
100.0%
[100.0% – 100.0%] · n=10
F1 100.0% · 召回 100.0% · 精確 100.0%
10 / 10 適用
答得到位 平均
answer_quality
49.7%
[36.7% – 64.0%] · n=10
10 / 10 適用
  • 案例 8C39B3BB

    如何使用假髮要注意什麼?

    已完成
    第 1 次嘗試 · 已完成 26556ms

    載入詳情中…

  • 案例 8D74D961

    退換貨的時間是多久啊?

    已完成
    第 1 次嘗試 · 已完成 26011ms

    載入詳情中…

  • 案例 72926825

    你們的產品有什麼?

    已完成
    第 1 次嘗試 · 已完成 26787ms

    載入詳情中…

  • 案例 4BDCEECB

    請問貴公司的社群媒體帳號有哪一些?

    已完成
    第 1 次嘗試 · 已完成 25154ms

    載入詳情中…

  • 案例 F60666A9

    現在有什麼活動優惠嗎?

    已完成
    第 1 次嘗試 · 已完成 17110ms

    載入詳情中…

  • 案例 56B89FA1

    產品怎麼買啊?

    已完成
    第 1 次嘗試 · 已完成 34626ms

    載入詳情中…

  • 案例 340907D5

    有沒有你們的產品的優惠?

    已完成
    第 1 次嘗試 · 已完成 33856ms

    載入詳情中…

  • 案例 D2691EB7

    你們的粉絲團有什麼資訊?

    已完成
    第 1 次嘗試 · 已完成 31129ms

    載入詳情中…

  • 案例 E4871824

    價格是多少?

    已完成
    第 1 次嘗試 · 已完成 31107ms

    載入詳情中…

  • 案例 CF416FEE

    你們的粉絲團跟 Instagram 是什麼?

    已完成
    第 1 次嘗試 · 已完成 12972ms

    載入詳情中…

項目 III.

對話素養(混合問答)

mixed_qa 3 cases

維度總表

各維度品質分 · 覆蓋率
找對資料 召回
retrieval
不亂編造 平均
faithfulness
0.0%
3 / 3 適用
答得到位 平均
answer_quality
52.2%
[26.7% – 96.7%] · n=3
3 / 3 適用
  • 案例 10146E7E

    要轉接真人客服怎麼做?

    已完成
    第 1 次嘗試 · 已完成 28002ms

    載入詳情中…

  • 案例 DB71CE41

    我想詢問登錄時遇到的問題該怎麼辦?

    已完成
    第 1 次嘗試 · 已完成 19740ms

    載入詳情中…

  • 案例 D179BB46

    統一搜尋需要什麼關鍵字?

    已完成
    第 1 次嘗試 · 已完成 35984ms

    載入詳情中…