執行 #42

AI 智能客服名稱 (bulk R1) → production-canary (canary)

狀態
已完成
案例
14
開始時間
16 May 11:05
耗時
522.7s
¶ Economics · Bot-side N=14 attempts

Cost & Tokens

$0.0570
Total Bot Cost · USD
70.8%
Prompt Cache Hit
cost per case
$0.0041
cost per 1k tokens
$0.0010
input tokens
53,685
output tokens
835
cached tokens — prompt-cache hit
38,016
Total Tokens
54,520
economic efficiency
cost per correct
$0.0023
pass rate
35.7%
5 / 14
judge cost
$0.0114
設定快照(reproducibility) 1 個 bot 已捕捉 · Judge:gpt-4o-mini

Bot 設定快照

  • 0b7a5701-420a-4cca-852d-3b4808e7e2fa 0 筆 KB
    SystemPrompt: sha256:a147cf42 KBContent: sha256:e3b0c442 Tools: sha256:13e5aa51 Scenarios: sha256:750d6d3e AI: gpt-4.1-2025-04-14 (T=0.0, max=2048)

Judge 設定快照

model: gpt-4o-mini T=0.0 max=4096 prompt: v1
已完成
14 / 14
錯誤
0
失敗維度
0
首字延遲 p95
7351 ms
Bot 成本(Neptune)
$0.0570
Bot Tokens(Neptune)
54,520
Judge 成本(Eris)
$0.0114
Judge Tokens(Eris)
89,752
項目 II.

情境調用與完成

scenario_funnel 10 cases

維度總表

各維度品質分 · 覆蓋率
走對流程 召回
scenario
100.0%
[100.0% – 100.0%] · n=10
F1 100.0% · 召回 100.0% · 精確 100.0%
10 / 10 適用
用對工具 召回
tool_usage
100.0%
[100.0% – 100.0%] · n=10
F1 100.0% · 召回 100.0% · 精確 100.0%
10 / 10 適用
答得到位 平均
answer_quality
55.3%
[41.0% – 70.0%] · n=10
10 / 10 適用
  • 案例 1A8A5161

    最近有什麼活動或優惠嗎?

    已完成
    第 1 次嘗試 · 已完成 33461ms

    載入詳情中…

  • 案例 D202CF91

    你們有什麼活動或優惠嗎?

    已完成
    第 1 次嘗試 · 已完成 29213ms

    載入詳情中…

  • 案例 F9761D32

    我登入的時候出現錯誤怎麼回事?

    已完成
    第 1 次嘗試 · 已完成 34157ms

    載入詳情中…

  • 案例 D73E47D1

    你們的服務時間是多久?

    已完成
    第 1 次嘗試 · 已完成 24957ms

    載入詳情中…

  • 案例 329E34E5

    怎麼安裝假髮?

    已完成
    第 1 次嘗試 · 已完成 26427ms

    載入詳情中…

  • 案例 5300F683

    你們的價格是多少?

    已完成
    第 1 次嘗試 · 已完成 29550ms

    載入詳情中…

  • 案例 59B29153

    我用的帳號登入不進去,怎麼辦?

    已完成
    第 1 次嘗試 · 已完成 20619ms

    載入詳情中…

  • 案例 ABF9B940

    你們的粉絲專頁在哪裡可以找到?

    已完成
    第 1 次嘗試 · 已完成 34390ms

    載入詳情中…

  • 案例 E686E834

    你們的粉絲團和官網是什麼嗎?

    已完成
    第 1 次嘗試 · 已完成 17991ms

    載入詳情中…

  • 案例 EE65F619

    有沒有現在可以報名的活動?

    已完成
    第 1 次嘗試 · 已完成 20069ms

    載入詳情中…

項目 III.

對話素養(混合問答)

mixed_qa 4 cases

維度總表

各維度品質分 · 覆蓋率
找對資料 召回
retrieval
不亂編造 平均
faithfulness
0.0%
[0.0% – 0.0%] · n=2
4 / 4 適用
答得到位 平均
answer_quality
55.0%
[33.3% – 76.7%] · n=4
4 / 4 適用
  • 案例 195623A8

    get_history 不帶參數會回什麼?

    已完成
    第 1 次嘗試 · 已完成 36128ms

    載入詳情中…

  • 案例 742726C9

    什麼情況會轉接真人客服?

    已完成
    第 1 次嘗試 · 已完成 37181ms

    載入詳情中…

  • 案例 880D6A7E

    如果AI一直不能回答我的問題,怎麼辦?

    已完成
    第 1 次嘗試 · 已完成 20835ms

    載入詳情中…

  • 案例 FDE2DFD7

    服務時間是什麼時候?

    已完成
    第 1 次嘗試 · 已完成 24808ms

    載入詳情中…