執行 #36

AI 智能客服名稱 (bulk R1) → production-canary (canary)

狀態
已完成
案例
15
開始時間
16 May 11:02
耗時
258.0s
¶ Economics · Bot-side N=15 attempts

Cost & Tokens

$0.0871
Total Bot Cost · USD
37.1%
Prompt Cache Hit
cost per case
$0.0058
cost per 1k tokens
$0.0016
input tokens
55,266
output tokens
915
cached tokens — prompt-cache hit
20,480
Total Tokens
56,181
economic efficiency
cost per correct
$0.0017
pass rate
46.7%
7 / 15
judge cost
$0.0117
設定快照(reproducibility) 1 個 bot 已捕捉 · Judge:gpt-4o-mini

Bot 設定快照

  • bcff2b97-5e3e-4dfd-972b-7736bf9598c2 0 筆 KB
    SystemPrompt: sha256:a147cf42 KBContent: sha256:e3b0c442 Tools: sha256:13e5aa51 Scenarios: sha256:6d5a7b39 AI: gpt-4.1-2025-04-14 (T=0.0, max=32768)

Judge 設定快照

model: gpt-4o-mini T=0.0 max=4096 prompt: v1
已完成
15 / 15
錯誤
0
失敗維度
0
首字延遲 p95
3867 ms
Bot 成本(Neptune)
$0.0871
Bot Tokens(Neptune)
56,181
Judge 成本(Eris)
$0.0117
Judge Tokens(Eris)
93,815
項目 II.

情境調用與完成

scenario_funnel 10 cases

維度總表

各維度品質分 · 覆蓋率
走對流程 召回
scenario
100.0%
[100.0% – 100.0%] · n=10
F1 100.0% · 召回 100.0% · 精確 100.0%
10 / 10 適用
用對工具 召回
tool_usage
100.0%
[100.0% – 100.0%] · n=10
F1 100.0% · 召回 100.0% · 精確 100.0%
10 / 10 適用
答得到位 平均
answer_quality
63.7%
[49.3% – 75.3%] · n=10
10 / 10 適用
  • 案例 B721D3B4

    請問現在有什麼活動或優惠可以參加嗎?

    已完成
    第 1 次嘗試 · 已完成 20441ms

    載入詳情中…

  • 案例 930868F9

    這個髮片的價格是多少?

    已完成
    第 1 次嘗試 · 已完成 20435ms

    載入詳情中…

  • 案例 8C1C2EC3

    有沒有抽獎活動啊?

    已完成
    第 1 次嘗試 · 已完成 15697ms

    載入詳情中…

  • 案例 ACD9D12C

    我想知道你們有什麼促銷活動嗎?

    已完成
    第 1 次嘗試 · 已完成 22832ms

    載入詳情中…

  • 案例 FE5C8766

    你們的產品價格是多少?

    已完成
    第 1 次嘗試 · 已完成 16330ms

    載入詳情中…

  • 案例 4F560D7A

    短的問題也可以查詢嗎?

    已完成
    第 1 次嘗試 · 已完成 24685ms

    載入詳情中…

  • 案例 A61522F9

    你們的服務時間是什麼時候?

    已完成
    第 1 次嘗試 · 已完成 22531ms

    載入詳情中…

  • 案例 E0E02567

    查詢資料怎麼做?

    已完成
    第 1 次嘗試 · 已完成 23850ms

    載入詳情中…

  • 案例 E5B9C4C5

    這款髮片的功能和適用對象是什麼呢?

    已完成
    第 1 次嘗試 · 已完成 23833ms

    載入詳情中…

  • 案例 26E315FA

    請問這個產品的價格是多少呢?

    已完成
    第 1 次嘗試 · 已完成 22206ms

    載入詳情中…

項目 III.

對話素養(混合問答)

mixed_qa 5 cases

維度總表

各維度品質分 · 覆蓋率
找對資料 召回
retrieval
不亂編造 平均
faithfulness
50.0%
[0.0% – 100.0%] · n=2
5 / 5 適用
答得到位 平均
answer_quality
38.7%
[28.7% – 50.7%] · n=5
5 / 5 適用
  • 案例 9AF2D19E

    統一搜尋怎麼生成每個地區的關鍵字?

    已完成
    第 1 次嘗試 · 已完成 19805ms

    載入詳情中…

  • 案例 6DC13EF0

    有關聯絡方式是什麼?

    已完成
    第 1 次嘗試 · 已完成 22554ms

    載入詳情中…

  • 案例 85BC7611

    可以查詢之前的對話記錄嗎

    已完成
    第 1 次嘗試 · 已完成 24994ms

    載入詳情中…

  • 案例 749F95AB

    轉接真人客服的回覆要怎麼回?

    已完成
    第 1 次嘗試 · 已完成 19683ms

    載入詳情中…

  • 案例 FDE30962

    我表現出負面情緒時怎麼辦?

    已完成
    第 1 次嘗試 · 已完成 28214ms

    載入詳情中…