執行 #34

AI 智能客服名稱 (bulk R1) → production-canary (canary)

狀態
已完成
案例
15
開始時間
16 May 11:02
耗時
273.7s
¶ Economics · Bot-side N=15 attempts

Cost & Tokens

$0.1612
Total Bot Cost · USD
49.4%
Prompt Cache Hit
cost per case
$0.0107
cost per 1k tokens
$0.0014
input tokens
113,696
output tokens
2,258
cached tokens — prompt-cache hit
56,192
Total Tokens
115,954
economic efficiency
cost per correct
$0.0065
pass rate
13.3%
2 / 15
judge cost
$0.0129
設定快照(reproducibility) 1 個 bot 已捕捉 · Judge:gpt-4o-mini

Bot 設定快照

  • 710992bb-2b7e-4e4f-a576-6b3878cbcf88 0 筆 KB
    SystemPrompt: sha256:a147cf42 KBContent: sha256:e3b0c442 Tools: sha256:13e5aa51 Scenarios: sha256:505edf42 AI: gpt-4.1-2025-04-14 (T=0.0, max=2048)

Judge 設定快照

model: gpt-4o-mini T=0.0 max=4096 prompt: v1
已完成
15 / 15
錯誤
0
失敗維度
0
首字延遲 p95
4190 ms
Bot 成本(Neptune)
$0.1612
Bot Tokens(Neptune)
115,954
Judge 成本(Eris)
$0.0129
Judge Tokens(Eris)
96,960
項目 II.

情境調用與完成

scenario_funnel 10 cases

維度總表

各維度品質分 · 覆蓋率
走對流程 召回
scenario
100.0%
[100.0% – 100.0%] · n=10
F1 100.0% · 召回 100.0% · 精確 100.0%
10 / 10 適用
用對工具 召回
tool_usage
100.0%
[100.0% – 100.0%] · n=10
F1 100.0% · 召回 100.0% · 精確 100.0%
10 / 10 適用
答得到位 平均
answer_quality
45.7%
[36.0% – 58.0%] · n=10
10 / 10 適用
  • 案例 5D6EA1C5

    你們的粉絲團在哪裡可以找得到?

    已完成
    第 1 次嘗試 · 已完成 36397ms

    載入詳情中…

  • 案例 4D35A315

    這個髮片怎麼使用?

    已完成
    第 1 次嘗試 · 已完成 30953ms

    載入詳情中…

  • 案例 7289F37A

    請問你們的服務時間是多久?還有退換貨的政策是什麼呢?

    已完成
    第 1 次嘗試 · 已完成 29511ms

    載入詳情中…

  • 案例 B47B3FB8

    請問目前有哪些活動或者促銷資訊呢?

    已完成
    第 1 次嘗試 · 已完成 33106ms

    載入詳情中…

  • 案例 50A93B92

    有沒有目前的優惠活動或抽獎?

    已完成
    第 1 次嘗試 · 已完成 21167ms

    載入詳情中…

  • 案例 91A3220E

    請問有關最近活動的信息,包括報名和優惠的詳細資料嗎?

    已完成
    第 1 次嘗試 · 已完成 38117ms

    載入詳情中…

  • 案例 65105406

    首次使用這款髮片需要注意什麼嗎?

    已完成
    第 1 次嘗試 · 已完成 52854ms

    載入詳情中…

  • 案例 A4ED48DF

    貴公司的粉絲專頁在哪裡可以找到呢?

    已完成
    第 1 次嘗試 · 已完成 33343ms

    載入詳情中…

  • 案例 A9430A77

    我想知道你們的優惠活動有什麼嗎?

    已完成
    第 1 次嘗試 · 已完成 24667ms

    載入詳情中…

  • 案例 A989404A

    我有關於你們產品的問題,請問能搜尋一下嗎?

    已完成
    第 1 次嘗試 · 已完成 42165ms

    載入詳情中…

項目 III.

對話素養(混合問答)

mixed_qa 5 cases

維度總表

各維度品質分 · 覆蓋率
找對資料 召回
retrieval
不亂編造 平均
faithfulness
0.0%
[0.0% – 0.0%] · n=2
5 / 5 適用
答得到位 平均
answer_quality
46.7%
[40.7% – 55.3%] · n=5
5 / 5 適用
  • 案例 1F4C9A34

    這個統一搜尋可以處理什麼資料來源?

    已完成
    第 1 次嘗試 · 已完成 31740ms

    載入詳情中…

  • 案例 CA56D463

    我可以轉接真人客服嗎?

    已完成
    第 1 次嘗試 · 已完成 16802ms

    載入詳情中…

  • 案例 E078B369

    請問怎麼轉接到人類客服代理?

    已完成
    第 1 次嘗試 · 已完成 24017ms

    載入詳情中…

  • 案例 422E1B54

    請問查詢問題包含問號會怎麼處理?

    已完成
    第 1 次嘗試 · 已完成 31659ms

    載入詳情中…

  • 案例 7BA860D0

    查詢歷史對話要怎麼做?

    已完成
    第 1 次嘗試 · 已完成 32419ms

    載入詳情中…