執行 #251
Whoscall bot (bulk R1) → production-baseline
- 狀態
- 已完成
- 案例
- 13
- 開始時間
- 16 May 12:40
- 耗時
- 303.5s
Cost & Tokens
$0.0448
Total Bot Cost · USD
79.7%
Prompt Cache Hit
- cost per case
- $0.0034
- cost per 1k tokens
- $0.0009
- input tokens
- 47,855
- output tokens
- 789
- cached tokens — prompt-cache hit
- 38,144
- Total Tokens
- 48,644
- cost per correct
- $0.0022
- pass rate
- 38.5%
- 5 / 13
- judge cost
- $0.0111
設定快照(reproducibility)
Bot 設定快照
-
07dc3a37-5644-448d-9f76-dd779f27f8d2
Judge 設定快照
model: gpt-4o-mini
T=0.0
max=4096
prompt: v1
13 / 13
0
0
4031 ms
$0.0448
48,644
$0.0111
86,136
情境調用與完成
情境調用與完成
維度總表
走對流程
召回
scenario
100.0%
[100.0% – 100.0%] · n=10
F1 100.0% · 召回 100.0% · 精確 100.0%
10 / 10 適用
用對工具
召回
tool_usage
100.0%
[100.0% – 100.0%] · n=10
F1 100.0% · 召回 100.0% · 精確 100.0%
10 / 10 適用
答得到位
平均
answer_quality
65.0%
[56.0% – 73.7%] · n=10
10 / 10 適用
-
案例 F3135430
查詢短問題會怎麼處理?
第 1 次嘗試 · 已完成 10201ms載入詳情中…
-
案例 024C5D09
我想要知道你們的產品資訊查詢工具是怎麼運作的?
第 1 次嘗試 · 已完成 11791ms載入詳情中…
-
案例 4126B70A
這個產品使用方式怎麼樣呢?
第 1 次嘗試 · 已完成 9728ms載入詳情中…
-
案例 32523724
你們的產品查詢是怎麼處理的?
第 1 次嘗試 · 已完成 12280ms載入詳情中…
-
案例 5A98204A
短的問題會比較快處理嗎?
第 1 次嘗試 · 已完成 10841ms載入詳情中…
-
案例 1B38953A
我想知道髮片的價格是多少?
第 1 次嘗試 · 已完成 15176ms載入詳情中…
-
案例 31119C0F
查詢產品需要什麼資訊?
第 1 次嘗試 · 已完成 9201ms載入詳情中…
-
案例 1CF8DDD7
那個知識查詢是怎麼運作的?
第 1 次嘗試 · 已完成 10618ms載入詳情中…
-
案例 BEF5300C
知識查詢的時候,回覆必須保持語言一致性嗎?
第 1 次嘗試 · 已完成 9697ms載入詳情中…
-
案例 EC80FA33
你們的回覆會不會語言混合?
第 1 次嘗試 · 已完成 14908ms載入詳情中…
對話素養(混合問答)
對話素養(混合問答)
維度總表
找對資料
召回
retrieval
—
—
不亂編造
平均
faithfulness
50.0%
[0.0% – 100.0%] · n=2
3 / 3 適用
答得到位
平均
answer_quality
47.8%
[26.7% – 73.3%] · n=3
3 / 3 適用
-
案例 7E48518F
請問可以轉接至人類客服代理嗎?
第 1 次嘗試 · 已完成 9923ms載入詳情中…
-
案例 4573B130
轉接真人客服需要確認什麼情況?
第 1 次嘗試 · 已完成 10946ms載入詳情中…
-
案例 9C9EFA9A
你們的粉絲團在什麼平台?
第 1 次嘗試 · 已完成 10120ms載入詳情中…