Omnichat 測試 (bulk R1)
17 個案例 · 3 個產出 · 2 次執行 · 最後執行 大約1小時 前 · drift ✓ 大約1小時 前
⋯ more
LLM 累計成本(Eris-tracked,含 generations + runs)
$0.0332
235,029 tokens · 114 calls
Generations
$0.0332
114 calls
Runs (Judge)
$0.0000
0 judgements
自動產出案例(多 bot)
送出後將為勾選的每個 bot 派發 2 個 generation(項目一 + 項目二),cases 寫入此套件「Omnichat 測試 (bulk R1)」
派發評測
選擇 NeptuneTarget、立即派發此套件「Omnichat 測試 (bulk R1)」對該 target 的評測
01
案例 (17)
情境調用與完成
情境調用與完成
-
產品的維護和保養是怎麼樣的?📦 #317auto-f1f999dc-r1-053959180-4623f547
關於產品的維護保養,主要包括保養、維修及使用期限。建議定期清潔和檢查產品,並根據使用手冊來進行維護。如果有故障的情況,建議尋求專業維修服務。使用期限則通常取決於產品的具體種類和材料,具體細節可以查詢相關資料。如果需要更詳細的信息,你可以跟真人客服確認一下喔!
- 建議定期清潔和檢查產品
- 根據使用手冊來進行維護
- 如果有故障的情況,建議尋求專業維修服務
- 使用期限通常取決於產品的具體種類和材料
- 具體細節可以查詢相關資料
- 如果需要更詳細的信息,你可以跟真人客服確認一下喔
知識與產品查詢search_unified
對話素養(混合問答)
對話素養(混合問答)
02
最近執行
-
執行 #196production-canary 待執行答得到位—待派發
-
執行 #195production-baseline 待執行答得到位—待派發