康定 CONTIN (bulk R1)
30 個案例 · 3 個產出 · 0 次執行
勘誤 · 過時
Suite 已過時 — 建議重新產出後再 dispatch
KB 32 → 112 (+250.0%)
5分鐘 前檢查
⋯ more
LLM 累計成本(Eris-tracked,含 generations + runs)
$0.0588
419,357 tokens · 204 calls
Generations
$0.0588
204 calls
Runs (Judge)
$0.0000
0 judgements
自動產出案例(多 bot)
送出後將為勾選的每個 bot 派發 2 個 generation(項目一 + 項目二),cases 寫入此套件「康定 CONTIN (bulk R1)」
派發評測
選擇 NeptuneTarget、立即派發此套件「康定 CONTIN (bulk R1)」對該 target 的評測
01
案例 (30)
知識庫精準度
知識庫精準度
情境調用與完成
情境調用與完成
對話素養(混合問答)
對話素養(混合問答)
02
最近執行
此套件尚未有執行紀錄。