AI 智能客服名稱

production env · 1 suites · 2 次完成 run

Subject № d4ddb6f9-3c62-4a91-b137-4888a2613f36 PRODUCTION
評測狀態 · 正常維護

Eval suites 維護中,全部 in sync

2 scenarios · 0 KB items 1 suite
PARTIAL COVERAGE · 1 KIND(S) MISSING

13 cases · AI 智能客服名稱 (bulk R1)

kb_accuracy 0
scenario_funnel 10
mixed_qa 3
uncategorized 0
01

生命徵象

[KIND × DIMENSION] vital signs — this bot's per-dim clearance vs. its baseline
知識庫精準度 [—]
檢索
忠實度
回答品質
情境調用與完成 [FAIL]
情境 100.0% 100.0% ≥95.0% [±5pp] +5.0 ✓
工具使用 100.0% 100.0% ≥95.0% [±5pp] +5.0 ✓
回答品質 64.3% 64.3% <70.0% [floor] -5.7 ✗
對話素養(混合問答) [—]
檢索
忠實度 0.0% 0.0%
回答品質 33.3% 32.2%
02

測試套件