產出 #684
env=production · 肯媒AI by DC (077ecc09-41af-4627-9aec-bac5c718736a) · eval_kind=mixed_qa
已完成
10 / 10
10
0 / 4
$0.0228
↑174246 / ↓6151
MISSED
4 個 scenario 未被任何 case 涵蓋:
999, 1001, 1000, 1002。可以重新派發、增加 N 來補。
SUITE
✅ 已寫入 EvalSuite auto-077ecc09-r1-054000503。
案例明細(35 筆 — 含已寫入、被拒、retry 軌跡)
-
已寫入 EvalSuite 直接問答來源素材(點擊查看完整內容)
-
• 知識:轉換率怎麼算? know_91318
Q: 轉換率怎麼算? A: conversion_rate = 購買次數 / 工作階段數,代表訪客轉換為訂單的比例。
Q請問轉換率代表什麼意思?A轉換率代表訪客轉換為訂單的比例。 -
-
語氣不像真人 chat(被 Stage E 拒絕) 直接問答來源素材(點擊查看完整內容)
-
• 工具:統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) 20
統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) (search_unified) Hybrid search (BM25 + vector) with multi-lane RRF fusion across ALL source types (knowledge, product, link, doc_knowledge, doc_product, vision). MUST generate 3 diverse vector queries AND per-locale BM25 keywords.
Q統一搜尋的 BM25 和向量融合技術是什麼?A統一搜尋使用了多通道的 BM25 與向量 RRF 融合技術,支援五種資料來源類型。原因- chat-realism: internal_role_title (The question references 'BM25' and '向量融合技術', which suggests a technical or internal context that a typical customer w...)
-
-
語氣不像真人 chat(被 Stage E 拒絕) 直接問答 第 2 次嘗試來源素材(點擊查看完整內容)
-
• 工具:統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) 20
統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) (search_unified) Hybrid search (BM25 + vector) with multi-lane RRF fusion across ALL source types (knowledge, product, link, doc_knowledge, doc_product, vision). MUST generate 3 diverse vector queries AND per-locale BM25 keywords.
Q統一搜尋的 BM25 與向量 RRF 融合技術是什麼?A統一搜尋的融合技術是使用 multi-lane BM25 與向量 RRF,支援 5 種 source_type。這種技術能生成 3 個多樣的向量查詢以及每個地區的 BM25 關鍵字。原因- chat-realism: internal_role_title (The question references 'BM25' and '向量 RRF 融合技術', which suggests a technical or internal role context that a typical ...)
-
-
語氣不像真人 chat(被 Stage E 拒絕) 直接問答 第 3 次嘗試來源素材(點擊查看完整內容)
-
• 工具:統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) 20
統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) (search_unified) Hybrid search (BM25 + vector) with multi-lane RRF fusion across ALL source types (knowledge, product, link, doc_knowledge, doc_product, vision). MUST generate 3 diverse vector queries AND per-locale BM25 keywords.
Q統一搜尋的技術融合是什麼?A統一搜尋使用 multi-lane BM25 與向量 RRF 融合技術,支援 5 種 source_type。原因- chat-realism: vague_meta (The question is vague and asks about company-wide technology integration, which is not a concrete customer inquiry.)
-
-
語氣不像真人 chat(被 Stage E 拒絕) 直接問答來源素材(點擊查看完整內容)
-
• 對話流程:轉接真人客服 999
轉接真人客服 ## 1. 觸發條件 - 線上客服/轉線上客服 - 在線客服/轉在線客服 - 真人客服/轉真人客服 - 轉真人/找真人 - Direct transfer request - Emotional escalation - Resolution failure 轉接真人客服的 Agent 情景 ## 4. 回覆規則 - Acknowledge situation - Return transfer response in specified format
Q請問轉接真人客服時回覆的格式是什麼?A轉接真人客服的回覆會以指定格式返回。原因- chat-realism: internal_role_title (The question references '真人客服' in a way that suggests an internal understanding of roles, which a typical customer wo...)
-
-
語氣不像真人 chat(被 Stage E 拒絕) 直接問答 第 2 次嘗試來源素材(點擊查看完整內容)
-
• 對話流程:轉接真人客服 999
轉接真人客服 ## 1. 觸發條件 - 線上客服/轉線上客服 - 在線客服/轉在線客服 - 真人客服/轉真人客服 - 轉真人/找真人 - Direct transfer request - Emotional escalation - Resolution failure 轉接真人客服的 Agent 情景 ## 4. 回覆規則 - Acknowledge situation - Return transfer response in specified format
Q請問轉接真人客服的回覆格式是什麼呢?A轉接真人客服的回覆必須以指定格式返回。原因- chat-realism: internal_role_title (The question references '真人客服' in a way that suggests an internal understanding of roles, which a typical customer wo...)
-
-
語氣不像真人 chat(被 Stage E 拒絕) 直接問答 第 3 次嘗試來源素材(點擊查看完整內容)
-
• 對話流程:轉接真人客服 999
轉接真人客服 ## 1. 觸發條件 - 線上客服/轉線上客服 - 在線客服/轉在線客服 - 真人客服/轉真人客服 - 轉真人/找真人 - Direct transfer request - Emotional escalation - Resolution failure 轉接真人客服的 Agent 情景 ## 4. 回覆規則 - Acknowledge situation - Return transfer response in specified format
Q請問轉接真人客服的回覆格式是什麼?A轉接真人客服的回覆必須以指定格式返回。原因- chat-realism: internal_role_title (The question references '真人客服' in a way that suggests an internal understanding of roles, which a typical customer wo...)
-
-
語氣不像真人 chat(被 Stage E 拒絕) 直接問答來源素材(點擊查看完整內容)
-
• 知識:廣告轉換數是什麼? know_91328
Q: 廣告轉換數是什麼? A: conversion,代表廣告帶來的轉換事件數。
Q廣告轉換數是什麼?A廣告轉換數代表廣告帶來的轉換事件數。原因- chat-realism: vague_meta (The question is vague and asks about a general concept rather than a specific product or service.)
-
-
其他 直接問答 第 2 次嘗試來源素材(點擊查看完整內容)
-
• 知識:廣告轉換數是什麼? know_91328
Q: 廣告轉換數是什麼? A: conversion,代表廣告帶來的轉換事件數。
Q廣告轉換數是什麼?A廣告轉換數代表廣告帶來的轉換事件數。原因- duplicate (scenario, question)
-
-
其他 直接問答 第 3 次嘗試來源素材(點擊查看完整內容)
-
• 知識:廣告轉換數是什麼? know_91328
Q: 廣告轉換數是什麼? A: conversion,代表廣告帶來的轉換事件數。
Q廣告轉換數是什麼?A廣告轉換數代表廣告帶來的轉換事件數。原因- duplicate (scenario, question)
-
-
已寫入 EvalSuite 直接問答來源素材(點擊查看完整內容)
-
• 知識:短網址轉換數是什麼? know_91325
Q: 短網址轉換數是什麼? A: conversions,代表短網址帶來的轉換事件總數。
Q短網址轉換數是什麼?A短網址轉換數是 conversions,代表短網址帶來的轉換事件總數。 -
-
已寫入 EvalSuite 直接問答來源素材(點擊查看完整內容)
-
• 知識:商品加入購物車次數是什麼? know_91320
Q: 商品加入購物車次數是什麼? A: total_add_to_cart,代表使用者將商品加入購物車的次數。
Q商品加入購物車次數是什麼?Atotal_add_to_cart,代表使用者將商品加入購物車的次數。 -
-
已寫入 EvalSuite 直接問答來源素材(點擊查看完整內容)
-
• 知識:商品瀏覽次數是什麼? know_91319
Q: 商品瀏覽次數是什麼? A: total_item_view,代表商品頁被瀏覽的次數。
Q請問商品瀏覽次數的英文名稱是什麼?A商品瀏覽次數的英文名稱是 total_item_view,代表商品頁被瀏覽的次數。 -
-
已寫入 EvalSuite 直接問答來源素材(點擊查看完整內容)
-
• 知識:廣告點擊數是什麼? know_91327
Q: 廣告點擊數是什麼? A: clicks,代表使用者點擊廣告的次數。
Q請問廣告點擊數是什麼?A廣告點擊數是代表使用者點擊廣告的次數。 -
-
已寫入 EvalSuite 直接問答來源素材(點擊查看完整內容)
-
• 知識:廣告費用是什麼? know_91330
Q: 廣告費用是什麼? A: cost,代表廣告在該期間內的花費。
Q廣告費用是什麼意思?A廣告費用代表在該期間內的花費。 -
-
語氣不像真人 chat(被 Stage E 拒絕) 直接問答來源素材(點擊查看完整內容)
-
• 知識:官網流量是什麼? know_91312
Q: 官網流量是什麼? A: 官網流量對應欄位為 total_users,代表特定期間內造訪網站的使用者總數。
Q官網流量對應的欄位是什麼?A官網流量對應欄位為 total_users,代表特定期間內造訪網站的使用者總數。原因- chat-realism: internal_role_title (The question references '官網流量對應的欄位', which suggests an internal company context that a typical customer wouldn't ment...)
-
-
語氣不像真人 chat(被 Stage E 拒絕) 直接問答 第 2 次嘗試來源素材(點擊查看完整內容)
-
• 知識:官網流量是什麼? know_91312
Q: 官網流量是什麼? A: 官網流量對應欄位為 total_users,代表特定期間內造訪網站的使用者總數。
Q請問官網流量對應的欄位是什麼?A官網流量對應欄位為 total_users,代表特定期間內造訪網站的使用者總數。原因- chat-realism: internal_role_title (提到的'官網流量'和'欄位'顯示出對內部數據的關注,這不是一般顧客會詢問的問題。)
-
-
其他 直接問答 第 3 次嘗試來源素材(點擊查看完整內容)
-
• 知識:官網流量是什麼? know_91312
Q: 官網流量是什麼? A: 官網流量對應欄位為 total_users,代表特定期間內造訪網站的使用者總數。
Q官網流量對應的欄位是什麼?A官網流量對應欄位為 total_users,代表特定期間內造訪網站的使用者總數。原因- duplicate (scenario, question)
-
-
已寫入 EvalSuite 直接問答來源素材(點擊查看完整內容)
-
• 知識:CTR 是什麼? know_91332
Q: CTR 是什麼? A: CTR = 點擊數 / 曝光數,代表點擊率。
QCTR 是什麼意思?ACTR = 點擊數 / 曝光數,代表點擊率。 -
-
語氣不像真人 chat(被 Stage E 拒絕) 直接問答來源素材(點擊查看完整內容)
-
• 知識:商品購買次數是什麼? know_91321
Q: 商品購買次數是什麼? A: total_item_purchase,代表商品被成功購買的次數。
Q商品購買次數是什麼?Atotal_item_purchase,代表商品被成功購買的次數。原因- chat-realism: vague_meta (The question is vague and asks about company-wide metrics rather than a specific product or service.)
-