產出 #557
env=production · 彭于晏 (69567f06-d3d2-494b-a6c8-60fe0ec2bf02) · eval_kind=scenario_funnel
已完成
10 / 10
10
5 / 6
$0.0225
↑169396 / ↓6136
MISSED
1 個 scenario 未被任何 case 涵蓋:
288。可以重新派發、增加 N 來補。
SUITE
✅ 已寫入 EvalSuite auto-69567f06-r1-054000147。
案例明細(34 筆 — 含已寫入、被拒、retry 軌跡)
-
已寫入 EvalSuite scenario_focused來源素材(點擊查看完整內容)
-
• 對話流程:姓名電話 2821
姓名電話 ## 1. 觸發條件 - 詢問顧客的姓名電話並儲存欄位 ## 2. 資訊收集 ### 電話 — 使用者電話號碼,例如:0912345678 這種格式 - 電話 [number]: 使用者電話號碼,例如:0912345678 這種格式 ## 3. API 工具 1. update_user_tags — 使用者標籤管理工具 **功能:** - 新增標籤:將指定標籤加入使用者,自動去重 - 移除標籤:從使用者移除指定標籤,不存在則忽略 **注意:** user_id 由系統自動注入,無需提供。 ## 4. 回覆規則 - 取得客戶姓名電話
Q請問我需要提供什麼資訊來幫您儲存我的姓名和電話呢?A我需要您的姓名和電話號碼來儲存這些資訊,請問可以告訴我嗎? -
-
已寫入 EvalSuite scenario_focused來源素材(點擊查看完整內容)
-
• 對話流程:訂單查詢 291
訂單查詢 ## 1. 觸發條件 - When user has questions about specific order details, shipping status, or purchase history (only after user provides required personal info). 訂單查詢的 Agent 情景 ## 3. API 工具 1. shopline_search_orders — 搜尋 Shopline 訂單資訊。使用自然語言查詢(如「我的訂單編號是: TS100001」、「電話是:0970981389」),系統會自動提取訂單識別資訊進行搜尋。返回客服友善格式,包含訂單狀態、物流進度、追蹤連結等完整資訊。 ## 4. 回覆規則 - Provide clear and concise answers based on order search results from tool messages If multiple relevant orders found, combine them logically If no relevant order found, acknowledge and offer to check with customer service
Q我的訂單編號是 TS100001,請幫我查詢一下A好的,我將查詢您的訂單編號 TS100001 的詳細資訊,稍等一下。若查詢成功,我會提供訂單狀態和物流進度等完整資訊。 -
-
語氣不像真人 chat(被 Stage E 拒絕) scenario_focused來源素材(點擊查看完整內容)
-
• 對話流程:FAQ查詢 289
FAQ查詢 ## 1. 觸發條件 - 品牌問題 - 平台規則 - 常見問題 - 知識庫 - 問答 - 品牌相關問題 FAQ 查詢的 Agent 情景 ## 2. 資訊收集 ### search_parameters — 搜尋參數 - query [string] (必填): 用戶當前最想查詢或了解的重點問題或主題(3-20字短語,聚焦最新意圖,排除已解決或無關內容) - keywords_or_codes [array] (必填): 用戶訊息中出現的所有代碼或標籤(如C90012、T1234等),如無則為空陣列 ## 3. API 工具 1. search_knowledges — 搜尋相關FAQ回答用戶問題 ## 4. 回覆規則 - All answer must be based on content output from <tool: search_knowledges>, never fabricate. - If multiple relevant answers found, combine them logically and clarify with the user. - If unable to answer, clearly explain and suggest human customer service assistance. - Strictly prohibit referencing, rewriting, or mixing content outside of <tool: search_knowledges> outputs.
Q你們的品牌問題有什麼常見的FAQ?A我們的品牌問題常見FAQ包括平台規則、知識庫和相關問答等,具體內容可以幫您查詢。請告訴我您最想了解的問題或主題,我將協助搜尋相關的解答。原因- chat-realism: vague_meta (The question is vague and asks about company-wide reputation rather than specific information.)
-
-
語氣不像真人 chat(被 Stage E 拒絕) scenario_focused 第 2 次嘗試來源素材(點擊查看完整內容)
-
• 對話流程:FAQ查詢 289
FAQ查詢 ## 1. 觸發條件 - 品牌問題 - 平台規則 - 常見問題 - 知識庫 - 問答 - 品牌相關問題 FAQ 查詢的 Agent 情景 ## 2. 資訊收集 ### search_parameters — 搜尋參數 - query [string] (必填): 用戶當前最想查詢或了解的重點問題或主題(3-20字短語,聚焦最新意圖,排除已解決或無關內容) - keywords_or_codes [array] (必填): 用戶訊息中出現的所有代碼或標籤(如C90012、T1234等),如無則為空陣列 ## 3. API 工具 1. search_knowledges — 搜尋相關FAQ回答用戶問題 ## 4. 回覆規則 - All answer must be based on content output from <tool: search_knowledges>, never fabricate. - If multiple relevant answers found, combine them logically and clarify with the user. - If unable to answer, clearly explain and suggest human customer service assistance. - Strictly prohibit referencing, rewriting, or mixing content outside of <tool: search_knowledges> outputs.
Q你們的品牌問題是什麼?A品牌問題的查詢會包括有關品牌的常見疑問和知識,我可以幫你查詢相關的 FAQ 回答。請問你具體想了解什麼問題呢?原因- chat-realism: vague_meta (這個問題是關於公司整體的聲譽,顯得過於模糊,不像真實顧客會問的具體問題。)
-
-
語氣不像真人 chat(被 Stage E 拒絕) scenario_focused 第 3 次嘗試來源素材(點擊查看完整內容)
-
• 對話流程:FAQ查詢 289
FAQ查詢 ## 1. 觸發條件 - 品牌問題 - 平台規則 - 常見問題 - 知識庫 - 問答 - 品牌相關問題 FAQ 查詢的 Agent 情景 ## 2. 資訊收集 ### search_parameters — 搜尋參數 - query [string] (必填): 用戶當前最想查詢或了解的重點問題或主題(3-20字短語,聚焦最新意圖,排除已解決或無關內容) - keywords_or_codes [array] (必填): 用戶訊息中出現的所有代碼或標籤(如C90012、T1234等),如無則為空陣列 ## 3. API 工具 1. search_knowledges — 搜尋相關FAQ回答用戶問題 ## 4. 回覆規則 - All answer must be based on content output from <tool: search_knowledges>, never fabricate. - If multiple relevant answers found, combine them logically and clarify with the user. - If unable to answer, clearly explain and suggest human customer service assistance. - Strictly prohibit referencing, rewriting, or mixing content outside of <tool: search_knowledges> outputs.
Q有關平台規則的問題是什麼?A有關平台規則的問題通常包括使用條款、服務政策及其他用戶必須遵循的規則。如果你有具體的疑問,請告訴我,我可以幫你查詢相關的FAQ。原因- chat-realism: vague_meta (這個問題過於模糊,涉及公司整體的規則,而不是具體的問題。)
-
-
已寫入 EvalSuite scenario_focused來源素材(點擊查看完整內容)
-
• 對話流程:訂單查詢 291
訂單查詢 ## 1. 觸發條件 - When user has questions about specific order details, shipping status, or purchase history (only after user provides required personal info). 訂單查詢的 Agent 情景 ## 3. API 工具 1. shopline_search_orders — 搜尋 Shopline 訂單資訊。使用自然語言查詢(如「我的訂單編號是: TS100001」、「電話是:0970981389」),系統會自動提取訂單識別資訊進行搜尋。返回客服友善格式,包含訂單狀態、物流進度、追蹤連結等完整資訊。 ## 4. 回覆規則 - Provide clear and concise answers based on order search results from tool messages If multiple relevant orders found, combine them logically If no relevant order found, acknowledge and offer to check with customer service
Q我的訂單跟蹤連結是什麼?A請提供您的訂單編號或聯絡電話,我會幫您查詢訂單狀態、物流進度和追蹤連結等完整資訊。 -
-
已寫入 EvalSuite scenario_focused來源素材(點擊查看完整內容)
-
• 對話流程:新增情境 2133
新增情境 ## 1. 觸發條件 - 當客人問到「帥」相關問題時 ## 4. 回覆規則 - 請照著訓練文件的方式去思考該如何回答,不能說超出範圍
-
• 知識:誰是帥哥 know_153556
Q: 誰是帥哥 A: Eddie 尤其是姓林的
-
• 知識:誰跟彭于晏很像 know_153557
Q: 誰跟彭于晏很像 A: Eddie 尤其是姓林的
Q誰是你們認為的帥哥?AEddie 尤其是姓林的。 -
-
已寫入 EvalSuite scenario_focused來源素材(點擊查看完整內容)
-
• 對話流程:訂單查詢 291
訂單查詢 ## 1. 觸發條件 - When user has questions about specific order details, shipping status, or purchase history (only after user provides required personal info). 訂單查詢的 Agent 情景 ## 3. API 工具 1. shopline_search_orders — 搜尋 Shopline 訂單資訊。使用自然語言查詢(如「我的訂單編號是: TS100001」、「電話是:0970981389」),系統會自動提取訂單識別資訊進行搜尋。返回客服友善格式,包含訂單狀態、物流進度、追蹤連結等完整資訊。 ## 4. 回覆規則 - Provide clear and concise answers based on order search results from tool messages If multiple relevant orders found, combine them logically If no relevant order found, acknowledge and offer to check with customer service
Q我的訂單狀態跟物流進度怎麼查?A請提供你的訂單編號或聯絡電話,我可以幫你查詢訂單狀態、物流進度和追蹤連結等完整資訊。 -
-
已寫入 EvalSuite scenario_focused來源素材(點擊查看完整內容)
-
• 對話流程:產品查詢 290
產品查詢 ## 1. 觸發條件 - 商品/產品 - 推薦/介紹 - 我想要/我需要 產品查詢的 Agent 情景 ## 2. 資訊收集 ### product_search_parameters — 商品搜尋參數 - query [string] (必填): 用戶當前最想查詢或推薦的商品、需求或關鍵主題(3-20字短語,聚焦最新意圖,排除已解決或無關內容) - keywords_or_codes [array] (必填): 用戶訊息中出現的所有商品關鍵字、型號、代碼,如無則為空陣列 ## 3. API 工具 1. search_products — 搜尋相關產品或服務資訊 ## 4. 回覆規則 - All recommendations must be based on content output from <tool: search_products>, never fabricate. - If multiple relevant orders found, combine them logically - If unable to recommend, clearly explain and suggest human customer service assistance. - Strictly prohibit referencing, rewriting, or mixing content outside of <tool: search_products> outputs.
Q我想查詢一下你們有什麼適合稀疏髮型的髮片?A我可以幫你搜尋適合稀疏髮型的髮片,請稍等一下。 -
-
已寫入 EvalSuite scenario_focused來源素材(點擊查看完整內容)
-
• 對話流程:產品查詢 290
產品查詢 ## 1. 觸發條件 - 商品/產品 - 推薦/介紹 - 我想要/我需要 產品查詢的 Agent 情景 ## 2. 資訊收集 ### product_search_parameters — 商品搜尋參數 - query [string] (必填): 用戶當前最想查詢或推薦的商品、需求或關鍵主題(3-20字短語,聚焦最新意圖,排除已解決或無關內容) - keywords_or_codes [array] (必填): 用戶訊息中出現的所有商品關鍵字、型號、代碼,如無則為空陣列 ## 3. API 工具 1. search_products — 搜尋相關產品或服務資訊 ## 4. 回覆規則 - All recommendations must be based on content output from <tool: search_products>, never fabricate. - If multiple relevant orders found, combine them logically - If unable to recommend, clearly explain and suggest human customer service assistance. - Strictly prohibit referencing, rewriting, or mixing content outside of <tool: search_products> outputs.
Q我想查詢一下商品的資訊,我需要提供什麼關鍵字或型號嗎?A在查詢商品時,您需要提供您最想查詢的商品、需求或關鍵主題(3-20字短語),以及所有相關的商品關鍵字、型號或代碼。如果沒有相關的關鍵字或型號,可以留空。 -
-
品質檢查未通過 scenario_focused來源素材(點擊查看完整內容)
-
• 對話流程:姓名電話 2821
姓名電話 ## 1. 觸發條件 - 詢問顧客的姓名電話並儲存欄位 ## 2. 資訊收集 ### 電話 — 使用者電話號碼,例如:0912345678 這種格式 - 電話 [number]: 使用者電話號碼,例如:0912345678 這種格式 ## 3. API 工具 1. update_user_tags — 使用者標籤管理工具 **功能:** - 新增標籤:將指定標籤加入使用者,自動去重 - 移除標籤:從使用者移除指定標籤,不存在則忽略 **注意:** user_id 由系統自動注入,無需提供。 ## 4. 回覆規則 - 取得客戶姓名電話
Q我可以提供我的姓名電話嗎?A請提供您的電話號碼,例如:0912345678,我會為您儲存。值得注意的是,使用者的 user_id 會由系統自動注入,您無需手動提供。原因- 答案中偵測到台灣手機號碼格式 —— 為避免 PII 外洩自動過濾
-
-
品質檢查未通過 scenario_focused 第 2 次嘗試來源素材(點擊查看完整內容)
-
• 對話流程:姓名電話 2821
姓名電話 ## 1. 觸發條件 - 詢問顧客的姓名電話並儲存欄位 ## 2. 資訊收集 ### 電話 — 使用者電話號碼,例如:0912345678 這種格式 - 電話 [number]: 使用者電話號碼,例如:0912345678 這種格式 ## 3. API 工具 1. update_user_tags — 使用者標籤管理工具 **功能:** - 新增標籤:將指定標籤加入使用者,自動去重 - 移除標籤:從使用者移除指定標籤,不存在則忽略 **注意:** user_id 由系統自動注入,無需提供。 ## 4. 回覆規則 - 取得客戶姓名電話
Q請問我需要提供什麼才能更新我的姓名和電話資訊?A您只需提供您的電話號碼,例如:0912345678,姓名則會自動取得。請注意,user_id 由系統自動注入,無需手動提供。原因- 答案中偵測到台灣手機號碼格式 —— 為避免 PII 外洩自動過濾
-
-
品質檢查未通過 scenario_focused 第 3 次嘗試來源素材(點擊查看完整內容)
-
• 對話流程:姓名電話 2821
姓名電話 ## 1. 觸發條件 - 詢問顧客的姓名電話並儲存欄位 ## 2. 資訊收集 ### 電話 — 使用者電話號碼,例如:0912345678 這種格式 - 電話 [number]: 使用者電話號碼,例如:0912345678 這種格式 ## 3. API 工具 1. update_user_tags — 使用者標籤管理工具 **功能:** - 新增標籤:將指定標籤加入使用者,自動去重 - 移除標籤:從使用者移除指定標籤,不存在則忽略 **注意:** user_id 由系統自動注入,無需提供。 ## 4. 回覆規則 - 取得客戶姓名電話
Q你們需要我的姓名和電話嗎?A是的,我需要你的姓名和電話來完成儲存。請告訴我你的電話號碼,例如:0912345678。原因- 答案中偵測到台灣手機號碼格式 —— 為避免 PII 外洩自動過濾
-
-
Judge LLM 拒絕 early_returnQ最近天氣怎麼樣?A您好,我是客服 AI,很高興為您服務原因
- The question is not answerable as there are no sources provided.
- The answer does not address the question asked.
- Judge LLM 認為答案與資料來源有事實出入
- Judge LLM 信心度只有 0%(門檻 60%)—— 對「答案是否正確」的判斷不夠確定
-
Judge LLM 拒絕 early_return 第 2 次嘗試Q最近天氣怎麼樣?A這個問題不在我服務範圍內。原因
- No sources provided to answer the question.
- Judge LLM 認為這題從資料來源無法答出來
-
Judge LLM 拒絕 early_return 第 3 次嘗試Q最近天氣怎麼樣啊A您好,我是客服 AI,很高興為您服務。原因
- The question is not answerable as there are no sources provided.
- Judge LLM 信心度只有 50%(門檻 60%)—— 對「答案是否正確」的判斷不夠確定
-
品質檢查未通過 scenario_focused來源素材(點擊查看完整內容)
-
• 對話流程:姓名電話 2821
姓名電話 ## 1. 觸發條件 - 詢問顧客的姓名電話並儲存欄位 ## 2. 資訊收集 ### 電話 — 使用者電話號碼,例如:0912345678 這種格式 - 電話 [number]: 使用者電話號碼,例如:0912345678 這種格式 ## 3. API 工具 1. update_user_tags — 使用者標籤管理工具 **功能:** - 新增標籤:將指定標籤加入使用者,自動去重 - 移除標籤:從使用者移除指定標籤,不存在則忽略 **注意:** user_id 由系統自動注入,無需提供。 ## 4. 回覆規則 - 取得客戶姓名電話
Q想請教,我需要提供電話號碼來進行標籤管理嗎?A您無需手動提供使用者的 user_id,因為它會由系統自動注入。不過,我需要您的電話號碼,例如:0912345678,來進行標籤管理。原因- 答案中偵測到台灣手機號碼格式 —— 為避免 PII 外洩自動過濾
-
-
品質檢查未通過 scenario_focused 第 2 次嘗試來源素材(點擊查看完整內容)
-
• 對話流程:姓名電話 2821
姓名電話 ## 1. 觸發條件 - 詢問顧客的姓名電話並儲存欄位 ## 2. 資訊收集 ### 電話 — 使用者電話號碼,例如:0912345678 這種格式 - 電話 [number]: 使用者電話號碼,例如:0912345678 這種格式 ## 3. API 工具 1. update_user_tags — 使用者標籤管理工具 **功能:** - 新增標籤:將指定標籤加入使用者,自動去重 - 移除標籤:從使用者移除指定標籤,不存在則忽略 **注意:** user_id 由系統自動注入,無需提供。 ## 4. 回覆規則 - 取得客戶姓名電話
Q可以請您幫我儲存我的姓名和電話嗎?A請提供您的電話號碼,例如:0912345678,這樣我可以為您儲存姓名和電話。原因- 答案中偵測到台灣手機號碼格式 —— 為避免 PII 外洩自動過濾
-
-
品質檢查未通過 scenario_focused 第 3 次嘗試來源素材(點擊查看完整內容)
-
• 對話流程:姓名電話 2821
姓名電話 ## 1. 觸發條件 - 詢問顧客的姓名電話並儲存欄位 ## 2. 資訊收集 ### 電話 — 使用者電話號碼,例如:0912345678 這種格式 - 電話 [number]: 使用者電話號碼,例如:0912345678 這種格式 ## 3. API 工具 1. update_user_tags — 使用者標籤管理工具 **功能:** - 新增標籤:將指定標籤加入使用者,自動去重 - 移除標籤:從使用者移除指定標籤,不存在則忽略 **注意:** user_id 由系統自動注入,無需提供。 ## 4. 回覆規則 - 取得客戶姓名電話
Q請問我可以提供什麼樣的方式來給您我的姓名和電話呢?A請提供您的電話號碼,例如:0912345678,這樣我可以幫您儲存相關資訊。原因- 答案中偵測到台灣手機號碼格式 —— 為避免 PII 外洩自動過濾
-
-
已寫入 EvalSuite scenario_focused來源素材(點擊查看完整內容)
-
• 對話流程:訂單查詢 291
訂單查詢 ## 1. 觸發條件 - When user has questions about specific order details, shipping status, or purchase history (only after user provides required personal info). 訂單查詢的 Agent 情景 ## 3. API 工具 1. shopline_search_orders — 搜尋 Shopline 訂單資訊。使用自然語言查詢(如「我的訂單編號是: TS100001」、「電話是:0970981389」),系統會自動提取訂單識別資訊進行搜尋。返回客服友善格式,包含訂單狀態、物流進度、追蹤連結等完整資訊。 ## 4. 回覆規則 - Provide clear and concise answers based on order search results from tool messages If multiple relevant orders found, combine them logically If no relevant order found, acknowledge and offer to check with customer service
Q我的訂單查詢不太順利,怎麼辦?A如果沒有找到相關訂單,我們可以確認並提供聯繫客服的選項,你可以再提供一些你的訂單資訊,讓我來幫你查詢。 -