產出 #675

env=production · 緯育 AI 數位學習管理助手 米寶 (85546bd9-1a88-4ba7-b448-f0a098946481) · eval_kind=mixed_qa

已完成
已寫入
10 / 10
通過驗證
10
場景覆蓋
1 / 9
總成本
$0.0183
Tokens
↑131351 / ↓5658
MISSED
8 個 scenario 未被任何 case 涵蓋:6161, 6159, 6162, 2732, 6886, 7173, 2731, 6158。可以重新派發、增加 N 來補。
SUITE
✅ 已寫入 EvalSuite auto-85546bd9-r1-054000477
案例明細(25 筆 — 含已寫入、被拒、retry 軌跡)
  • LLM 產出錯誤
    來源素材(點擊查看完整內容)
    • • 知識:匯入的歷史課程可以再開出新班級嗎 know_224617
      Q: 匯入的歷史課程可以再開出新班級嗎
      A: 不行
    原因
    • ground_truth_answer too short (< 5 chars)
  • LLM 產出錯誤 第 2 次嘗試
    來源素材(點擊查看完整內容)
    • • 知識:匯入的歷史課程可以再開出新班級嗎 know_224617
      Q: 匯入的歷史課程可以再開出新班級嗎
      A: 不行
    原因
    • ground_truth_answer too short (< 5 chars)
  • LLM 產出錯誤 第 3 次嘗試
    來源素材(點擊查看完整內容)
    • • 知識:匯入的歷史課程可以再開出新班級嗎 know_224617
      Q: 匯入的歷史課程可以再開出新班級嗎
      A: 不行
    原因
    • ground_truth_answer too short (< 5 chars)
  • 語氣不像真人 chat(被 Stage E 拒絕) 直接問答
    來源素材(點擊查看完整內容)
    • • 工具:統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) 20
      統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) (search_unified)
      
      Hybrid search (BM25 + vector) with multi-lane RRF fusion across ALL source types (knowledge, product, link, doc_knowledge, doc_product, vision). MUST generate 3 diverse vector queries AND per-locale BM25 keywords.
    Q
    統一搜尋可以處理哪些來源類型?
    A
    統一搜尋支援五種來源類型:知識、產品、連結、文檔知識、文檔產品和視覺。
    原因
    • chat-realism: vague_meta (The question is vague and asks about company-wide capabilities rather than a specific service or product.)
  • 語氣不像真人 chat(被 Stage E 拒絕) 直接問答 第 2 次嘗試
    來源素材(點擊查看完整內容)
    • • 工具:統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) 20
      統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) (search_unified)
      
      Hybrid search (BM25 + vector) with multi-lane RRF fusion across ALL source types (knowledge, product, link, doc_knowledge, doc_product, vision). MUST generate 3 diverse vector queries AND per-locale BM25 keywords.
    Q
    統一搜尋可以處理什麼來源類型?
    A
    統一搜尋支援五種來源類型:知識、產品、連結、文檔知識、文檔產品和視覺。
    原因
    • chat-realism: vague_meta (The question is vague and asks about company-wide capabilities rather than a specific service or product.)
  • 語氣不像真人 chat(被 Stage E 拒絕) 直接問答 第 3 次嘗試
    來源素材(點擊查看完整內容)
    • • 工具:統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) 20
      統一搜尋:multi-lane BM25+Vector RRF 融合(支援 5 種 source_type) (search_unified)
      
      Hybrid search (BM25 + vector) with multi-lane RRF fusion across ALL source types (knowledge, product, link, doc_knowledge, doc_product, vision). MUST generate 3 diverse vector queries AND per-locale BM25 keywords.
    Q
    統一搜尋支援幾種來源類型?
    A
    統一搜尋支援五種來源類型:知識、產品、連結、文檔知識、文檔產品和視覺。
    原因
    • chat-realism: internal_role_title (The question mentions '統一搜尋' which suggests an internal company role or function that a typical customer wouldn't ref...)
  • 已寫入 EvalSuite 直接問答
    來源素材(點擊查看完整內容)
    • • 對話流程:資安/個資疑慮情境 6160
      資安/個資疑慮情境
      
      ## 1. 觸發條件
      - 當使用者提及以下任一語意,即觸發「資安/個資疑慮」回覆規則:
      
      1. 資安與個資關鍵字(核心觸發)
      資安、資料安全、個資、隱私、隱私權
      GDPR、資料保護
      
      2. 資料外洩/風險疑慮
      資料外洩、個資外洩、資料外流
      資料會不會被看到
      誰可以看到我的資料
      資料會不會被用
      
      3. 帳號異常/疑似被盜
      帳號被盜、被駭、被入侵
      異常登入、不明登入
      帳號被動過、有人登入我的帳號
      
      4. 資料異常/遺失
      資料被刪、資料不見
      資料異常、資料消失
      
      5. 權限與使用疑問
      權限問題
      為什麼要我的資料
      你們怎麼使用我的資料
      可以刪除資料嗎
      可以關閉帳號嗎
      
      6. 高風險關鍵字(優先觸發|不可延遲)
      當出現以下任一詞,需直接進入高風險處理流程(優先轉真人):
      個資外洩、資料外流
      帳號被盜、被駭、被入侵
      不明登入、異常登入
      
      ## 4. 回覆規則
      - #最高原則
      1. 當回應包含網址時,網址必須獨立一行,不可與前後文字黏在一起,並且在網址後方加入一個換行符號。
      2. 不可承諾「絕對安全」或否認風險
      3. 不可詢問或要求敏感資訊(密碼、驗證碼等)
      4. 資安相關問題優先處理,不得延遲
      
      執行流程
      Step 1:信任建立(必做)
      
      👉 所有情境皆需先回覆(可微調語氣但不可省略)
      
      「您的問題涉及帳號與資料安全,這部分我們非常重視 🙏
      為確保資訊正確與安全性,我將立即協助轉由專人處理,請稍候,謝謝您的理解。」
      
      Step 2:轉真人(不可延遲)
      👉 必須立即執行,不得再進行追問或延伸回覆
    Q
    如果我的帳號被盜該怎麼辦?
    A
    您的問題涉及帳號與資料安全,這部分我們非常重視 🙏 為確保資訊正確與安全性,我將立即協助轉由專人處理,請稍候,謝謝您的理解。
  • 已寫入 EvalSuite 直接問答
    來源素材(點擊查看完整內容)
    • • 知識:學習統計中,測驗匯出報表的「答對率」是如何計算的? know_224648
      Q: 學習統計中,測驗匯出報表的「答對率」是如何計算的?
      A: 每次測驗都會記錄一次作答,答對率是以所有測驗次數的答題結果計算,包括每次作答的正確與否。例如,作答三次,答對三次,答錯一次,答對率會根據所有作答次數計算。
    Q
    學習統計中的答對率是怎麼計算的?
    A
    答對率是以所有測驗次數的答題結果計算,包括每次作答的正確與否。例如,作答三次,答對三次,答錯一次,答對率會根據所有作答次數計算。
  • 已寫入 EvalSuite 直接問答
    來源素材(點擊查看完整內容)
    • • 知識:如何在平台上變更個人密碼? know_381989
      Q: 如何在平台上變更個人密碼?
      A: 點擊右上角姓名進入「個人資料」,按下「變更密碼」,輸入原始密碼與新密碼後送出即可完成密碼更新。
       https://cdn-static.tibame.com/template/327695/images/d39e2f6a-f5d5-489a-b56a-b8785fd6a617.jpg
       https://cdn-static.tibame.com/template/327695/images/4ca10312-00c0-4972-be34-b051a963aa91.jpg
    Q
    變更個人密碼要按送出嗎?
    A
    是的,更新密碼後需按下送出按鈕。
  • 語氣不像真人 chat(被 Stage E 拒絕) 直接問答
    來源素材(點擊查看完整內容)
    • • 知識:已有設定先修課程了,管理員可以將學員加入班級嗎? know_224527
      Q: 已有設定先修課程了,管理員可以將學員加入班級嗎?
      A: 可以,先修課程主要會阻擋的是針對「報名」班次,學員無論有沒有完成先修課程,都是可以被管理員加入/被自動調訓的。
    Q
    請問管理員可以將學員加入班級嗎?
    A
    可以,先修課程主要會阻擋的是針對「報名」班次,學員無論有沒有完成先修課程,都是可以被管理員加入/被自動調訓的。
    原因
    • chat-realism: internal_role_title (提到'管理員'這個內部角色,顯示出不自然的客戶提問方式。)
  • 其他 直接問答 第 2 次嘗試
    來源素材(點擊查看完整內容)
    • • 知識:已有設定先修課程了,管理員可以將學員加入班級嗎? know_224527
      Q: 已有設定先修課程了,管理員可以將學員加入班級嗎?
      A: 可以,先修課程主要會阻擋的是針對「報名」班次,學員無論有沒有完成先修課程,都是可以被管理員加入/被自動調訓的。
    Q
    請問管理員可以將學員加入班級嗎?
    A
    可以,先修課程主要會阻擋的是針對「報名」班次,學員無論有沒有完成先修課程,都是可以被管理員加入/被自動調訓的。
    原因
    • duplicate (scenario, question)
  • 語氣不像真人 chat(被 Stage E 拒絕) 直接問答 第 3 次嘗試
    來源素材(點擊查看完整內容)
    • • 知識:已有設定先修課程了,管理員可以將學員加入班級嗎? know_224527
      Q: 已有設定先修課程了,管理員可以將學員加入班級嗎?
      A: 可以,先修課程主要會阻擋的是針對「報名」班次,學員無論有沒有完成先修課程,都是可以被管理員加入/被自動調訓的。
    Q
    管理員可以將學員加入班級嗎?
    A
    可以,先修課程主要會阻擋的是針對「報名」班次,學員無論有沒有完成先修課程,都是可以被管理員加入/被自動調訓的。
    原因
    • chat-realism: internal_role_title (The question mentions '管理員', which is an internal role that a customer wouldn't reference.)
  • 已寫入 EvalSuite 直接問答
    來源素材(點擊查看完整內容)
    • • 知識:學員可以申請外訓嗎? know_381983
      Q: 學員可以申請外訓嗎?
      A: 可以。若管理者有啟用「允許學員新增外訓申請單」,學員可進入「個人中心/申請及簽核」頁,點擊「新增申請單/外訓申請」來申請外訓受訓紀錄。送出後會依「簽核流程/外訓簽核」設定的流程簽核,通過後紀錄存入平台。外訓紀錄僅供查詢,不會在課程管理頁建立課程紀錄。
       https://cdn-static.tibame.com/template/327695/images/52b39c26-a944-4146-b335-c885dd2ff2e3.png
    Q
    學員要怎麼申請外訓?
    A
    可以。若管理者有啟用「允許學員新增外訓申請單」,學員可進入「個人中心/申請及簽核」頁,點擊「新增申請單/外訓申請」來申請外訓受訓紀錄。送出後會依「簽核流程/外訓簽核」設定的流程簽核,通過後紀錄存入平台。
  • 已寫入 EvalSuite 直接問答
    來源素材(點擊查看完整內容)
    • • 知識:用小米 HyperOS 無法觀看平台影片? know_382104
      Q: 用小米 HyperOS 無法觀看平台影片?
      A: 我們的平台 App 主要支援一般的 iOS 與 Android 作業系統。
       如果使用者所使用的裝置為小米 HyperOS(屬於較為客製化的系統,並非標準原生 Android),在影音播放的相容性上可能會存在些微差異,因此導致影片無法正常播放的情況
       會建議可先改以其他裝置(如一般 Android 或 iOS 設備)進行操作,以確保能順利觀看影片
    Q
    小米 HyperOS 是原生 Android 嗎
    A
    小米 HyperOS 不是標準原生 Android,它屬於較為客製化的系統。
  • 語氣不像真人 chat(被 Stage E 拒絕) 直接問答
    來源素材(點擊查看完整內容)
    • • 知識:歷史課程可以透過匯入來更新嗎? know_224682
      Q: 歷史課程可以透過匯入來更新嗎?
      A: 可以。匯入時,「班級代碼」為唯一識別碼,如果匯入的班級代碼已存在且課程名稱相同,系統會更新該課程的資料;若班級代碼不存在或課程名稱不同,則系統會新增資料或忽略匯入。
    Q
    歷史課程匯入時班級代碼是什麼?
    A
    匯入時,班級代碼為唯一識別碼。當班級代碼已存在且課程名稱相同時,系統會更新該課程的資料;若班級代碼不存在或課程名稱不同,則系統會新增資料或忽略匯入。
    原因
    • chat-realism: internal_role_title (提到班級代碼的問題顯示出內部角色的參考,這不是一般顧客會使用的語言。)
  • 語氣不像真人 chat(被 Stage E 拒絕) 直接問答 第 2 次嘗試
    來源素材(點擊查看完整內容)
    • • 知識:歷史課程可以透過匯入來更新嗎? know_224682
      Q: 歷史課程可以透過匯入來更新嗎?
      A: 可以。匯入時,「班級代碼」為唯一識別碼,如果匯入的班級代碼已存在且課程名稱相同,系統會更新該課程的資料;若班級代碼不存在或課程名稱不同,則系統會新增資料或忽略匯入。
    Q
    歷史課程匯入的班級代碼是什麼?
    A
    匯入時,「班級代碼」為唯一識別碼,若班級代碼已存在且課程名稱相同,系統會更新該課程的資料。
    原因
    • chat-realism: internal_role_title (The question mentions '班級代碼', which suggests an internal role or context that a typical customer wouldn't reference.)
  • 語氣不像真人 chat(被 Stage E 拒絕) 直接問答 第 3 次嘗試
    來源素材(點擊查看完整內容)
    • • 知識:歷史課程可以透過匯入來更新嗎? know_224682
      Q: 歷史課程可以透過匯入來更新嗎?
      A: 可以。匯入時,「班級代碼」為唯一識別碼,如果匯入的班級代碼已存在且課程名稱相同,系統會更新該課程的資料;若班級代碼不存在或課程名稱不同,則系統會新增資料或忽略匯入。
    Q
    歷史課程匯入時,班級代碼有什麼功能?
    A
    匯入時,「班級代碼」為唯一識別碼;如果匯入的班級代碼已存在且課程名稱相同,系統會更新該課程的資料。若班級代碼不存在或課程名稱不同,則系統會新增資料或忽略匯入。
    原因
    • chat-realism: internal_role_title (提到班級代碼的功能,顯示出對內部流程的了解,這不是一般顧客會詢問的問題。)
  • 已寫入 EvalSuite 直接問答
    來源素材(點擊查看完整內容)
    • • 知識:影片自動轉檔串流機制 know_224602
      Q: 影片自動轉檔串流機制
      A: 1.平台上所有新上傳的「課程教材」影片一律自動轉至KK Stream處理串流轉檔(客戶無須進行任何操作),可大幅減少播放時卡頓,或僅能上傳壓縮過影片的情形
      2.KK Stream處理轉檔程序需要時間,約在影片建立後的數分鐘至數小時後可自動處理完成
      3.舊影片要再點一次「儲存」,會重新轉檔
      4.目前知識庫影片尚未支援串流機制
    Q
    舊影片要怎麼重新轉檔?
    A
    舊影片需要再點一次「儲存」,會重新轉檔。
  • 已寫入 EvalSuite 直接問答
    來源素材(點擊查看完整內容)
    • • 知識:報名頁面找不到開放報名的課程? know_224449
      Q: 報名頁面找不到開放報名的課程?
      A: 可能是這門課學員已被調訓或已報名成功,學員可至「我的學習」中查看。
    Q
    學員可以在哪裡查看已報名的課程?
    A
    學員可至「我的學習」中查看已報名的課程。
  • 已寫入 EvalSuite 直接問答
    來源素材(點擊查看完整內容)
    • • 知識:每個分類一定要有子分類嗎 know_224545
      Q: 每個分類一定要有子分類嗎
      A: 對的,如果真的只有一個分類,可將上下層分類名稱設成一致
    Q
    每個分類一定要有子分類嗎?
    A
    對的,如果真的只有一個分類,可將上下層分類名稱設成一致。