🚀 Version 3.0 正式發布

波特人評分法 v3

九維度 Agentic AI 評估框架 ─ 人機合作的評分新標準

📅 2025-11-06 👤 Botrun 研究團隊 📖 約 10 分鐘閱讀

🎯 為什麼需要波特人評分法 v3?

經過教育部、僑委會、慈濟基金會、工程會等多個政府與公益機關的實戰驗證,波特人評分法已演化至第三版。 由於包含九個評估維度,評分過程極度繁雜,已無法仰賴純人工評估。 因此,v3 版本全面採用人機合作(Human-AI Collaboration)評分流程, 讓 AI 輔助進行多維度分析,人類專注於關鍵決策,大幅降低評分負擔並提升準確性。

波特人評分法 v3 核心公式
真新全・快省準・人安穩
九維度全方位評估 Agentic AI 系統效能

核心理念: 波特人評分法不是單純的技術指標,而是以「使用者實際價值」為核心, 結合「資訊品質」、「效能表現」與「使用體驗」三大面向, 全面評估 Agentic AI 系統是否真正解決實務問題。

📊 九大評估維度詳解

真實性 Authenticity

Agentic AI 具備主動驗證來源的能力,會進行交叉比對以解決資訊矛盾,確保所有引用資料正確無誤,比 RAG 僅依賴檢索結果有更高可信度。

時效性 Timeliness

能夠動態檢查法規或政策的版本日期,並自動偵測最新更新。即時提供最具時效性的資訊,遠勝於 RAG 依賴固定資料庫的限制。

完整性 Completeness

能同時查詢超過 80 個網站,並將跨網站、跨領域的相關資訊進行整合。提供的答案視野更廣、內容更全面。

回應速度 Speed

擅長處理多輪對話與多步驟推理。高效率體現在能快速理解需求、完成複雜的執行流程,在整體回應效率上具優勢。

資源效率 Efficiency

採用按需求查詢模式,能即時存取外部資訊。相較於 RAG 需持續進行 re-embedding 更新資料庫,在算力與維護成本上更具經濟效益。

精準度 Precision

拆解複雜問題、進行多輪驗證,並具備強大的邏輯推理能力。答案準確度極高,能有效降低 AI「幻覺」(Hallucination)發生的機率。

換位思考 Empathy

透過多輪互動不斷釐清使用者真實需求,展現高度的換位思考能力。還會主動提供延伸資訊,讓體驗更貼近個人化需求。

安全性 Security

可建立驗證代理人,專門檢測並抵禦提示注入(Prompt Injection)和惡意誘導等「紅隊攻擊」,確保系統運作安全無虞。

穩定性 Stability

推理流程設計具有高度一致性,確保相同問題在多次查詢時,都能獲得可複製、高度穩定的結果,不會出現答案飄忽不定的情況。

⚖️ Agentic AI vs. RAG 系統對比

評估維度 Agentic AI 傳統 RAG
真實性 主動交叉驗證來源 僅依賴檢索結果
時效性 動態檢查最新版本 依賴固定資料庫
完整性 跨網站整合 80+ 來源 受限於預建索引
回應速度 多輪對話高效推理 單次檢索速度快
資源效率 按需查詢,免維護 需持續 re-embedding
精準度 多輪驗證降低幻覺 依賴向量相似度
換位思考 多輪互動釐清需求 無互動機制
安全性 驗證代理人防護 基礎防護機制
穩定性 高度一致的推理 答案可能飄移

🚀 準備好採用波特人評分法了嗎?

加入政府機關行列,使用九維度評估框架,確保您的 Agentic AI 系統達到最高標準

探索更多文章