台灣法律 AI 粉專「法律偵探」宣布開源「TW Legal RAG」台灣法律語義檢索工具,將約 2,200 萬 […] 〈「法律偵探」宣布開源台灣法律RAG向量庫,30年判決能用口語搜尋〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。台灣法律 AI 粉專「法律偵探」宣布開源「TW Legal RAG」台灣法律語義檢索工具,將約 2,200 萬 […] 〈「法律偵探」宣布開源台灣法律RAG向量庫,30年判決能用口語搜尋〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

「法律偵探」宣布開源台灣法律RAG向量庫,30年判決能用口語搜尋

2026/05/28 18:42
閱讀時長 9 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

台灣法律 AI 粉專「法律偵探」宣布開源「TW Legal RAG」台灣法律語義檢索工具,將約 2,200 萬筆台灣判決裁判結構化並向量化,使用者可用日常口語搜尋判決,並將結果打包成任何 AI(ChatGPT、Claude、Gemini 或本地模型)可直接讀取的格式。工具內建引用驗證功能,可檢查 AI 回覆中的判決字號是否真實存在。
(前情提要:台灣加密專法《虛擬資產服務法》公聽會6大重點:無照業者若涉詐騙加重處理!
(背景補充:遠東商銀、高檢署簽訂MOU:全台95%加密金流納入反洗、反詐偵查架構

重點摘要
  • 「法律偵探」開源 TW Legal RAG,涵蓋約 2,200 萬筆台灣判決裁判,pip install twlegalrag 即可使用
  • 架構為「自帶 AI」模式:工具本身不呼叫 LLM,語義搜尋後打包成 Bundle 供任意 AI 讀取
  • 內建引用驗證功能,可檢查 AI 回覆中的判決字號是否真實存在於檢索結果中,防堵幻覺

灣法律 AI 社群粉專「法律偵探」今日(27)在 Facebook 宣布,歷時半年開發的「TW Legal RAG」(台灣法律 RAG 語義檢索工具)正式開源上線,以 MIT 授權發布。這套工具將約 2,200 萬筆台灣判決裁判結構化並向量化,建構出一個專為法律領域設計的語義檢索系統,任何人都可以透過 pip install twlegalrag 直接安裝使用。

RAG(Retrieval-Augmented Generation,檢索增強生成)是目前解決大型語言模型(LLM)「幻覺」問題的主流技術架構,意思是在模型生成回覆前,先從外部知識庫檢索相關事實,確保輸出有實際資料支撐。這在法律領域尤其關鍵,因為 LLM 編造不存在的判例已多次引發實務爭議,包括美國律師引用 ChatGPT 虛構判例被法院裁罰的知名案例。

開發者自述,他花費了上千小時最佳化檢索管線,成本可能接近百萬元新台幣,現在以 MIT 授權免費開源。

2,200 萬筆判決、自帶 AI 架構、引用驗證

TW Legal RAG 的技術架構與多數法律 AI 工具不同:它本身不呼叫任何 LLM,而是採取「自帶 AI」(BYO-AI)的設計。使用者透過 CLI 工具對後端(Legal Detective 的 TLR 基礎設施,端點為 tlr.dr-lawbot.com)發出語義搜尋請求,系統回傳相關判決後,工具將結果打包成一個結構化的 Bundle,可以直接餵給 ChatGPT、Claude、Gemini 或任何本地模型使用。

這意味著使用者不需要在本地部署嵌入模型或向量索引,整個工具的依賴很輕量,僅需 httpxtyperrich 三個 Python 套件。

工具提供四個核心指令:

  • search:用自然語言對 2,200 萬筆判決進行語義檢索
  • pack:將檢索結果打包成 AI 可讀的 Bundle,含判決摘錄與驗證規則
  • check:Bundle 層級的引用驗證,確認 AI 回覆中引述的判決字號是否存在於檢索結果中
  • health:服務狀態檢查

引用驗證功能是這套工具的一大亮點,它透過純正規表示式比對(不依賴 LLM),檢查 AI 生成內容中的判決字號是否真實存在於 Bundle 中。不過開發者也明確標示限制:驗證器無法判斷引述內容是否正確、無法偵測推理錯誤,也無法識別語義改寫式的幻覺,僅能確認字號的存在性。

根據「法律偵探」的貼文,這是一人獨力完成的專案,開發者在半年內投入上千小時最佳化檢索管線,估算成本可能接近百萬元新台幣。

為什麼選擇免費開源?

「法律偵探」在貼文中表示,許多使用者私訊詢問是否收費,他坦言投入了大量資源,但最終仍選擇以 MIT 授權免費開源。部分原因是看到台灣政府目前正在推動各機關主動建置知識 LLM 服務,他希望透過開源為這個方向貢獻力量。

TW Legal RAG 的開源對台灣法律科技生態具有實質意義。目前台灣法律 AI 領域已有多個商業化產品(如 Lawbot AI、法律人 LawPlayer 等),但一套涵蓋 2,200 萬筆判決、可語義檢索、自帶引用驗證的開源工具仍屬稀缺。開發者或新創團隊可以直接取用這套工具整合進自己的應用,而不需要從零建構法律知識庫。

值得注意的是,TW Legal RAG 會將使用者的查詢記錄在伺服器端進行檢索分析,但宣告不用於模型訓練。

目前真實使用體驗,還需司法相關工作人員回饋。

常見問題

TW Legal RAG 怎麼使用?

執行 pip install twlegalrag 安裝後,透過 CLI 指令 search 用自然語言搜尋判決,pack 打包成 AI 可讀格式,再餵給 ChatGPT 或 Claude 等任意 LLM 使用。

TW Legal RAG 的引用驗證能防止 AI 幻覺嗎?

引用驗證可確認 AI 回覆中的判決字號是否存在於檢索結果中,但無法判斷引述內容是否正確或偵測語義改寫式的幻覺,僅能做字號層級的存在性驗證。

📍相關報導📍

台灣加密專法《虛擬資產服務法》公聽會6大重點:無照業者若涉詐騙加重處理!

遠東商銀、高檢署簽訂MOU:全台95%加密金流納入反洗、反詐偵查架構

金管會公告首批虛擬資產服務商9家合規,18家列VASP黑名單永久停業

市場機遇
Gensyn 圖標
Gensyn實時價格 (AI)
$0.02697
$0.02697$0.02697
+1.42%
USD
Gensyn (AI) 實時價格圖表

AI 策略交易:全天候運行

AI 策略交易:全天候運行AI 策略交易:全天候運行

使用自然語言生成自動化策略

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

不懂圖表?照樣獲利

不懂圖表?照樣獲利不懂圖表?照樣獲利

使用自動交易,3 秒鐘即可跟單頂級交易者!