Projects
Relation Extraction
構建可應用於真實網路資料的聯合實體關係擷取架構。利用Gemini、GPT-3.5等大型語言模型對全篇文章進行標記,使用中文Common Crawl數據構建泛用資料集。採用交叉驗證與實體擴充方法提升標記可信度,通過微調預訓練模型優化真實環境下的實體關係擷取性能。
ESGenius: 永續報告合規性檢查的多代理系統
基於 Agentic AI 的合規檢查系統,採用多代理協作架構自動化分析 ESG 報告與 GRI 標準的合規性,結合文檔處理、語義檢索和智能分析,提供高效準確的合規驗證解決方案。
Fact Checking
開發高效自動化事實查核系統,採用密集向量文件表達與對比學習優化證據檢索。
GITM
利用深度學習技術,結合太空知識來解決太空天氣的各項問題。例如預測未來的電離層(Total Electron Content )濃度、GPS軌道定位校正等等。
PagePilot
我們以 WebVoyager [4],一個自動化網頁操作系統為參考,在此基礎上提出了 PagePilot 系統1,將網頁視覺輸入與原始碼資訊整合作為 LLM Agent的輸入。PagePilot 利用視覺方法進行網頁操作,並輔以從網頁原始碼萃取的關鍵資訊,提升在資訊擷取類任務上的表現。此外,系統引入了動態載入與觀察者 agent 等優化,前者通過模擬使用者滑鼠滾動來加載更多內容,後者在操作錯誤出現時提供回撤功能。實驗證明這些改進能緩解上述控制問題,提升任務完成率。在 WebVoyager 與 GAIA 等資料集上,PagePilot 分別達到 76%和 57% 的任務完成率,皆顯著超越 WebVoyager (65%, 27%) 與 GPT-4 (32%, 18%) 的 baseline,並大幅減少了所需的操作次數
Legal Judgment Prediction
開發Legal AI領域的法律判決預測(LJP)系統,透過分析犯罪事實預測可能違法的案由、法條和刑期。專注於刑事案件,使用起訴書作為數據來源,協助政府機構洞察法律糾紛趨勢和模式,確定需要監管更改或重點執法的領域。系統旨在協助檢察官更快、更準確地準備起訴書,並預測案件在法院的未來判決結果。
Judgment Correction
本專案的目標是開發一個裁判書的誤植偵測與自動修正系統,透過大型語言模型(如BERT、LLAMA等)自動化處理裁判書中的誤植,提升法律文書的準確性和編修效率,為法律實務工作者提供便捷的輔助工具。該系統設計了一個包含「誤植偵測模組」與「自動修正模組」的流程,以識別並修正文中的常見錯誤。