Projects
Browser Agent
隨著大型語言模型 (LLM) 推理及多模態分析能力的提升,已經可以 自動完成許多任務,例如自動操作網頁,現有工具如 browser-use 和 Manus 可以依據使用者的要求瀏覽網頁,例如線上購物、搜尋資訊都能處 理。但目前的自動化工具對於長網頁、大量文章、操作複雜的任務難以順利處 理,容易出現導航問題、視覺對齊問題、幻覺問題,阻礙自動化操作。因此自 動化 agent 仍然需要更多研究,對網頁架構深度優化以解決上述問題。
CoolEn: 客服導覽機器人
酷英導覽機器人是一套服務於 CoolEnglish 酷英網 的智慧客服與學習輔助系統,目標是降低人工客服負擔,優先協助使用者解決常見的網站操作與學習問題。系統可提供一般客服服務,包括帳號註冊、登入、網頁操作、課程使用方式與最新消息查詢等,協助使用者快速熟悉平台功能;同時也能根據使用者需求提供課程資訊介紹與個人化課程推薦,幫助學生找到適合自己的學習內容。此外,機器人亦具備學習輔導能力,可依據使用者的學習狀況與目標,協助規劃複習課程路徑,提升學習效率與自主學習體驗。
CUI for n8n & GSS
本專案與叡揚資訊 (GSS) 產學合作,旨在解決 n8n 自動化平台中,自然語言轉化為可執行工作流 (Executable Workflow) 的結構化預測問題。針對傳統 RAG 僅能搜尋節點但無法保證流程連通性的痛點,提出了一種結合分類樹 (Taxonomy Tree) 與知識圖譜 (Knowledge Graph) 的混合搜尋演算法,實現從「使用者意圖」到「生產級自動化腳本」的端對端生成 。
GITM
利用深度學習技術,結合太空知識來解決太空天氣的各項問題。例如預測未來的電離層(Total Electron Content )濃度、GPS軌道定位校正等等。目前現階段則是利用深度學習技術與一些大氣知識來偵測大氣剖面中是否發生 Ducting (大氣導管) 現象。
Physical AI
本專案旨在開發一套自動化、高可靠性的具身智能(Embodied AI)系統,專門用於高速公路路況維護作業。透過結合大型語言模型(LLM)的決策能力、多智能體(Multi-Agent)協作演算法以及物理仿真環境(Isaac Sim)。
ESGenius: 永續報告生成AI顧問
ESGenius:永續報告生成 AI 顧問是一個針對台灣企業設計的 AI 系統,旨在幫助企業快速適應 ESG相關政策,生成符合永續準則的報告。該系統整合大型語言模型(LLM)、檢索增強生成(RAG)、思維鏈(Chain-of-Thought)及智慧代理(Task Agents),提供政策問答、報告撰寫指引及自動化生成、報告書修改建議,降低企業的時間與成本負擔。ESGenius 具有本地化優勢、與時俱進的及時更新能力、以及基於政策依據和資料支持的可解釋性。能促進企業達成永續發展目標,提升合規性、透明度與社會責任,同時減少環境資源的消耗。
Explainable Legal Inference
本專案旨在探索如何利用大型語言模型(LLM)的強大能力,利用MECE原則將臺灣的刑法轉化為結構清晰、可供分析的知識圖譜。此外,也使用原子拆解的方法,將結構化的臺灣法律文件(特別是檢察官起訴書)拆解成構成要件,更符合法律推論的真實場景,並提供法律判決預測的可解釋性。
Legal Judgment Prediction
Legal Judgment Prediction (LJP) 是 Legal AI 的一個子任務,這個任務的主要目的是根據輸入的犯罪事實,預測可能違法的案由、法條和刑期等等。法律案件主要可分類為民法和刑法。收集民事案件的事實和證據並不容易。因此,大部分的研究都集中在刑事案件上,並使用裁判書做為判決預測的資料來源。 在本專案中,我們重點關注 LJP 如何通過提供它們來協助政府機構 洞察法律糾紛的趨勢和模式。 這可以幫助機構確定可能需要進行監管更改或應重點關注執法工作的領域。因此,我們選擇起訴書作為判決預測的數據來源,以協助檢察官更快、更準確地準備起訴書,以及預測案件未來在法院的判決。
EventGO!
尋找參加的活動成為了我們閒暇時光的前奏。為了以成本效益的方式獲取活動信息,我們需要一個框架,能夠自動發掘活動來源,以及提取活動相關資料。由於我們關注的是即將來臨的活動,而最新的活動公告和信息通常來自政府、學校和企業等組織的網站,識別活動組織的網站、以及最新消息網頁,再進行活動資訊擷取,將比對整個網路進行爬取更具成本效益。WIDM實驗室開發了一個活動搜尋工具,稱為EventGO! ,從三種不同的視圖呈現搜尋結果:地圖、日曆或清單。 在這項研究中,我們提出了一個從活動主辦單位網站中高效挖掘活動的框架。第一步稱為「消息來源頁面發現」,旨在在活動主辦單位網站主頁上找到富含新聞信息的分頁頁面。 第二步識別這些消息來源頁面中的分頁組件包含上一頁、分頁和下一頁的鏈結, 以收集更多樣板相同的頁面。隨後,我們應用包裝器生成技術,從消息來源頁面進行分則訊息的擷取取得發佈的鏈結。收集了發佈鏈結之後,我們應用模板去除技術保留網頁主要內容,並設計一個活動檢測模型來確定發佈鏈結是否與活動相關,最後再應用活動擷取模型從這些詳細信息中擷取事件標題、日期和場地。
Judgment Correction
本專案的目標是開發一個裁判書的誤植偵測與自動修正系統,透過大型語言模型(如BERT、LLAMA等)自動化處理裁判書中的誤植,提升法律文書的準確性和編修效率,為法律實務工作者提供便捷的輔助工具。該系統設計了一個包含「誤植偵測模組」與「自動修正模組」的流程,以識別並修正文中的常見錯誤。
Relation Extraction
本研究旨在構建一套可應用於真實網路資 料的聯合實體關係擷取架構。針對現有資 料集來源單一且主要集中在句子級別的問 題,我們利用大型語言模型(如Gemini、 GPT-3.5)對全篇文章進行標記,並使用 中文Common Crawl 數據構建更泛用的資 料集。為提高標記的可信度與實體對取樣 的完整性,採用了交叉驗證與實體擴充方 法。並通過微調預訓練模型來驗證與提升 模型在真實環境下進行實體關係擷取的性 能。
Fact Checking
在資訊爆炸的時代,高效、穩健的事實查核機制至關重要。許多事實查核研究著重在宣稱驗證 (Claim Verification) 子任務的工作,然而實務上文件和證據檢索等取得相關證據的方法對後續效能影響更多。在本文中,我們比較傳統稀疏向量及近年來密集向量文件表達方式對資訊檢索效能的表現。在FEVER資料集上,我們的系統在提取2個證據文件時能達到70.9\% oracle recall,超越FEVER論文基於TF-IDF的55.3\% (5個文件),也超越現有的WikiAPI檢索效能。{在證據檢索的部份,我們發現SentenceBert這個嵌入式模型架構的局限性,在訓練與應用方法一致時才能發揮效用,而使用對比學習訓練時,更能提升其分辨能力,}使得我們在證據檢索上也能有所突破。我們的架構在侷限的硬體下,可以訓練出Evidence F1 56.20\%,接近SOTA 的自動化事實查核系統。
