Projects

Relation Extraction

Relation Extraction

2023/12 - Present
洪閔昭, 葉季儒
Document level Relation Extraction

本研究旨在構建一套可應用於真實網路資 料的聯合實體關係擷取架構。針對現有資 料集來源單一且主要集中在句子級別的問 題,我們利用大型語言模型(如Gemini、 GPT-3.5)對全篇文章進行標記,並使用 中文Common Crawl 數據構建更泛用的資 料集。為提高標記的可信度與實體對取樣 的完整性,採用了交叉驗證與實體擴充方 法。並通過微調預訓練模型來驗證與提升 模型在真實環境下進行實體關係擷取的性 能。

CCG: CollisionCare Guide

CCG: CollisionCare Guide

2023/05 - Present
龔若齊, 黃懷萱, 簡國峻
Legal AIChatBot

基於大型語言模型(LLM)的交通事故諮詢助理系統(CCG),旨在協助車禍當事人釐清事故經過,減輕警方與保險專員詢問的負擔。

ESGenius: 永續報告合規性檢查的多代理系統

ESGenius: 永續報告合規性檢查的多代理系統

2025/05 - Present
許耀文, 施冠宏, 陳柏安
Agentic AiMulti-Agent System

基於 Agentic AI 的合規檢查系統,採用多代理協作架構自動化分析 ESG 報告與 GRI 標準的合規性,結合文檔處理、語義檢索和智能分析,提供高效準確的合規驗證解決方案。

EventGO!

EventGO!

2021/08 - Present
林圓皓, 吳昱豪, 吳承儒, 廖于晴, 葉庭
Event extractionEvent source page discovery

尋找參加的活動成為了我們閒暇時光的前奏。為了以成本效益的方式獲取活動信息,我們需要一個框架,能夠自動發掘活動來源,以及提取活動相關資料。由於我們關注的是即將來臨的活動,而最新的活動公告和信息通常來自政府、學校和企業等組織的網站,識別活動組織的網站、以及最新消息網頁,再進行活動資訊擷取,將比對整個網路進行爬取更具成本效益。WIDM實驗室開發了一個活動搜尋工具,稱為EventGO! ,從三種不同的視圖呈現搜尋結果:地圖、日曆或清單。 在這項研究中,我們提出了一個從活動主辦單位網站中高效挖掘活動的框架。第一步稱為「消息來源頁面發現」,旨在在活動主辦單位網站主頁上找到富含新聞信息的分頁頁面。 第二步識別這些消息來源頁面中的分頁組件包含上一頁、分頁和下一頁的鏈結, 以收集更多樣板相同的頁面。隨後,我們應用包裝器生成技術,從消息來源頁面進行分則訊息的擷取取得發佈的鏈結。收集了發佈鏈結之後,我們應用模板去除技術保留網頁主要內容,並設計一個活動檢測模型來確定發佈鏈結是否與活動相關,最後再應用活動擷取模型從這些詳細信息中擷取事件標題、日期和場地。

Fact Checking

Fact Checking

2022/01 - 2024/07
謝程偉, 葉季儒, 洪閔昭
fact checkingfake news

在資訊爆炸的時代,高效、穩健的事實查核機制至關重要。許多事實查核研究著重在宣稱驗證 (Claim Verification) 子任務的工作,然而實務上文件和證據檢索等取得相關證據的方法對後續效能影響更多。在本文中,我們比較傳統稀疏向量及近年來密集向量文件表達方式對資訊檢索效能的表現。在FEVER資料集上,我們的系統在提取2個證據文件時能達到70.9\% oracle recall,超越FEVER論文基於TF-IDF的55.3\% (5個文件),也超越現有的WikiAPI檢索效能。{在證據檢索的部份,我們發現SentenceBert這個嵌入式模型架構的局限性,在訓練與應用方法一致時才能發揮效用,而使用對比學習訓練時,更能提升其分辨能力,}使得我們在證據檢索上也能有所突破。我們的架構在侷限的硬體下,可以訓練出Evidence F1 56.20\%,接近SOTA 的自動化事實查核系統。

Fintech

Fintech

2024/09 - 2025/04
黃俊傑, 施冠宏, 陳柏安, 許耀文, Leon

首先利用圖注意力網路分析股票間的動態關聯性,並以時序卷積自編碼器(Temporal Convolutional Network Autoencoder, TCN-AE)壓縮每日交易數據,以提高模型的預測精度與效率。最後,透過近端策略優化(Proximal Policy Optimization, PPO)演算法,訓練選股與交易代理人,以自動化並優化股票投資決策。實驗結果證明,相較於傳統的 ETF 投資策略,本研究所提出的方法能有效降低風險並提高收益,展現出強化學習與圖注意力機制在金融資產管理領域的前瞻性與實用性。

GITM

GITM

2022/08 - Present
丁仕杰, 陳楷勲
Space AI

利用深度學習技術,結合太空知識來解決太空天氣的各項問題。例如預測未來的電離層(Total Electron Content )濃度、GPS軌道定位校正等等。

Story ChatBot

Story ChatBot

2022/08 - Present
龔若齊, 謝程偉, 丁仕杰, 陳冠蓉, 陳楷勲
ChatBotEduACT

Eduact 平台是一個專注於教育領域的無需編碼的 Agent Chatbot 平台,旨在為教育工作者提供簡單易用的工具。這個平台允許教師自訂課程助教的任務,並支援提供相關教材以輔助任務的執行。學生可以利用智能助教來提升學習效率,從而改善整體學習體驗。Eduact 的平台具有高度的靈活性和操作簡便性,即使沒有程式設計背景的使用者也能輕鬆上手。其核心目標在於提升教學質量與學習體驗。如果您對這個創新教育工具有興趣或疑問,歡迎隨時與我們聯繫以進一步探索。

Legal Judgment Prediction

Legal Judgment Prediction

2021/07 - Present
簡國峻, 黃懷萱, 龔若齊, 孫潤德
Legal AI

Legal Judgment Prediction (LJP) 是 Legal AI 的一個子任務,這個任務的主要目的是根據輸入的犯罪事實,預測可能違法的案由、法條和刑期等等。法律案件主要可分類為民法和刑法。收集民事案件的事實和證據並不容易。因此,大部分的研究都集中在刑事案件上,並使用裁判書做為判決預測的資料來源。 在本專案中,我們重點關注 LJP 如何通過提供它們來協助政府機構 洞察法律糾紛的趨勢和模式。 這可以幫助機構確定可能需要進行監管更改或應重點關注執法工作的領域。因此,我們選擇起訴書作為判決預測的數據來源,以協助檢察官更快、更準確地準備起訴書,以及預測案件未來在法院的判決。

Judgment Correction

Judgment Correction

2024/09 - Present
施冠宏, 陳柏安, Leon
LLM

本專案的目標是開發一個裁判書的誤植偵測與自動修正系統,透過大型語言模型(如BERT、LLAMA等)自動化處理裁判書中的誤植,提升法律文書的準確性和編修效率,為法律實務工作者提供便捷的輔助工具。該系統設計了一個包含「誤植偵測模組」與「自動修正模組」的流程,以識別並修正文中的常見錯誤。