應用強化式學習探勘活動來源網頁

Author: 廖于晴, 張嘉惠

Publish Year: 2021

Update by: March 26, 2025

摘要

—隨著交通的便利性提升,旅行不再只是為了觀光或攝影,更多的是希望可以參加當地的活動,深入體驗當地的文化。大多數的活動發起人,例如政府、企業和組織,都會在其網站上更新活動資訊,因此如何有效率的找到任何網站中的活動來源的所在頁面的任務,即稱為活動來源頁面的探勘。在本文中,我們使用了一個深度強化學習模型來訓練我們的爬蟲代理人 (Agent),並使用兩個階段來訓練我們的爬蟲,分別是預訓練和微調。在預訓練階段,模型使用有限的標記數據進行訓練,其中每個 Episode 都有固定的時間步長,在微調階段,代理使用未標記的數據與基於活動來源頁面的分類器為獎勵系統進行訓練。我們的爬蟲代理人在這邊會通過一個自適應閾值學習是否繼續探索,因此在微調的階段時,每個 Episode 的步數是變動的。最後,我們的爬蟲代理人在真實的數據集上以 1.3的單位成本(每個事件源頁面的點擊次數)實現了 74% 的投資回報率(即準確度)。