整合多種搜尋結果以提高POI搜尋的準確性

Author: 鄭仲庭, 莊秀敏, 張嘉惠

Publish Year: 2015

Update by: March 31, 2025

摘要

隨著無線網路及行動裝置的普及,在地化服務(location-based services)逐漸受到重視,搜尋興趣點(Points of Interest, POI)已成為日常生活中常見的需求。雖然 Google Maps 是現今最廣泛使用的 POI 搜尋服務,但仍有許多 POI 在地圖上無法找到。因此,我們整合 Web 上多種搜尋來源結果,以有效地提高POI 搜尋的準確性。透過多種搜尋結果的整合,可以有效增加 POI數量,即召回率提升。並且,依據 POI 與查詢詞的相關度排序結果可提高系統的準確性。在本篇論文中,我們整合了三種 POI 搜尋結果:(1)藉由 crawler擷取 Web 中 POI,並利用 Solr 建構 POI 搜尋系統;(2)透過線上擷取模組,即時從 Google 搜尋 snippet中辨識出 POI;以及(3)由 Google Place API 使 POI數量更為豐富。我們對於排序結果考量了 POI 與查詢詞相關性,以及距離使用者位置遠近的兩種因素。另外,POI 與查詢詞不匹配以致檢索不到相關結果的問題,除了增加 POI 的相關描述來改善搜尋結果外,擴展查詢詞也是能提升召回率的方法。本研究的系統架構區分兩個部分:第一部分為POI 搜尋,藉由整合多種搜尋結果及 POI 相關模組進行排序。第二部分為查詢詞擴展,以 POI 相關資訊做為語料庫,經由主題模型分群詞彙,透過建立二分圖(bipartite graph)將詞彙和 POI 的標籤進行對應來擴展查詢詞。實驗結果顯示,本系統的 POI 搜尋效能優於 Wikimapia 與 What’s The Number,並與 Google Maps 效能相近。