On Large-Scale Multi-Label Classification for POI Tagging

Author: 楊鎧謙, 張嘉惠, 劉胥影

Publish Year: 2017

Update by: March 27, 2025

摘要

近年來智慧型手持裝置迅速普及,現在已經達到幾乎人手一機的情況。而交通方式的進步更是使得人們到陌生地點的機會增加。在陌生的環境之中要尋找感興趣的點是不容易的,所以需要提供電子地圖系統以便查詢。因為使用者可能不知道這些點的確切名稱,他們可能只是想找特定類型的點,所以需要提供類別搜尋服務。為了要提供類別搜尋服務,我們需要將系統中所有的點進行分類。因為系統中有許多筆資料,每筆資料都有一個或多個類別,所以這是一個大數量的多類別分類問題。我們使用中華黃頁的分類方式。類別有共有 1,287 種。因為類別與資料較多使得一般訓練分類器的方式需要訓練較多個分類器。我們利用降低類別維度的方式來加快訓練與測試的速度。實驗顯示採用KDE+SVM的混合模型方式的訓練時間與測試時間皆比一般的 SVM分類快幾乎一倍,然 Micro F1 為0.718低於SVM的0.783。由於資料為非平衡資料我們試圖利用Reweighting和縮減取樣(Downsampling)的方式想增進效能,但其結果顯示在大數量的資料中這兩種方法也不太有效。