Mining Nonsimple Traversal Path

Author: Yan-Qing Wu (吳彥欽)

Publish Year: 2001-07

Update by: March 30, 2025

摘要

資料探勘(Data Mining)在近幾年來已經成為一門新興的研究領域,它的 技術不僅逐漸被重視並且廣泛應用到各個領域中。在網際網路蓬勃發展的今日, 龐大的網路人口在使用網路的同時,也留下了大量的資料給我們分析。將資料探 勘的技術應用到網路環境上時,我們稱之為「Web Data Mining』或簡稱「Web Mining」。網路資料探勘大致可以區分成兩類:一是針對線上資源內容的資料探 勘(Web Content Mining);二是針對線上資源使用狀況的資料探勘(Web Usage Mining),最主要的目的是希望藉由網路伺服器上的使用者瀏覽資訊,挖掘出有 用的使用者行為模式,提供給網站管理者或企業作為管理、行銷策略的參考依據。過去「Web Usage Mining』方面的研究,大多數將研究的重點擺在提昇探勘 演算法的執行效率,不論是Apriori-Like 演算法或是 SuffixTree-Like 演算法的改 進,都是希望能以更有效率的方式,來探勘使用者瀏覽序列。不過使用者瀏覽序 列探勘更重要的目的,是希望能透過演算法的幫助,探勘出更具實用價值的瀏覽 序列,如最大前進型瀏覽序列、非簡單瀏覽序列等,都是屬於這一方面的研究。 在本篇論文裡,我們針對探勘網路使用者行為模式的問題,提出了改良式Apriori 演算法,希望透過改良式 Apriori 演算法的實體條件限制,提昇探勘演算法的執 行效率,並 並且比較各種不同型式使用者瀏覽序列在實際應用上的效果。