一個能發掘更具意義循序樣式的探勘流程
學年 96
學期 2
發表日期 2008-05-16
作品名稱 一個能發掘更具意義循序樣式的探勘流程
作品名稱(其他語言)
著者 徐煥智;顏志祐
作品所屬單位 淡江大學資訊管理學系
出版者
會議名稱 ICIM 2008第十九屆國際資訊管理學術研討會
會議地點 臺北市, 臺灣
摘要 在循序樣式探勘的各種技術中,對於探勘的結果,顯少考慮樣式的可信程度,同時只能得到項目間基本的關聯關係,或是事件發生的前後次序,無法針對產生的序列樣式得到更進一步的資訊。在我們的研究中,針對循序樣式探勘,考量在下個階段會發生的交易,導入信賴度(confidence)過濾規則,並計算產生樣式的時間間隔,使探勘得到的結果更具意義。我們擴展PrefixSpan 演算法[15] , 發展出E-PrefixSpan 演算法(Expanded PrefixSpanalgorithm),利用產生頻繁項目序列的過程,也經過信賴度的篩選,記錄其序列中的時間間隔,接著建立映射資料庫,依此不斷遞迴至探勘結束,使探勘的結果不但具有時間訊息,更增加樣式的可信程度。透過實驗結果顯示,與PrefixSpan 相比,E-PrefixSpan 考量信賴度的作法,大量的刪減掉不必要的二階頻繁樣式,不但加快探勘的速度,還能得到樣式中最後一筆交易將在幾天內發生的時間訊息。
關鍵字 資料探勘;樣式成長;循序樣式;信賴度;Data mining;Pattern growth;Sequential pattern;Confidence
語言 zh_TW
收錄於
會議性質 國際
校內研討會地點
研討會時間 20080516~20080517
通訊作者
國別 TWN
公開徵稿 Y
出版型式 紙本
出處 ICIM 2008第十九屆國際資訊管理學術研討會論文集,10頁
相關連結

機構典藏連結 ( http://tkuir.lib.tku.edu.tw:8080/dspace/handle/987654321/95189 )

機構典藏連結