一個能發掘更具意義循序樣式的探勘流程 | |
---|---|
學年 | 96 |
學期 | 2 |
發表日期 | 2008-05-16 |
作品名稱 | 一個能發掘更具意義循序樣式的探勘流程 |
作品名稱(其他語言) | |
著者 | 徐煥智;顏志祐 |
作品所屬單位 | 淡江大學資訊管理學系 |
出版者 | |
會議名稱 | ICIM 2008第十九屆國際資訊管理學術研討會 |
會議地點 | 臺北市, 臺灣 |
摘要 | 在循序樣式探勘的各種技術中,對於探勘的結果,顯少考慮樣式的可信程度,同時只能得到項目間基本的關聯關係,或是事件發生的前後次序,無法針對產生的序列樣式得到更進一步的資訊。在我們的研究中,針對循序樣式探勘,考量在下個階段會發生的交易,導入信賴度(confidence)過濾規則,並計算產生樣式的時間間隔,使探勘得到的結果更具意義。我們擴展PrefixSpan 演算法[15] , 發展出E-PrefixSpan 演算法(Expanded PrefixSpanalgorithm),利用產生頻繁項目序列的過程,也經過信賴度的篩選,記錄其序列中的時間間隔,接著建立映射資料庫,依此不斷遞迴至探勘結束,使探勘的結果不但具有時間訊息,更增加樣式的可信程度。透過實驗結果顯示,與PrefixSpan 相比,E-PrefixSpan 考量信賴度的作法,大量的刪減掉不必要的二階頻繁樣式,不但加快探勘的速度,還能得到樣式中最後一筆交易將在幾天內發生的時間訊息。 |
關鍵字 | 資料探勘;樣式成長;循序樣式;信賴度;Data mining;Pattern growth;Sequential pattern;Confidence |
語言 | zh_TW |
收錄於 | |
會議性質 | 國際 |
校內研討會地點 | |
研討會時間 | 20080516~20080517 |
通訊作者 | |
國別 | TWN |
公開徵稿 | Y |
出版型式 | 紙本 |
出處 | ICIM 2008第十九屆國際資訊管理學術研討會論文集,10頁 |
相關連結 |
機構典藏連結 ( http://tkuir.lib.tku.edu.tw:8080/dspace/handle/987654321/95189 ) |