會議論文
學年 | 95 |
---|---|
學期 | 2 |
發表日期 | 2007-05-26 |
作品名稱 | 運甪重複句排除技術於中文文件自動摘要之研究 |
作品名稱(其他語言) | |
著者 | 魏世杰; 陳姿妤 |
作品所屬單位 | 淡江大學資訊管理學系 |
出版者 | 桃園縣:銘傳大學資訊管理學系 |
會議名稱 | 第十八屆國際資訊管理學術研討會=The 18th International Conference on Information Management |
會議地點 | 臺北市, 臺灣 |
摘要 | 本研究針對中文文件,以TFIDF 法為基礎,同時考量句子與文章標題句之間的相似度,作為選取文章內重要句子的方法;並基於Hownet計算詞彙之間的同義詞相似度,結合Jaccard 概念詞相似度函數,過濾摘要中資訊重複的句子,以期提升自動摘要結果的精確度。 實驗結果發現,使用TFIDF 為基礎的詞彙權重計算,若配合句子與文章標題句之間的相似度特徵,可提升摘要結果的平均精確度約7% 。而摘要結果中結合Jaccard概念詞相似度函數與基於Hownet 所求得的同義詞相似度,用於重複句排除的計算上,可達到提升摘要精確度的效果。 |
關鍵字 | 自動摘要;TFIDF;相似度;Hownet;重複句排除 |
語言 | zh_TW |
收錄於 | |
會議性質 | 國際 |
校內研討會地點 | |
研討會時間 | 20070526~20070526 |
通訊作者 | |
國別 | TWN |
公開徵稿 | Y |
出版型式 | 紙本 |
出處 | 第十八屆國際資訊管理學術研討會論文集=Proceedings of 18th International Conference on Information Management |
相關連結 |
機構典藏連結 ( http://tkuir.lib.tku.edu.tw:8080/dspace/handle/987654321/22960 ) |