期刊論文

學年 113
學期 2
出版(發表)日期 2025-02-01
作品名稱 營建工地影像生成文字摘要系統之開發與應用:以工地安全缺失摘要生成為例
作品名稱(其他語言)
著者 蔡明修
單位
出版者
著錄名稱、卷期、頁數 土木水利 52(1),頁41-47
摘要 本研究開發了一套基於生成式人工智慧的「營建工地影像生成文字摘要系統」,透過整合多模態模型、大語言模型和圖像檢索 RAG 技術,實現工地安全影像的智能分析與管理。研究團隊建立了包含1,373筆的工安缺失影像資料集,並開發出能自動分析工地照片並生成專業摘要的AI引擎,該引擎可產生包含場景描述、工安缺失、造成原因以及違反法規等完整資訊。系統採用台灣本土優化的 Llama-3-Taiwan 作為大語言模型,結合圖像檢索 RAG技術提升專業知識的準確性。實測結果顯示,系統在場景描述正確性及缺失內容正確性方面表現優異,特別是在法規檢索方面較其他AI 模型展現出顯著優勢。研究成果不僅提供了便捷的工地影像管理與分析工具,更為工程知識的累積與傳承提供創新解決方案。透過API 的佈署,本系統可與既有的工地管理系統整合,為推動智慧工地的發展奠定重要基礎。
關鍵字 多模態模型;大語言模型;RAG;工地安全;法規;工地影像
語言 zh_TW
ISSN 0253-3804
期刊性質 國內
收錄於
產學合作 國內
通訊作者 蔡明修
審稿制度
國別 TWN
公開徵稿
出版型式 ,電子版,紙本
相關連結

機構典藏連結 ( http://tkuir.lib.tku.edu.tw:8080/dspace/handle/987654321/127289 )