影視字幕辨識與資訊擷取系統

出自 TELDAP
前往: 導覽搜尋

功能

可檢索視訊畫面(mpeg3格式)的文字,並以一般瀏覽器(如IE explorer呈現影片檢索結果。是結合圖文分離、文件分析、文字辨識及數位資料庫存放等多種技術而成的應用。

特色

穩定:以Linux為作業系統平台,可支援ext3的檔案系統,存放4GB以上的影像檔案。查詢資料庫是MySQL。

中文字幕辨識能力強。

操作介面容易:以網路瀏覽器為操作介面,容易上手,初學者的學習時間少。

維護簡單:可配合phpMyAdmin及PHP套件等管理工具為管理介面。即使不是程式設計師也易維護系統。

使用說明

使用者在登入系統後的首頁(http://140.109.19.195/adms/),可以輸入關鍵字做搜尋的工作。如下圖1是查詢的首頁。按下「搜尋」後,就可以檢索(影像字幕)出在資料庫中的影像。

影視字幕辨識與資訊擷取系統圖1.jpg
圖1

使用範例

使用者可輸入關鍵字,如「機器人」或「軍警」或「火災」等關鍵字作搜尋。查詢結果如下圖2:

影視字幕辨識與資訊擷取系統圖2.jpg
圖2

以滑鼠點圖檔,即可由資料庫調這份影片(請用IE瀏覽器)

影視字幕辨識與資訊擷取系統圖3.jpg
圖3

參考資料

參與研發單位:中央研究院-資訊所- 機器學習與分類實驗室、技術研發分項計畫

提供單位:技術研發分項計畫

使用單位:中央研究院-史語所、中央研究院-近史所、中央研究院-語言所、臺灣師範大學