以自然語言處理技術加值數位內容: StringNet的延伸與應用

出自 TELDAP
前往: 導覽搜尋

執行單位

國立中央大學學習與教學研究所


主持人

衛友賢


執行期限

2010年8月~2011年7月


網站名稱

StringNet Navigator


網址

http://nav.stringnet.org/


計畫/網站簡介

數位內容的產生,儲存及散播徹底的改變我們的生活及世界,這種影響與印刷及工業革命相比,可說有過之而無不及,這可稱之為”數位化革命”的過程,也替我們帶來無限的可能性及不可忽視的挑戰,而我們認為語言將在這波革命中,將扮演舉足輕重的角色。數位內容雖然提供了自然語言處理的可能性,但同時為了能有效應用及利用數位內容,我們需開發更多自然語言處理工具,然而目前的問題是並未有足夠的資源與工具可協助有效利用龐大的數位內容。此計畫將提出一創新的語言知識庫,稱為StringNet,我們將致力於如何運用StringNet,期望能加值數位內容並有效提升數位內容的使用。此計畫主要有兩個目的,(1) 開發StringNet:除了利用既有的StringNet知識庫,我們也將提出更多新的語言知識,加入至StringNet中,(2)利用StringNet 開發可加值數位內容的應用程式。此外,由於目前的StringNet 所使用的語言為英文,我們也將計畫加入其他語言,尤其是中文,如此可將相同的技術運用在中文的數位內容上。為了能夠簡化建立其他語言及語料StringNet的步驟,我們也將開發一工具稱為StringNet Builder,希望能藉此加速StringNet 的建立及與其它研究團體的合作。