建構中文語言統計模型及其在數位內容上的應用

出自 TELDAP
前往: 導覽搜尋

執行單位

國立中央大學學習與教學研究所


主持人

衛友賢


執行期限

2011年8月~2012年12月


網站名稱

Chinese StringNet Navigator


網址


計畫/網站簡介

Chinese StringNet Navigator是一個讓使用者檢索及查尋中文語料及中文片語和成語的平台,我們使用的語料庫為Chinese Gigaword,包含約5億字繁體字語料。目前主要功能有三:

  1. 關鍵字詞查詢:使用者藉由輸入中文字詞,平台將會呈現包含該字詞的文章句子。
  2. 片語查詢:系統藉由統計式計算自動自語料庫擷取出二至四字詞,並建立其延伸關係,而使用者可藉由關鍵字搜尋出包含該關鍵字的片語,並了解此片語可否盡一步延伸或透過例句學習如何使用該片語。
  3. 相似片語搜尋:利用已知片語搜尋與其具有相似結構的片語,例如"不折不扣"可搜尋出"不眠不休","不聞不問",等等。