數位典藏內容管理系統

出自 TELDAP
前往: 導覽搜尋

數位典藏內容管理系統

把整體數位博物館建構之過程,視為知識生產(Knowledge Generator)及知識管理(Knowledge management)之機制來思考,整體典藏資源數位化及網路化過程,就像一座線上自動化知識生產工廠般,也就是說網路上的傳媒無論是製作、存取及傳播,基本上都是線上作業且提供互動之功能,透過素材專業人員及資訊技術人員群力合作之自動化生產流程(Collaborative Automatic Production Workflow)來加以完成,整體流程可歸納為下列幾個步驟:

  1. 蒐集(accumulation):根據各類應用,有系統且有計畫及方向性的累積搜集蒐藏研究及展示教育活動過程中,相關之照片、錄音帶、錄影帶、幻燈片及文獻手稿等媒體記錄,作為數位化之素材。
  2. 素材組織(organization)與詮釋(description):對每件數位化典藏及展示資源各類媒體資料加以分類及組織,並進行典藏品本身之資料描述(metadata) 分析,以作為典藏品本身及各種媒體資料知識化之註解說明及使用者查詢時之索引工具。
  3. 數位化(digitize):數位化之目的,在於運用資訊技術將所蒐集之媒體轉換為可以儲存(storage)、處理(manipulate)及編輯(editing)之形式。

除各種媒體數位化規格標準制定及自動化作業機制之建立外,應考慮加密(encryption)(如浮水印(watermark))及著作權管理(right management)之保護功能。

  1. 編輯(editing):應用多媒體技術經圖形化輸入界面將經數位化之媒體結合專業人員之描述註解,配合各種應用及各類使用者之需求,經由網路線上方式由加以編輯組合成各類資訊服務及產品。
  2. 擷取(accessing):設計多種資訊存取方法包括瀏覽(browsing)及查詢(query),以提供使用者快速取得所需之教材,並提供回饋(feedback)之機制提供最佳化查詢(query optimize)使用者作修正加速資訊之取得。另使用者身份認証(Authentication)、資料授權(Authority)、存取安全性(Security)及計量計費(Accounting)等功能在使用者管理上也是必須考慮的問題。
  3. 傳播(dissemination):將提供之資訊服務及產品利用網際網路或電子媒體(E-media)傳達給使用者,傳送過程必須考量個人化(personalization)環境之需求及使用者端設備之差異調適(adaption)與互動之遠距學習機制。

在實現上述目標,整體技術在於建構整合性以多媒體資料庫為核心之數位典藏內容管理資訊架構,其所延伸之資訊技術支援及整合範圍包括下列:

  • 數位化標準作業流程及規範
  • 數位典藏內容管理系統
  • 知識單元分散式建檔及組織編輯介面
  • 數位化多媒體知識庫設計
  • 適合各類使用者之導覽與查詢功能設計
  • 使用者管理及個人化服務介面設計

整體資訊技術架構,如圖1。

圖1:數位內容建構、管理及傳播技術平台架構1.jpg
圖1:數位內容建構、管理及傳播技術平台架構2.jpg


在上述之整體功能與架構中,主要可區分為知識庫(knowledge repository)、知識的建構與管理(knowledge creation and management)及知識得存取與傳播(knowledge access and distribution) 三個層次,將典藏數位化之整體作業流程作整體之規劃,對整體所需資訊技術作整體考量,建構制度化、系統化及功能模組化之整合性功能與架構,將這些數位化資源作最有效之保存管理,進而將數位化資源產出各種不同型式與多元化之知識元件或半成品,並提供學術界、教育界、產業界及本館後續長期發展數位博物館之加值應用。

總而言之,以本館大量之典藏資源,典藏多元且複雜,如何透過上述資訊技術之整體規劃方向,建構可長可久之長期發展架構,將本館典藏所產生之數位化知識與資源,能真正為國家珍貴典藏作到長期之『保存』與無限之『再利用』價值,為本數位典藏技術平台需求之主要目標。且為達到數位化知識全球國際化交換與分享之目標,對於知識的詮釋及表示,許多標準已逐漸成形,其中有關網路化知識表達及交換格式如UML(Unified Modeling Language)、RDF(Resource Description Framework)及XML(Extended Markup Language)[13]等標準,表達資料結構之編碼工具如Dublin Core, MARC,分散式檢索標準如Z39.50 及OAI 等,在系統導入的過程中都必須一併整合及引用。

數位化作業流程及標準規範

在典藏數位化工作方面,資訊技術整合架構為支援動物、植物、地質及人類四學組典藏數位化計畫之需求,為確保整體數位化作業流程之順暢,及大量數位化資源能作有系統且有組織之管理,數位化過程應建立標準運作模式及規格,使各學組得以依循標準模式能有一致性之產出,面對本館大量之典藏資源及所延伸龐大之多媒體資料,應建立一套標準及完善之作業流程,除制訂統一數位化規格,以提高數位化之效率及生產力,確保數位化之品質及資料加密作業以保障智慧財產。並對大量之數位典藏資源提供各類使用者適當之權限,以存取權限範圍之典藏資訊。

圖2:典藏數位化作業規範與流程.jpg
圖2:典藏數位化作業規範與流程


在數位化之過程中,除數位化設備及工具之建置外,建立分散式前端輸入介面供各學組將數位化後之多媒體資料儲存在多媒體管理伺服器,將大量之數位化資源建立有效之資源管理環境,對於數位化之資源應作有效之分類管理及保存以提供後製作快速取得所需資源,以建構網路化之多媒體資料庫,以提供在利用及網路化所需素材之供應。

對數位化之多媒體物件,在儲存多媒體物件之前,每個物件檔案名稱都需依據所定的統一命名規則 (NAMING SCHEME)來命名,以方便識別、管理及維護來自動物、植物、地質及人類學域大量之多媒體物件,以期對數位化資源作有效之分類管理,並提供後續再利用及編輯組織時能由物件檔案作快速辨識及取得,所需之查詢及連結輔助資訊。整體典藏數位化流程及數位典藏、物件資訊轉為組合式多媒體文件及典藏知識單元的過程如圖3所示。

圖3:典藏數位化、多媒體資料建構及使用者查詢介面設計.jpg
圖3:典藏數位化、多媒體資料建構及使用者查詢介面設計


為建立一內容專家與資訊技術人員能分工合作各職所司之運作模式,及加速本館典藏資源數位化之腳步以提高生產力,並將數位化資源能有系統且有組織的加以編輯組合,使數位化資源能成為以使用者角度所需之資源。

因此,數位化後儲存於多媒體儲存管理伺服器之資源,則提供各學組專業人員配合資訊人員,於製作過程運用多媒體文件編輯組合介面,建構網路化多媒體資料庫所需之素材,提供蒐藏研究學組專業人員可以平行輸入且編輯之機制,將多媒體物件與各學組專業人員對內容之描述資料加以組合,並對資料之正確性及完整性作確認後,經由系統將知識庫內容自動轉換網頁呈現之機制,達到專業人員建置越多使用者可利用的資源就越多(The more you put, the more they get)的目標。

配合整體架構之發展,選擇適當之資料庫管理系統,以便必需將概念性設計產生之資源描述資料(metadata)果轉化資料庫之資料 database schema) ,並在前端設計資料輸入及編輯組合介面,提供典藏品之詮釋資料(Metadata) 、整體索引架構、影像 '聲音' 圖形'影片'文獻及3D 模型等單一媒體資料物件 (row object) 及組合式多媒體物件(organization object)之資料庫建檔及維護系統,供本館各蒐藏研究學組進行平行輸入作業,以加倍典藏資源數位化之產量,並將多媒資料儲存在分散式伺服器架構,結合各種使用者瀏覽、查詢及演示介面之設計,以快速之反應之互動環境,將資源開放在網路上。

當然在開放之過程,對媒體本身而言,為做到智慧財產權之保障應賦與加密及安全認證之處理。對使用者而言,不同之對向應提供適當之素材內容,並依使用者之身份及權限,提供所需之資訊。

知識庫系統平台架構

3.1系統整體架構說明 1. 後端採用關聯式資料庫 (RDBMS) 儲存系統之詮釋資料及多媒體應用資料內容鏈結,作為應用系統骨架 (Application Framework) 外,且為達到系統於Internet/Intranet整體的執行效率,運用多層次式主從架構 (Multi-Tier Client/Server Architecture) 為本系統之主幹;系統之建構採用分散式資料儲存與集中式查詢管理方式,後端儲存資料透過應用程式伺服器整合與規劃後,經由網路伺服器展現於前端使用者手中。如圖4。

圖4:多層次主從架構系統建置圖.jpg
圖4:多層次主從架構系統建置圖


2. 館內典藏之資料,經分類、整理後,使用相關技術與設備予以數位化後,將相關之詮釋資料與多媒體資料整合儲存於後端資料庫中,且運用階層式 (Hierarchy) 內容管理模式之觀念,以文件與資料夾的關係相互串聯。利用應用程式開發之方式將所有資料內容予以整合處理,故儲存後的典藏資料可經由不同的查詢瀏覽途徑,如SQL (Structure Query Language)、全文檢索、影像檢索QBIC (Query By Image Content)及網頁導覽等方式,取得所需之資料。

系統運作方式說明

本系統之建構重心在於三部份:

後端內容結構的分析與儲存

對於資料內容的管理採取的是結構化資料與非結構化資料分開儲存但相互關聯的方式,如圖5,為一三角型組織架構。Index Library Database與Digital Object Database分別扮演結構化與非結構化資料的角色,而運用資料庫關聯模型方法,將資料與資訊運用樹狀結構的邏輯概念將其串聯起來展現於使用者面前。對於現實面各式資料內容的儲存方式幾乎離不開此種階層式的直系與旁系關係。因此在系統開發初期更應著重於所儲存資料內容的分析與架構。

圖5:三角型系統組織架構.gif
圖5:三角型系統組織架構

中間層的系統架構

由於網際網路的興起,資料的傳遞已達無遠弗界的地步,如何將資料由身邊傳送到遠端使用者的手中,其實應是本系統開發階段最重要的議題,如圖6所示。資料儲存後如何提供相關的查詢檢索與資料展示瀏覽能力,必須依賴中間層應用程式的設計與開發以擔負起資料的整合與傳遞的功能。

圖6:各應用階層間之互動關係.gif
圖6:各應用階層間之互動關係

前端的檢索瀏覽與系統驗證

由於網頁資料的取得是使用拉引(pull)方式,故資料的取得除正確無誤外,版面配置(Layout)實為重點。如圖7說明本系統要解決之前端客戶網頁之編排問題,由於文件、影片、圖像、聲音等、可能同屬檢索後之結果,但卻分屬不同實體位置資料儲存媒體,應用系統此時需依已開發之展示樣版(Template),以XML方式描述資料內容而以XSL實際呈現內容。

圖7:分散式資料來源與網頁內容配置.gif
圖7:分散式資料來源與網頁內容配置

資料規劃與處理

  1. 實體資料數位化:利用相關輔助工具(如掃描器、數位相機、數位攝影機及文字編輯器等),將典藏資料轉換為資訊化資料,並依其相互間關係,利用一結構化階層式的方式存放於儲存媒體中。
  2. 資料間之關聯性結構,為一樹狀組織結構圖,依學域、學門、典藏單元…等相關物件所組成,每一物件可能為一單一物件類別或一物件集合,彼此間有父與子的繼承關係,最後達到資料典藏之功能。
  3. 索引產生與建立,個別將存入之典藏資料(包含文件、影像、音訊及視訊等),依其特性建立所需索引內容 (即詮釋資料, Metadata),並轉入系統物件資料庫中保存,以提供使用者查詢與瀏覽相關資料內容之功能。
  4. 展現內容內容編輯與製作,應用上列典藏資料架構方式將彼此間的串聯關係及展現方式,使用視窗 (Windows) 拖拉 (Drag and Drop) 及點選 (Click to Select) 方式產生其樹狀關係的超連結 (Hyper Link) 與可視的網頁內容。
  5. 網頁模板(Template)的應用,利用預先製作完成之網頁套版模組,提供製作人員動態網頁編輯與資料連結功能,並將網頁模板納入系統資料庫管理,以利隨時取用編輯。如圖8所示,針對相關主題連結由網頁模板套用後自動產生。
  6. 典藏知識單元查詢與展示、對於使用者的查詢需求,資料將透過系統之檔案資料庫及物件資料庫取得相關Meta-Data與Multi-Media經過資料的整合 (Data Integrate to XML Document) 與轉換 (XSL Transformation) 為網頁內容展示於使用者。
  7. 典藏資料分類瀏覽、針對所有典藏之資料內容,使用者可透過網頁階層式點選方式或資料查詢功能瀏覽儲存之資料。
圖8:典藏知識單元瀏覽架構.gif
圖8:典藏知識單元瀏覽架構

系統功能概述

資料結構內容

本系統資料儲存內容可分為三大部份,一為實體層資料,一為標本層資料及知識單元層資料。整體數位典藏資料結構及作業模式如圖9。

  1. 實體層資料:儲存該資料之詮釋資料及數位化多媒體實際資料內容,包括多媒體資料檔(影像、聲音、影片…等)、文字敘述檔及文獻資料檔。
  2. 標本層資料:本層之資料存放於知識單元中之「典藏標本」主題層資料夾(Folders)之形式存在,除儲存標本資料之詮釋資料外,並於個別標本下儲存鏈結相關標本影像實體層之物件資料。
  3. 知識單元層資料:為使瀏覽者在瀏覽某一物種∕文物時,除了解本館蒐藏標本外,並可獲得相關物種∕文物其他相關知識,設計知識單元項目,於個別知識單元中,可自由增加主題層資料夾,並於主題層資料夾下放置所配搭多媒體資料、文字內容資料等實體層資料。
圖9:整體數位典藏資料結構及作業處理模式.gif
圖9:整體數位典藏資料結構及作業處理模式

作業處理功能

1. 展示層資料維護:提供系統整體架構之瀏覽展示檔,其架構為每一學門的各分支結構內容,不儲存任何實體資料,其架構之最底層鏈結至典藏知識單元檔,並於資料更動後自動於展示網頁顯示變更內容,以達到資料動態更新之功能。

圖10:網頁套版功能.gif
圖10:網頁套版功能
圖11:網頁結果顯示.gif
圖11:網頁結果顯示

2. 知識單元維護:內容建構作業,建置典藏知識單元所需主題內容資料鏈結。

圖12:知識單元維護.gif
圖12:知識單元維護
圖13:知識單元 metadata資料維護.gif
圖13:知識單元 metadata資料維護

3. 標本資料維護:提供典藏標本詮釋資料輸入與實體層標本影像檔資料鏈結處理,及查詢、修改及刪除等功能。

圖14:標本資料瀏覽.gif
圖14:標本資料瀏覽
圖15:標本資料metadata 維護.gif
圖15:標本資料metadata 維護

4. 多媒體資料維護:提供多媒體資料載入與詮釋資料輸入,及查詢、修改及刪除等功能。並且能將每一個多媒體圖檔自動轉換格式為大圖(700X700)、中圖(500X500)、小圖(300X300),供使用者利用。

圖16:多媒體資料維護.gif
圖16:多媒體資料維護
圖17:多媒體檔案影片轉檔.gif
圖17:多媒體檔案影片轉檔

5. 知識單元網頁套版上線維護:選取需維護知識單元各主題層網頁,依據主題層內包含圖片數及文字內容,可更改圖片擺放順序,並選取網頁版型畫面。

圖18:知識單元網頁套版上線維護.gif
圖18:知識單元網頁套版上線維護

6. 網頁自動轉化:將多媒體資料庫、標本資料庫、典藏知識單元資料庫及典藏分類瀏覽架構,自動轉換成網頁及階層式呈現架構。如圖19、20及21所示

圖19:整體網站架構.gif
圖19:整體網站架構檔
圖20:典藏分類瀏覽架構.gif
圖20:典藏分類瀏覽架構
圖21:典藏知識單元內容呈現架構.gif
圖21:典藏知識單元內容呈現架構

參考資料

參與研發單位:中央研究院-民族所

提供單位:中央研究院-民族所

使用單位:中央研究院-民族所