我國數位學習及數位出版與典藏技術標準整體發展規劃報告

出自 TELDAP
前往: 導覽搜尋

我國數位學習及數位出版與典藏技術標準整體發展規劃報

緒論

資訊科技日新月異,尤其是網際網路的普遍與發達,對人們的影響相當巨大,因為網際網路的無遠弗屆,及因此產生的數量眾多卻又方便取得的網路資源,幾乎對人們傳統的生活習慣與工作模式造成戲劇性的轉變。學生不一定要依賴實體學校與書本教材等教學資源即可進行學習、世界各地的珍貴藏品也不一定要親赴當地才能欣賞,圖書資訊乃至於影像音樂等資訊與資源,也能夠相當方便的複製、傳輸與使用。這些改變,都再再顯示因為資訊科技的進步,對人類社會與行為所造成的影響。當然也因為這些影響,而衍生出前所未見的新問題,如著作權的侵犯、人際間的疏離等,然這已是不可能扭轉的大勢,建立完整而堅實的數位生活環境與系統,已是刻不容緩的重要課題。

多年以來,隨著技術發展的領域廣泛而繁雜,為確保數位環境的迅速建立,參考前且可行的技術,將能相當程度的減輕研發的人力與時間成本支出,能確保將來國際接軌與資料交換的互通性,所以在確定各領域數位生活環境與系統發展之策略與方向前,妥善研析目前國際上相關標準的發展,根據我國在地的需求做適度的在地化,訂定國家標準,作為國內產官學研各界之準繩,並進行妥善的推廣,使國家標準能夠廣泛被認識與接受,並落實育資訊系統、產品於服務中,將是有效建立我國先進而理想之數位生活環境的一種可行方式。

以下將根據我國數位生活中相當重要的三個領域:數位學習、數位典藏與數位出版,進行國際標準的研析,識別出其中的關鍵技術,確立技術發展的架構與框架,列出領域中相關的諸多重要標準,並依重要順序落實於我國國家標準的訂定。也將回顧我國目前的發展進度,並分年列出未來工作的規劃,並預估可能應用的領域及可能達成的效益。

數位生活與數位內容應用技術發展架構

數位學習技術發展架構 傳統的學習模式學習者至學校中接受教育,學校提供良好的教學與評量機制,並提供豐富的教學設備與資源,並提供一平台與機制(教室與教師教學),將教學經驗與內容傳遞給學習者,達成不同的教學目的,並以測驗、作業或評量的方式對教學效果進行驗收。這樣的教學概念大致可以轉換成一個包含不同實體(Entity)、處理(process)和訊流(flow)的概念模型,以下為IEEE 學習技術系統架構(Learning Technology System Architecture, 簡稱LTSA),為Frank Farance與IEEE Learning Technology Standard Committee(簡稱LTSC)所提出:

圖1 IEEE LTSA.jpg
圖1 IEEE LTSA

將剛才所提及的教學環境與參與者對映到這個概念模型中時,Learner Entity就是學習者,通常為學生,Coach就是教室、設備與教師作構成的教育平台,Learning Resources即教材等教學資源,Delivery及課堂上透過教師講述將教學內容傳遞給學習者的功能,Evaluation即評量學習成果的功能,Learner Records則包含的學習過程所需要的種種紀錄與資料,如學習者的入學成績、能力、基本資料、性向、測驗的結果等等。流程大致為學習者進入教學平台,如教室,若有必要先施行前測(如入學考試),並建立學習者的基本資料,教師蒐集並組織教學資源,成為教案並以特定順序的教學活動或其他方式將教學內容傳遞給學習者(如一般教學過程),最後再進行學習後的評量測驗(如期末考試),並根據評量結果修改學習者的基本資料,並視學習成果重修或升級接受新的教學。這樣的流程與其中的個體環環相扣,且都需運作順暢方能達成良好的教學效果。

隨著技術的進步,同樣的教學模式已經可以在網際網路上實現,而不一定要依賴傳統的教學現場與教師。目前被廣泛被數位學習領域討論與實作的學習管理系統(Learning Management System,簡稱LMS)將不同的個體與流程建構於資訊技術上,以達到和傳統教學機制類似的教學資訊系統。以下LMS功能模型為ADL組織所提出,可以觀察到學習模型在資訊技術上的實現方式:

圖2 The SCORM generalized model for LMS.jpg
圖2 The SCORM generalized model for LMS

其中學習者可以透過瀏覽器與網路連上LMS,LMS會維護使用者的個人資料,並根據使用者的資料需求,根據一定的順序或瀏覽規則,將教學內容呈現給使用者。教學內容中所使用的種種教學資源,也是透過網路進行搜尋、存取、重新組織或再利用。

在類似LMS這樣的技術成熟到能夠完全取代傳統教學模型前,許多流程與功能的環節必須要被實作出來,目前在數位學習領域有許多相關的產品與技術如火如荼的在發展中。國際標準組織為確保資料的交換與技術的互通,也研擬這些相關領域中可供參考的技術標準或參考模型,基於這些標準與模型,也有許多相當成功的產品與服務被產出。這樣的標準組織包含了IEEE Learning Technology Standards Committee (簡稱LTSC)、ARIADNE以及Advanced Distributed Learning (簡稱ADL)等,而數位學習中的許多技術標準則包括IMS Question & Test Interoperability、Content Packaging、Simple Sequencing、Learning Design、Access For All 、Digital Repositories、Learner Information Package、Reusable Definition of Competency or Educational Objective、ePortfilio、Enterprise Specification、Enterprise Services、Resource List Interoperability、Shareable State Persistence、IEEE LOM、1484.12.1、1484.11.2、1484.12.3、AICC Content Structure等。

我國近幾年所發展的標準則有應用於教育部教學資源網的數位教學資源交換規格v2.0,和即將成為國家標準的TW LOM,都是相當重要的技術,也因此,將這些技術落實至之前所提到的IEEE LTSA教學概念模型與LMS技術模型中,將可形成我國數學習的未來架構與遠景,這些技術與兩個模型中實體與流程的關係如下圖,並於下一章簡介重要的標準組織與標準。

圖3 數位學習技術發展架構.jpg
圖3 數位學習技術發展架構

數位典藏技術發展架構

圖4 數位典藏生命週期圖.jpg
圖4 數位典藏生命週期圖(本計畫整理)

所謂「數位典藏生命週期」係指數位資訊產生至利用與保存等不同階段,而範圍則包括數位原生資訊與資訊原件的數位化等兩大類型資訊。數位典藏生命週期不是絕對地性指任何數位資訊只有一次的生命週期,可以隨著資訊技術的變化更迭與使用者需求而有第二次的生命週期。從另一觀點而言,生命週期也是一種作業流程,原則上是有順序的,相同的也可因應資訊技術與使用者需求的變化而有所調動;例如館藏進行數位化時,同時進行儲存後,再後續著手編目的工作。

數位典藏生命週期主要是由七個步驟所組成:產生(Creation)、擷取和收集發展(Acquisition and Collection Development)、識別和編目(Identification and Cataloging)、儲存(Storage)、保存(Preservation)、存取(Access)、管理(Management)。

「產生」主要是指原生數位資料產生時所包含的相關標準格式,諸如文字檔、圖片、聲音、影像等,如表1的HyperText Markup Language(簡稱HTML)、Portable Document Forma(簡稱PDF)、Rich Text Format(簡稱RTF)、Tagged Image File Format(簡稱TIFF)、Joint Photographic Experts Group(簡稱JPEG)、Graphics Interchange Format(簡稱GIF)、MPEG-1 Audio Layer 3(簡稱MP3)、Windows Media Audio(簡稱WMA)、RealMedia(簡稱RM)、MPEG-1 Layer 2(簡稱MPEG-2)、Windows Media Video(簡稱WMV)等標準。

「擷取和收集發展」是數位資料相關的徵集、連結、選擇和擷取方式,如表1的ANSI/NISO standard Z39.50(簡稱Z39.50)、Open Archives Initiative Protocol for Metadata Harvesting(簡稱OAI-PMH)。

「識別和編目」是數位資料之相關詮釋資料編目和物件識別,可大致區分為識別、資料結構與資料值三種類型,如表1的Syntax for the digital object Identifier (簡稱DOI)、Online Information Exchange(簡稱ONIX)、Dublin Core Metadata Element Set(簡稱DC)、Categories for the Description of Works of Art(簡稱CDWA)、Darwin Core、Geographic Information(ISO 19115:2003)、Government Information Locator Service(簡稱GILS)、Metadata Interchange for Chinese Information(簡稱MICI)、Art & Architecture Thesaurus(簡稱AAT)、Encoded Archival Description(簡稱EAD)、Machine Readable Cataloguing Record(簡稱MARC)、Library of Congress Subject Headings(簡稱LCSH)等。

「儲存」是數位資料存放的空間和方式,如表1的Data Grid(ISO/TS 10303-1656)和Trusted Digital Repositories: Attributes and Responsibilities。

「長期保存」則包含硬體和軟體的轉置、各種載體的保存和外觀上的長期保存、各種格式標準之間的互運等等,如表1的Open Archival Information System(簡稱OAIS)、Metadata Encoding and Transmission Standard(簡稱METS)、PREservation Metadata: Implementation Strategies(簡稱PREMIS)。

「存取」是數位資料的取用和權利、安全管理,如表1的The OpenURL Framework for Context-Sensitive Services:The Key/Encoded-Value(簡稱KEV) Format Implementation Guidelines(簡稱OpenURL)、Special Effects Cinematography(簡稱SFX)和Rights Expression Language(簡稱REL)。

「管理」是用來管理資訊資源的metadata,包括資源再何時、如何被產生、及誰能取用它等資訊,如表1的MOA2 Administrative Metadata Elements。

數位典藏之技術架構主要是根據生命週期中不同之階段,而發展許多不同的技術標準,種類眾多而複雜。各步驟與角色所使用的標準如表1所示:

表1 數位典藏生命週期與各角色所使用之標準
表1 數位典藏生命週期與各角色所使用之標準.jpg

數位出版技術發展架構

數位出版目前在台灣的發展,仍處在由摸索期步入成長期之過度階段,無論是內容表現型式或軟硬體都已經有不少品質良好而豐富的內容產出,然限於市場規模、使用者閱讀習慣與接受度、及種種考量,仍需要有許多關鍵性的技術及策略規劃才可能有大的進展。相較於數位學習與數位典藏,數位出版是我國無論是使用者認知,亦或是產品服務的發展,是較為不成熟的。下圖為數位出版由生產到消費者服務的流程:

圖5 數位出版的流程.jpg
圖5 數位出版的流程

由數位出版由生產到消費者服務的流程圖,我們可以觀察到數位出版工作流程與技術標準相關之處,可分為「創作、出版」、「行銷、發行」、「銷售給消費者」、「內容消費」及「消費者支援」五大區塊,這部分類中相關的技術應用,將可作為技術發展架構的形成基礎。

數位生活與數位內容應用技術發展需落實之標準

數位學習領域標準組織與相關標準

國際上從事數位學習規範或標準訂定的組織很多,其中對於數位學習標準需求的提出,並形成雛形的規格(specification)的組織中,以全球學習聯盟(Instructional Management Systems Global Learning Consortium,簡稱IMS)最為重要,先進分散式學習先導組織(Advanced Distributed Learning Initiative,簡稱ADL)則偏重於現有數位學習規範與標準的整合與測試,電子電機工程師協會(Institute of Electrical and Electronics Engineers,簡稱IEEE)亦負責許多數位學習標準的制定工作,這幾個單位是全球相當重要的數位學習標準訂定組織。雖然各個組織所製訂的標準各有不同重點和特色,但其所發展的成果大致上可分為幾類,最核心的是與學習資源、學習者和學習環境相關的三類標準,然後還有最基本的基礎架構類,表2就國際上各組織所研訂的規範或標準,做一對照表。

表2 國際規範或標準組織與標準類別表
表2 國際規範或標準組織與標準類別表.jpg

參考國際標準的發展,將近幾年標準訂定藍圖規劃如圖6,主要以建立數位教材的互通性為基礎,促進標準化資源的累積,進而提升至數位資源互通的層次,平台的部份則適時發展至學習系統互通,當愈來愈多人使用數位學習時,學習歷程的記錄及互通將變得重要。此推動藍圖主要分為四個階段:

圖6 推動藍圖.jpg
圖6 推動藍圖

數位教材互通階段

此階段主要重點在於基本的教材互通性的標準研發推動上面,透過現行國際主要的標準規範如學習物件詮釋資料標準(Learning Object Metadata,簡稱LOM)與共享式內容物件參考模型(Sharable Content Object Reference Model,簡稱SCORM),不論在教材的詮釋資料上取得統一的標準,在教材互通的包裝上面也是同樣有個共同遵循的依據後,雖有不同的學習平台,但卻同樣可以利用此類型的標準,達到數位教材互通的目標。

LOM:發布時間為2002年6月15日,發起單位則是國際電子電機工程協會的學習科技標準推動委員會,國內目前有在地化的TW LOM(Taiwan Learning Object Metadata)的CNS標準。

SCORM:於2000年1月,ADL推出SCORM 1.0,2001年元月,ADL推出SCORM 1.1,2001年10月,ADL推出SCORM 1.2,2004年推出SCORM 2004,目前最新版本為SCORM 2004第3版。


3.1.2 學習資源互通階段

第二個階段在於學習資源的全球化互通推動上,透過統一的數位權利管理(Digital Right Management)機制與資源庫(Repository)分享概念,讓原本已經遵循統一標準的各項數位教材或素材資源能夠有個流通管道與模式,進一步達到更普及化的數位教材流通狀況。資源庫部份的標準目前國際上最有名的為內容元件倉儲發現與註冊架構(Content Object Repository Discovery and Registration Architecture,簡稱CORDRA)。

CORDRA:為ADL在2004年2月底的第一屆國際Plugfest大會上所提出之計畫構想,目的在研究如何串連整合世界各地之教學資源庫,?整分散各地的數位學習資訊,促進資源的分享與流通。CORDRA試圖由現存的各種不同標準、不同結構之Repository系統為出發點,定義出適當的規範來統合搜尋使用這些已經存在的課程元件資源庫(http://cordra.net/)。除此之外,未來仍有機會有其他的國際標準組織持續提出相關資源庫的標準。


3.1.3 學習系統互通階段

上一個階段的工作單純只是提供教材有個互相流通的網路式的管道,而接下來進一步地,推動學習系統上的統一標準,這樣的一項標準推動,能夠讓不論是企業界或是學界中,所使用的學習平台,都能夠有一定的規範可以遵循,不只是單純的學習管理系統(Learning Management System,簡稱LMS)或是學習物件管理系統(Learning Content Management System,簡稱LCMS),甚至是更進一步地學習活動管理系統(Learning Activity Management System,簡稱LAMS)等各平台,讓使用者不單僅於學習的教材方面的統一,甚至是平台的統一,讓平台之間的資訊可以跨平台溝通,互相互通有無。

Common Cartridge:為IMS Global Learning Consortium (http://www.imsglobal.org/commoncartridge.html)所提出的,目前仍為草案階段。


3.1.4 學習歷程互通階段

最後一個階段在於所有的數位學習標準之本,也就是學習者本身,第三階段當完成平台面的整合統一之後,雖然使用者在平台上的資訊有所固定規範,但在個人化的資訊上,仍是必須從第四階段的學習歷程互通階段開始著手,使用者能夠如同現實上的機制一般,擁有如同護照或身分證一樣的文件,能夠透過這樣的一份文件,暢行無阻,同樣地在最終目的上,若能夠讓使用者在數位學習的生涯中統一擁有個人的學習剖繪(Profile),並且在數位學習的過程中,累積自身的數位學習歷程檔案(e-Portfolios),這樣一來,等於可無遠弗屆地帶著走,橫跨各個平台、紀錄各項所使用過的學習資源等,達到最完整的數位學習成效與成果。

ePortfolio:ePortfolio標準為IMS Global Learning Consortium(http://www.imsglobal.org/ep/)所提出並於2005年7月通過,目前最新版本仍為第一版(Version 1)。


3.2 數位典藏領域標準組織與相關標準 根據數位典藏生命週期,可知數位典藏生命週期主要是由七個步驟所組成:產生(Creation)、擷取和收集發展(Acquisition and Collection Development)、識別和編目(Identification and Cataloging)、儲存(Storage)、保存(Preservation)、存取(Access)、管理(Management)。

貫通這七個步驟中,最重要的元素之一,可以說是詮釋資料。詮釋資料是一組結構化與標準化的背景資料,包括描述性、結構性與管理性三大類型,以及語義性、語法性與詞彙性三大屬性,用來描述每個數位典藏品的內涵與特徵,以便數位典藏品能夠在數位化環境或系統中,達到最佳化資源探索(resource discovery)的效能,並能有效率而精準地被檢索、呈現、管理、控制與執行相關功能,且順利地與其他數位典藏品進行資源的互通與共享,最後還能達成數位典藏品的永久保存目的。因此,我們可以將詮釋資料的規劃與實施,視為數位典藏工程中最基礎的資訊建設工作。

隨著數位圖書館的發展趨勢,84年起中央研究院計算中心即對詮釋資料的議題進行相關的研究,並於91年「數位典藏國家型科技計畫」的實施之際,在技術研發分項計畫與中央研究院機構計畫支持下,共同成立了「數位典藏計畫後設資料工作組」(Metadata Architecture and Application Team,簡稱MAAT),負責此一國家型計畫有關詮釋資料方面的推動與規劃。

數位典藏計畫後設資料工作組主要負責提供國內各單位相關詮釋資料標準的規劃與建議,也製作出許多主題計畫供相關子計畫參考使用。對於詮釋資料相關標準的研譯和中文化投入較深,故以下就針對詮釋資料的部分作說明。依據後設資料工作組之分類如圖7所示,並分別介紹數位典藏標準之十大類。

圖7 數位典藏標準領域與相關標準.jpg
圖7 數位典藏標準領域與相關標準

數位典藏標準之十大類。發展的策略,從各個不同領域著手,發展專屬而符合個別需求的該領域內標準,如博物館界之CDWA、圖書館界之MARC21及檔案館界之EAD,接著再進行可達成跨領域間資料交換與分享之一般性詮釋資料標準之發展,如Dublin Core。以下分別詳述之。

表3 數位典藏標準一覽表
表3 數位典藏標準一覽表0.jpg
表3 數位典藏標準一覽表1.jpg
表3 數位典藏標準一覽表2.jpg

數位典藏之未來發展趨勢,已逐漸從描述性的資訊(例如Dublin Core),轉向結構性資訊以及其所衍生出之與加值運用(如EAD、METS)等結構性metadata。另外如保存性後設資料(如PREMIS)及管理性後設資料(如MOA-2)等,依功能性的不同而能衍生出不同應用之後設資料標準,也將是加來發展相當重要的一環。

數位出版領域標準組織與相關標準

目前我國內廠商於數位出版所採用的標準及技術,參考表4之觀察,主要可以區分為幾個領域,並說明如下:

電子書檔案格式

外部顯示以PDF為主,內部則使用可延伸標示語言(Extensible Markup Language,簡稱XML)。數位檔案命名的原則上,多數廠商自訂命名原則(如芯強),也有廠商使用文建會核發之編號(如遠流)。

詮釋資料格式

有EML、OeBF、DocBook、TEI或自行定義等格式。

權利保護措施

包括加密、浮水印、數位簽章等方式,DRM的管理機制,則主要透過硬體的控制,目前各家廠商並未有一致的機制。

表 4 數位出版廠商採用數位出版標準與技術
表 4 數位出版廠商採用數位出版標準與技術.jpg

綜合目前國內外所採用的標準及技術,彙整為國內數位出版所採用之標準規劃藍圖(表5)。

表5 數位出版所採用標準規劃藍圖
表5 數位出版所採用標準規劃藍圖.jpg

過去、現在與未來的工作規劃

數位學習領域成果與規劃

目前成果

近幾年來在國家數位學習相關政策的支持及產、官、學、研各界的努力之下,我國數位學習產業己逐漸成長,為了強化數位學習產業的基礎建設,加速與國際接軌,我國也將國際標準的研究及推廣列入重點項目之一。而在數位學習的眾多標準中,如何解決平台與教材間之互通性問題尤其被受到重視,隨著美國ADL將相關標準整合成共享式內容物件參考模型(Shareable Content Object Reference Model, 簡稱SCORM)規範,數位學習業者可以選擇引用此標準來解決消費者所關心的教材與平台之間互通與共用的問題,能夠提供教材製作者與學習者更加方便的介面,教材製作者可以提供能於符合該標準的各平台上播放的教材,而學習者更不用煩惱買到的教材到底有沒有辦法在某些平台上使用。

因此在數位學習標準採用方面,我國自2001年開始就持續追蹤IMS與ADL的發展,為了解決國內教材與平台互通性的問題,數位學習國家型計畫全力投入SCORM標準的研究及推廣,並持續派員參與(主辦)ADL Plugfest(6-9)、International Plugfest大會及IMS相關論壇與IMS ICP(International Certification Program)的國際數位學習標準認證的討論活動,目前國內各界對於SCORM規範大多俱有一定程度的認識,除了學、研各界有投入相關研究之外,產業界的數位學習產品也隨著政府的推廣而漸漸導入並採用(依據資策會提供的資料,目前國內各單位使用的學習平台符合SCORM的比率約在80%以上)。

過去幾年,我國選擇採用標準的準則,是要能克服平台及教材互通性問題,即以能促進數位教材流通為先,在漸漸克服此問題之後,目前我國數位學習的首要工作乃是建立數位學習的加值應用,而其必要工作之一為加速學習資源的累積、分享與流通。然而,SCORM並未涵蓋所有數位學習規範的面向,因此針對相關學習資源的標準化以達到資源分享概念,更需將平台、工具、課程與素材的標準擴展至學習資源、學習系統、學習歷程等各個層面。使學習資源能夠互動流通,並建立國際學習資源分享庫之機制,與全球交換資源,提升我國數位學習產業國際地位及國際競爭力。其相關願景有:


促進國內學習資源流通

數位學習資源整合與分享、再利用機制,將使數位學習更具實用性及更有效益。透過學習資源標準的建立,建構跨部會、產企業與國家相關學習資源互通機制,避免重複投入研究與開發之浪費,達到分享與擴散之效果。


推廣非正式學習

從網路發展的趨勢來看,個人化學習環境的實現,將會落實於非正式學習,而這種非正規教材的交換與分享將會是未來知識獲得主流方式(knowledge/learning/information on demand),因此,除了目前正規的教材標準外,針對不同的學習資源與知識型態也必須要有一致的規範與分享標準。



建立我國數位學習產業的國際競爭力

受限於國內數位學習內需市場的有限,數位產業須以全球市場為戰場,其中標準便扮演了與國外介接的重要的關鍵因素。因應目前華語文數位學習的熱潮(預估華語文全球市場未來5年商機約600億美元),在佈建國際通路及面對大廠競爭時,以採用共同標準的數位學習教材資源庫概念,將會使業者能在最短時間內提供大量符合國際標準的數位學習資源,以快速建立我國數位學習產業的國際競爭力。

除了學習資源互通之外,學習系統功能及學習歷程互通之相關標準也皆參照國際建議標準,採用之原因請參考本文第參、第肆章節之內容說明,建議未來能適時引入並建議我國相關平台業者在未來平台相關模組開發時能採用,以利未來有助於國際平台、系統互通,使數位學習系統之解決方案能與國際界接。

對於數位學習業者而言,標準的運用乃是為了提升自身產品與市場上其它產品的相容性及整合性,增加產品的市場競爭力,同時取得消費者的認同,對數位學習相關產品之消費者而言,選擇合乎標準的產品,則隠含著多了一份後續使用及維護上的保障。

目前我國在數位學習標準的採用及推廣上仍跟隨著國際上相關標準製訂組織的步伐,即所採用的標準都以能跟國際界接為主,目的是希望藉由一致化的標準與國際產品、技術接軌,因此在本土化的策略部份,建議除將標準進行中文化以利閱讀了解外,不建議有過度的修改,以免引發標準無法相容的問題,另外,為加快國內各界能對所推行的標準有所了解,若能在中文化之外,製作使用指引等相關文件,相信更能加速各單位的導入效率。

教材描述的重要性

在所有標準中,最基礎的一部份,可說是教學資源的描述。教學資源的後設資料若是著錄完備,將是達成往後資料交換與分享之互通性的基礎,也是所有分祥平在在儲存、管理、維護上不可或缺的一環,所以教學資源的描述性後設資料可說是標準發展中必須最優先進行的。目前國際上最廣泛被認知且採用的權威標準,可說是IEEE 的Learning Object Metadata(簡稱LOM),經過我國數位典藏國家型科技技畫後設資料工作組的研析、譯為中文版、並根據我國在地的需求以IEEE LOM為基礎,草擬了符合我國內使用之TW LOM標準,也已逐漸成熟,在多個單位如文件會成功導入應用,我國在教學資源描述相關的標準發展上的成果可說是與國際發展相切合的。以下分別簡介IEEE LOM與TW LOM。


IEEE LOM的發展與學習物件描述規格的重要基礎

所謂的學習物件(Learning Objects),可為數位化或非數位化的實體,並且可被利用、再利用或引導支援學習的相關技術,如電腦式訓練系統、互動式學習環境、智慧型電腦輔助系統、遠距學習系統或整合性學習環境等。學習物件相關的屬性,包括對物件的類型、創作者、所有者、和格式的描述。

在眾多描述學習物件屬性的標準中,IEEE Learning Object Metadata(簡稱LOM)著重在學習物件管理、定位和評估所需的最少的屬性,提供九大類目、基本的欄位和實體類型,供個別的資訊系統應用發展,各欄位彈性不限制其必須性,並可描述教學屬性如教學或互動模式、年級、知識程度以及學習條件等。 LOM 目前已經被世界主要的教育科技產業所支持,如: IMS 、 ARIADNE 、 CanCore 、與 SCORM 均由其延伸發展而來。


TW LOM即將成為我國家標準

為因應國內教育環境的語言文化與在地需求,數位典藏國家行科技計畫後設資料工作組以LOM為參考基礎,並援引SCORM 2004標準中Meta-data部分對學習物件聚合層級的概念,發展適用我國內教育環境與學習物件使用者的「學習物件詮釋資料標準TW LOM」,期能提供國內各教學資源交換平台一參考標準,達成後設資料描述資訊的一致,進而整合各個交換平台中的教學資源,達成學習物件的互通。經過多次的審定與公聽後,目前TW LOM已通過經濟部標準檢驗局技術委員會之審核,即將成為我國CNS國家標準。

隨著經濟部標準檢驗局96年「規劃與建置數位內容與數位生活應用之技術標準環境」之進行,除了TW LOM以外重要的數位學習環境基礎標準也逐漸落實,如:

IMS Content Packaging, Version 1.14 Final Specification

IMS Question and Test Interoperability , Version 2.1 Public Draft(revision 2) Specification

IEEE 1484.11.1- IEEE Standard for Learning Technology—Data Model for Content to Learning Management System Communication

IEEE 1484.11.3-IEEE Standard for Learning Technology-Extensible Markup Language(簡稱XML)Schema Binding for Data Model for Content Object Communication

IEEE 1484.12.3-IEEE Standard for Learning Technology- Extensible Markup Language(簡稱XML)Schema Definition Language Binding for Learning Object Metadata

以上標準為96年之成果,皆已擬定為我國家標準草案,並通過試審會。

未來工作規劃

97年預計工作項目與重點

標準名稱:IMS Common cartridge,教材服務交換標準。

建議採行原因:

目前SCORM 2004的標準於國際上應用並不如預期順利,大多數仍以符合SCORM1.2為主,但又缺乏整合評量標準等其他相關標準。目前由IMS主導的Common Cartridge教材服務交換標準,是針對SCORM 2004的缺點與加入QTI等常用的標準作整合,Common Cartridge捨棄SCORM難以實施的適性化瀏覽(sequencing)部分,而保留其如IEEE1484.11.1的資料模型部分與Content Packaging等部分並加入評量標準(IMS Question & Test Interoperability IMS Question & Test Interoperability,簡稱QTI)與工具溝通標準(IMS Tools Interoperability, 提供各學習工具服務與平台的介接)。目前已有國際各大平台業者(BlackBoard/WebCT, Moodle)與內容業者(McGraw-Hill Education, Pearson Education)加入與支援之。未來將會是全球通用的教學資源交換標準之一。

預期效果:

Common cartridge標準得對於資源管理上,更能具備一致性與有效性,未來的數位教材能包含更多學習活動紀錄與資源並且能夠更輕易的交換與跨平台使用,透過此標準除了教材與平台間的交流互通外,亦可使用第三者提供之學習工具(例如,測驗工具、電子助教等等工具),使學習的功能更加的靈活、多元化。積極研究引進此技術將使國內相關產學研單位能夠與國際接軌,開發出符合國際標準具國際競爭力的數位學習平台工具與教材。

98年預計工作項目與重點

標準名稱:IMS ePortfolio,電子學習檔案(護照)終身學習標準。

建議採行原因:

目前,不論是在傳統學習或是數位學習, 終身學習的達成皆為兩者共同的目標之一, 而在終身學習的路上, 如何紀錄與使用學習者的學習歷程與經歷將會是終身學習非常重要的一個助力與必然的趨勢。「電子學習紀錄」(electric portfolio,簡稱ePortfolio or e-portfolio)將會是其推動不可或缺的重要元素。所謂的ePortfolio(electric portfolio)直譯為中文是為「電子作品集」,其中portfolio單指的是作品的集合。在國際上,最早的ePortfolio指的是單純的作品集的電子化,例如:某個畫家我畫了幾幅畫,並把這些作品透過掃描或是照相數位化,然後上載到個人的電子作品網頁以供他人觀看討論。

終身學習將會是未來全球各國關注的重點,透過終身學習的推動能擴大學習產業並提升國民整體素質與國家競爭力,因此參考國外目前已有之ePortfolio電子學習檔案標準並建立符合國內在地需求的終身學習標準將會是提升台灣未來全民學習的重要基礎建設。

預期效果

ePortfolio電子學習檔案能夠加強個人學習的動機與效果並以聚落學習帯動社會學習。基於學習管道的增加、學習方法的革新與學習的多元化將會提升數位學習的範疇與效果。此外對於證照學歷電子公信化、人力資源的趨勢、人力資源品質加強亦會有正面影響的帶動。

數位典藏領域成果與規劃

數位典藏牽涉的面向相當廣泛,隨著數位典藏國家型科技計畫的多年發展,目前我國於數位典藏方面的成果可謂相當豐碩,也協助許多不同領域社群的單位導入許多不同的標準,將來除了各個領域的專屬標準,跨領域的標準發展及其衍伸的聯合目錄或聯合查詢應用,也將是相當重要的發展項目。以下將分別介紹我國數位典藏標準發展的成果:

不同社群內發展在地化的國際標準

博物館類

Categories for the Description of Works of Art(簡稱CDWA)

標準名稱:Categories for the Description of Works of Art(簡稱CDWA)

網址:http://www.getty.edu/research/institute/standards/cdwa/

標準簡介:此標準旨在發展一套資訊結構,作為博物館與檔案學界描述藝術作品(如繪畫、雕刻、陶藝、建築、傢俱、表演藝術等)及其影像資料的標準。其設計理念是從藝術作品研究、展示與教育功能需求出發,著重藝術品完整的生命週期記載資訊,提供給研究者一致、可信的內容。另一方面,CDWA所定義的架構也提供交換和共享的功能,使各地的典藏機構可以交換藏品資訊。除了著重於「物」的描述,AITF也陸續發展人、地、索引典等相關標準,為藝術作品提供更具品質控制的資料著錄規範。

發展維護單位:J. Paul Getty Trust之藝術資訊任務小組(Art Information Task Force, 簡稱AITF)。

最新版本:第2.0版(2000)

相關應用計畫:故宮文物數位典藏系統之開發與建立-器物數位典藏子計畫

國家歷史文物數位典藏計畫-玻璃器、剪紙、攝影……



Core Categories for Visual Resources(簡稱VRA Core)

標準名稱:Core Categories for Visual Resources(簡稱VRA Core)

網址:http://www.vraweb.org/vracore3.htm

標準簡介:此標準以視覺資源社群為焦點,提供指引以描述藝術品、建築物、器物,大眾或民族文物等視覺資源。為了便利於視覺資源社群間資訊的交流與分享,其設計原則著重元件(共17項元件)簡單、彈性、可重覆應用,並提供元件資料值(data value)建議標準,以利資料的一致性與正確性。目前仍持續發展中,主要特色包括:依循Dublin Core 1:1的語意規則,即利用一組後設資料元件描述一物件(object)或資源(resource)。提供一個描述視覺資源典藏品的範本(template),區為作品(work)和影像(image)二種概念,以利識別創作原作和其代替物(如照片、電子影像檔)。元件彈性,描述層次介於簡單(minimal)及詳細(full)之間,作為與其他文化遺產資訊間的互運機制,相關的對照包括MARC、CDWA等標準。

發展維護單位:視覺資源協會資料標準委員會(Visual Resources Association Data Standards Committee)

最新版本:第3.0 版(2000)

相關應用計畫:台灣視覺記憶數位典藏



SPECTRUM:the UK Museum Documentation Standard

標準名稱:SPECTRUM:the UK Museum Documentation Standard

網址:http://www.mda.org.uk/spectrum.htm

標準簡介:MDA於1991年起,開始進行SPECTRUM內容編輯,其目的在於彙整英國博物館界百年來累積的管理專業技術與經驗,並於1994年出版第一版。SPECTRUM內容主要有可分為二大部分,一為藏品管理程序(procedures),定義了20項管理程序,如文物蒐集、登錄、典藏等,並說明各階段相關的鑑定與描述資訊。另一為資訊環境的建立(information requirements),說明支援藏品管理所需的各項資訊需求,例如文物描述、編目指引和專門術語來源等。

其他還有館藏記錄的維護、登錄管理和文物管理政策檢核表等,可作為規劃館藏政策的參考,以及發展藏品資訊環境的作業準則。於文物館藏記錄方面,可分類幾大類資訊:典藏機構資訊、編目記錄資訊、文物識別資訊(含文物描述、製作、歷史及參考文獻等資訊)、藏品管理程序資訊(依20項藏品管理程序,分別描述所需資訊),以及依人/事/時/地/團體等複合的識別資訊。

發展維護單位:The Museum Documentation Association(MDA)。

最新版本:第3.0版(2005)



CDWA Lite

標準名稱;Categories of Description of Works of Art(簡稱CDWA) Lite

網址:http://www.getty.edu/research/conducting_research/standards/cdwa/cdwalite.html

標準簡介:CDWA Lite是一份XML綱要,基於CDWA與CCO(Cataloguing Cultural Objects)兩份標準來描述藝術作品與文化物件的核心紀錄。

發展維護單位:J. Paul Getty Trust

最新版本:第1.1版



檔案館類

標準名稱:Encoded Archival Description(簡稱EAD)

網址:http://lcweb.loc.gov/ead

標準簡介:起源於1993年美國加洲柏克萊大學圖書館的「柏克萊檢索工具計畫」(Berkeley Finding Aid Project, 簡稱BFAD);於1998年經SAA的EAD工作小組通過成為標準,交由「美國國會圖書館網路發展與機讀標準辦公室」負責維護。EAD是一種結構化的檔案檢索工具(finding aids)標準,其發展目的是為了支援檔案和手稿的收集保存,提供一個永久編碼標準,可機讀處理各種單位(如檔案館、圖書館、博物館與手稿館)所產生的目錄、登錄簿、索引等查檢工具,以利檔案資源易於在網路上取得。

發展維護單位:美國國會圖書館網路發展與機讀標準辦公室(The Library of Congress Network Development/MARC Standards Office)

最新版本:第一版 (1998)

相關應用計畫:近史所檔案館外交經濟重要檔案數位典藏計畫

珍藏歷史文物數位典藏計畫分項五-內閣大庫檔案著錄格式、權威檔建立


善本類

標準名稱:Machine Readable Cataloguing Record(簡稱MARC)

網址:http://www.loc.gov/marc/

標準簡介:機讀編目格式(簡稱MARC)應該說是圖書館界編目格式的大家族,而非單一標準。起源於1965~6美國國會圖書館發展一套標準化的資料記錄架構(LC MARC),以利圖書館間書目資料的交換。之後各國紛紛採用,並以國情加以修訂,如US MARC(美國)、UK MARC(英國)、CAN/MARC(加拿大)、AUS MARC(澳洲)。以下以MARC 21為例,說明MRAC的結構。MARC 21為美國、加拿大以US MARC為基礎,將US MARC與CAN/MARC加以修訂整合的編目格式,並於1999年出版〝MARC 21 Format for Bibliographic Data〞。MARC 21機讀編目格式由三項要素組成:

記錄結構(record structure):為了國際性書目資料的交換,需符合資訊交換標準的規範,如美國國家標準局的ANSI/NISO Z39.2(Information Interchange Format)、國際標準組織的ISO 2709標準(Format for Information Exchange),均規範了交換格式的需求,以及資料處理系統交流的架構。

內容標示(content designation):為標籤、代碼與約定,以快速識別機讀格式,進而描繪機讀記錄中的資料元件,以支援MARC格式資料的操作。

記錄的資料內容(data content of the record):即資料登錄欄,由其他標準規範其內容格式,如國際標準書目著錄(ISBD)、英美編目規則第二版(AACR 2)、美國國會圖書館標題表(LCSH)、美國國會圖書館分類法(LCC)或其他。

發展維護單位:美國國會圖書館-網路發展與機讀編目格式標準發展辦公室

(Library of Congress- Network Development and MARC Standards Office)

最新版本:1999(持續發展中)

相關應用計畫:台灣原住民數位典藏計畫

珍藏歷史文物數位典藏計畫分項三-傅斯年圖書館藏善本圖籍數位典藏



考古類

標準名稱:Monument Inventory Data Standard(簡稱MIDAS)

網址:http://www.english-heritage.org.uk/midas

標準簡介:MIDAS是描述遺址、遺跡的標準,第一版於1999年由RCHMES出版。其目的並非目錄的內容控制,而在於提供目錄發展的通用框架(framework),以其達到提升資訊的檢索、交換、相關目錄系統連結或系統有效轉移(migration)等目的。主要設定是三大對象為使用者:包括1)國家或地方機構持有文化遺產的專業管理者。2)推動文化遺產保存的社會團體,供其系統化地收集與記錄資訊,以有效保存國家遺產。3)其他相關議題的發展者,如地名辭典(gazetteer)、或支援分析的工具。

MIDAS主要可分為二大部分:Information scheme,有七組元件集,可滿足考古遺址、發掘單位、遺跡三層級的描述架構。Unit of Information,每一結構(schema)包含多組資訊元件,有些描述元件則重複應用於不同的結構。

發展維護單位:The Royal Commission on the Historical Monument of England

(RCHME),National Monuments Record Centre

最新版本:第3.0版(2003)



語言/語料庫類

標準名稱:OLAC Metadata Set(簡稱OLACMS)

網址:http://www.language-archives.org/OLAC/olacms.html

標準簡介:OLACMS是根據OAI架構,為了資源共享和發現資源的目的所建立的後設資料標準。欄位架構主要以DC為基礎,並參酌語言資源的特性所發展出的精簡且全面的後設資料集,共包含二十三個元件。

發展維護單位:語言開放典藏社群(Open Language Archives Community, 簡稱 OLAC)

最新版本:2003/12/8

相關應用計畫:語言典藏計畫-臺灣南島語典藏



地理空間資訊類

標準名稱:Content Standards for Digital Geospatial Metadata(簡稱CSDGM)

網址:http://www.fgdc.gov/metadata/contstan.html

標準簡介:此標準目的在於提供記錄數位地理資料共通性的術語和元件,藉由建立資料元件的名稱和複合元件(元件集)、定義和資料值的規範等方式來達到目的。其發展原則以使用者的資訊需求導向設計,以利其有效決定地理資料、檢索方法或工具,及轉換資料。廣為美國各地的機關、地方政府、私人機構和非營利性組織所採用。其標準架構主要包括:後設資料(Metadata)、識別資訊( Identification)、資料品質資訊(Data Quality)、空間資料組織資訊(Spatial Data Organization)、空間參考資訊(SpatialReference)、實體與屬性資訊(Entity and Attribute)、供應資訊(Distribution)、後設資料參考資訊(Metadata Reference)、引用資訊(Citation)、時間資訊(Time Period)、聯絡資訊(Contact)。

發展維護單位:美國聯邦地理資料委員會(Federal Geographic Data Committee)

最新版本:第2.0版(1998)(FGDC-STD-001-1998)

相關應用計畫:近代中國歷史地圖與遙測影像資訊典藏計畫



影音/多媒體類

標準名稱:ECHO(European CHronicles On-line)Metadata Model

網址:http://pc-erato2.iei.pi.cnr.it/echo/workpackages/wp3.html

標準簡介:回響計畫由歐盟(European Community)所贊助,其目標在於建立國家級的網路電影資料庫。為了資料的一致性與互運性,其發展出一套內容描述的標準(或稱後設資料標準),以描述影音資料錯雜、多層次、時間獨立性(time dependent)和豐富的資料流(data streams)等特質,並確保參與計畫的典藏能夠互運資源。此資料模式以IFLA的書目記錄功能需求模式(FRBR model)為基礎,將影音資料分成四個層次:Work(AV document)、Expression(Version, Video, Audio, Transcript)、Manifestation(Media)和Item(Storage)。每一層次均提供適當的後設資料欄位。

發展維護單位:ECHO(European CHronicles On-line)project

最新版本:第2.0版(1999)

相關應用計畫:臺灣社會人文電子影音數位博物館



生物多樣性類

Darwin Core(簡稱DwC)

標準名稱:Darwin Core(簡稱DwC)

網址:http://speciesanalyst.net/docs/dwc/index.html#overview

標準簡介:生物學家利用田野採集所記錄的標籤來辨識標本,藉由這些記錄具體描繪所處的時空位置並做出正確的分類鑑定。這些記錄可能沒有一致的資料內容、編碼、結構或類型,而Darwin Core試圖在不考慮儲存內容機制的前提下,提供48項元件標本的共通性記錄。另外,其建議檢索點(access point),及標本與觀察資料庫的檢索功能;並提供查詢語言參數以利資料能獨立於網路協定;以及由DwC伺服器取回的記錄其內容、結構和格式的指引。

發展維護單位:The Species Analyst project研究計畫

最新版本:第2.0版(2003)

Species 2000 Data Standard

標準名稱:Species 2000 Data Standard

網址: http://www.sp2000.org/Standarddata.html

標準簡介:Species 2000計畫,由國際生物科學聯盟發起,並聯合多個國際組織於1994年9月共同成立。成立動機是為建立一個包含全球主要物種群的生物物種資料庫,以一致的物種分類系統紀錄各物種群中的所有已知的物種資料。Species 2000利用一組標準資料欄位來描述所有已知的物種。這些資料欄位是簡化自Global Species Databases(簡稱GSD,為一種包含全世界單一分類群之所有物種的資料庫)而來,所以可相容多種不同的現有物種資料庫之資料欄位。利用此組標準資料欄位,使用者輸入物種名稱,即可取得來自特定物種資料庫所提供的物種資料。例如:如魚類名稱,可取得來自FishBase所提供的魚類資料;輸入細菌名稱,可取得來自ProkaryoBase所提供該細菌的資料。

發展維護單位: Species2000 計畫

最新版本:第1.2版(2002)

相關應用計畫:臺灣動物相典藏之研究-魚類與貝類

NDAP分項計畫-動物主題小組

跨社群/學科/資料領域:DC與聯合目錄

一般性類

標準名稱:Dublin Core Metadata Element Set(簡稱Dublin Core / DC)

網址:http://dublincore.org/documents/usageguide/

標準簡介:Dublin core後設資料標準,是一組簡單卻有效的核心元件集。源起於1995年OCLC(Online Computer Library Center)與NCSA(National Center for Supercomputing Application)聯合召開的第一屆Metadata Workshop,為了加速網路電子資源的整理與組織,並加強網路資源的找尋與檢索的精確性,集合了圖書館界、資訊科學等各領域專家,制定一套專為描述網路電子資源的後設資料格式。因此其制定初始,既設定了簡單易產生或維護、通用易瞭解的語意、全球通用、彈性高等四項原則。因DC元件(共15項)具有核心(core)和通用(universal)的特性,觀察近來的應用趨勢,一方面應用於描述機構內部典藏或產生的資源,以支援入口網站(portal)的服務或內部的知識管理;另一方面作為各式Metadata 的交換格式,以達到開放的資訊環境中,跨學科領域的資源互運。

發展維護單位:The Dublin Core Metadata Initiative(簡稱DCMI)

最新版本:第1.1版(1999)(ISO Standard 15836-2003)

相關應用計畫:NDAP分項計畫-數位典藏聯合目錄建置



權威控制類

The Alexandria Digital Library Gazetteer Content Standard(簡稱ADL GCS)

標準名稱:The Alexandria Digital Library Gazetteer Content Standard(簡稱ADL GCS)

網址:http://www.alexandria.ucsb.edu/gazetteer/ContentStandard/version3.2/GCS3.2-guide.htm

標準簡介:ADL GCS為記錄地理地方的完整性架構,包括地名(及沿革)核心元件、空間位置(含各種表達方式)、層級分類、和從各處蒐集而來的地方典故。基於驗證GCS的適用性並推廣利用,其地名詞典資料庫蒐集了各地地理資訊,如私人、國家性、國際性和特殊知識機關與團體等,達到資源分享的目的。GCS被設計為滿足地名詞典(gazetteers)的需求,包括地方今名的詳細資訊和歷史資料,並支援國際性、多語言的應用,亦可連結該地其他的資訊來源,可謂是記錄地名詞典的檔案架構,利用其附加的目錄可支援查詢和回饋訊息等基本功能的服務。

發展維護單位:Alexandria Digital Library Project

最新版本:第3.2版(2004)



The Getty Thesaurus of Geographic Names(簡稱TGN)

標準名稱:The Getty Thesaurus of Geographic Names(簡稱TGN)

網址: http://www.getty.edu/research/conducting_research/vocabularies/tgn/

標準簡介:Getty這個組織專注於藝術、建築和文化文物的發展與保存,因此其所發展的詞彙(vocabularies)偏重於此領域的專門術語、相關的文物、思想、藝術家以及與上述相關的地方資訊。TGN是一結構性的詞彙,有多達百萬餘筆地名和資訊,涵蓋當今世界各洲、國家以及歷史地點。TGN記錄(record)的焦點在於「地方」(place),標示為資料庫的唯一值,以連結至其名稱、階層結構中的上層地方、關聯性、地理座標、附註、資料來源、以及地方屬性(如居住地、州郡)。而描述一地的核心項目為地名、地理層級關係、與地方屬性(人文或自然特徵)三項。任何一地的名稱,可包含當地語言、英語、其他語言、歷史名稱、自然或倒置順序的名稱,但只有一個被標示為主要名稱(preferred name)或描述語(descriptor)。

發展維護單位:Getty Vocabulary Program of The J. Paul Getty Trust

最新版本:第2.0版(2000)


未來工作規劃

97年預計工作項目與重點 標準名稱:

檔案編碼描述格式(Encoded Archival Description, 簡稱EAD),CDWA Lite、及ISO/IEC 21000(MPEG 21)-Part 5: Rights Expression Language


建議採行原因:

EAD起源於1993年美國加洲柏克萊大學圖書館的「柏克萊檢索工具計畫」(Berkeley Finding Aid Project, 簡稱BFAD);於1998年經SAA的EAD工作小組通過成為標準,交由「美國國會圖書館網路發展與機讀標準辦公室」負責維護。EAD是一種結構化的檔案檢索工具標準,可支援檔案和手稿的收集保存,提供編碼標準,以機讀方式處理各種單位(如檔案館、圖書館、博物館與手稿館)所產生的目錄、登錄簿、索引等查檢工具,使檔案資源可透過網路取得。

CDWA Lite是一份XML綱要,基於CDWA與CCO兩份標準來描述藝術作品與文化物件的核心紀錄。CDWA最主要是針對藝術品聯合目錄與OAI所設計,共有22組詮釋資料,1到19組為描述性質的詮釋資料,20到22組則為行政管理性質的詮釋資料。透過CDWA Lite 可以達到建立藝術品及文化資產類的藏品聯合目錄的交換機制。

REL部分,網際網路使得多媒體資源的傳播無遠弗屆,但是這資源的傳播牽涉到各種權利擁有者對這些資源所持有的權限。網際網路使交易模式不斷的演變,多媒體資源的權利、期限和使用情況也越趨多元,這些權利的表達,可以很簡單也可以很複雜。ISO/IEC 21000-5 Part 5即為權利表示語言,其功能就是描述數位資源的授權,特別是數位影音資源的相關授權。雖然REL設計的初衷是應用於數位多媒體材料,但權利表示語言其實是一種一般性的需求,並不限於多媒體,故此一權利描述語言可以應用於其他類型的數位資源上。


預期效果:

目前國內的檔案社群多使用EAD為檔案描述的架構,如國史館與臺灣文獻館,且EAD已有中譯本,顯示我國對EAD的了解與掌握已達一定程度,在本土化的進行上較容易找到相關的經驗與建議。故建議於97年進行本土化。目前國內博物館社群多使用CDWA為藝術品描述的標準架構,如國立故宮博物院與國立歷史博物館。在此基礎上,採用以CDWA為基礎的交換標準CDWA Lite,可促進並加強博物館館際間資料的交流與互通,故建議於97年進行本土化。於REL部分,數位典藏各項藏品於網路上交易流通的關鍵,在於DRM機制的運作,而DRM的核心,就是數位權利語言。在各種REL中,MPEG 21 Part 5發展的涵蓋面與完整性,可運用性也較高,而且目前此規格已成為國際標準,故建議我國應盡速進行此標準的研譯。


98年預計工作項目與重點 標準名稱:

Categories for the Description of Works of Art(簡稱CDWA)、PREMIS、古今漢字構形及ISO/IEC 21000(MPEG 21)-Part 6: Rights Data Dictionary


建議採行原因:

CDWA在發展一套資訊結構,作為博物館與檔案學界描述藝術作品(如繪畫、雕刻、陶藝、建築、傢俱、表演藝術等)及其影像資料的標準。設計理念是從藝術作品研究、展示與教育功能需求出發,著重藝術品完整的生命週期記載資訊,提供給研究者一致、可信的內容。另一方面,CDWA所定義的架構(共有27項主要類目)也提供交換和共享的功能,使各地的典藏機構可以交換藏品資訊。除了著重於「物」的描述,AITF也陸續發展人、地、索引典等相關標準,為藝術作品提供更具品質控制的資料著錄規範。

PREMIS由美國著名的圖書館研究機構OCLC與RLG共同開發。PREMIS符合國際標準OAIS的架構,系統化的檢視製造數位資料的環境,配合資料的生命週期研究保存介入的方式,落實各種資料細節,是長期保存的後設資料的首選。

漢字構形資料庫由中央研究院資訊科學研究所的文獻處理實驗室研發。該研究室嘗試結合文字學家以文字學知識解決中文缺字問題已逾十年,累績豐富經驗且成效顯著。目前已能顯示六萬多個漢字字形,處理異體字、甲骨、金文、楚簡文字,及古今字形銜接等問題。為了廣納各方缺字,文獻處理實驗室目前已開放中研院登錄缺字,為擴大處理缺字的問題作準備。

RDD部分,數位權利管理的目的是達到完全的機讀與自動執行,保護數位資源,以免未授權的不當存取與使用。目前有許多權利表示語言,但多數僅定義觀念與架構模型,權利資料字典做為數位權利管理技術其中的一部份,其目的在規範語以及定義使用方式。


預期效果:

CDWA部分,目前國內的博物館社群多使用CDWA作為描述藏品的架構,且CDWA已進行中譯,且已將所有的元素系統化的列表,顯示我國對CDWA的了解與掌握已達一定程度,在本土化的進行上較容易找到相關的經驗與建議。故建議於完成EAD後,繼續就CDWA於98年進行本土化。

關於PREMIS,則因我國至今尚未有具體的數位保存計畫,建議應於97年以PREMIS建立測試模型小規模實施,取得相關經驗,再於98年開始進行國家標準的計畫。

古今漢字構形部分,長久以來,缺字即為中文文獻資訊化之重大議題,缺字問題不僅出現在古代文獻,現代文獻在運用大五碼時,也經常出現缺字的狀況。觀察中國大陸的標準工程,亦包含漢字交換碼項目,我國也應積極重視,儘速解決這個問題。目前的技術與環境已相當成熟,建議可先進行缺字登錄機制建置的試作與評估,並於98年開始進行標準建置的工作。

又關於ISO/IEC 21000(MPEG 21)-Part 6: Rights Data Dictionary,權利資料字典標準規格設計的初衷,是用來支援權利表示語言標準,以及其他需要語意互通性的系統,使授權規則可被正確的描述,並傳遞規則的意義。讓授權者、使用者、軟硬體製造商能夠使用一致的標準化的規則,使權利的解譯與操作在不同的使用者與系統間,取得共識,避免了不必要的解譯錯誤或是操作失當,進而達成經濟上的效益,降低成本,產生利潤與效益。

RDD為REL執行時不可或缺之文件。建議應於完成REL之後,依照我國現行著作權相關與數位交易之時的情境,完成RDD的本土化。


數位出版領域成果與規劃

目前成果

數位出版領域中重要的標準如下: Guidelines for Electronic Text Encoding and Interchange(簡稱TEI)

標準名稱:Guidelines for Electronic Text Encoding and Interchange(簡稱TEI)

網址:http://www.tei-c.org/Guidelines2/index.html

標準簡介:TEI是一國際性與跨學科性的標準,協助圖書館、博物館、出版者和個別學者以電子文本形式呈現各種文獻和(語言學)文本,以達到線上教學與利用。TEI利用標準通用標誌語言展現電子形式的文本,可不受軟硬體、平台的限制達到再利用、資料交換的目的。最近的版本TEI P4(2002),已可使用可擴充標誌語言(簡稱XML)編碼。TEI的文件結構可分成兩大部分:標目(header)和文本(text)。標目部分提供相當於印刷文件題名頁的資訊,如機讀書目的敘述方式、文件編碼敘述的方式、文件的非書目性敘述(文件背景資訊)、以及修訂歷史。TEI文件可以〝件〞為單位(單一作品),也可以合作成集(多件單一作品的合集,類似選集)。不論哪一種,正文都可能出現正文前資訊或正文後資訊,在合作成集的文件中,可以由群組組成,以包含多個群組或是文件。TEI是資料標示基本標準,很多電子書中之標示均須用到,國內對此標準需求甚殷。

發展維護單位:TEI協會(簡稱TEI Consortium)

最新版本:TEI P4 XML版本(2002)



Open eBook Forum(簡稱OeBF)

標準名稱:Open eBook Forum(簡稱OeBF)(已分為OPS及OCF)

網址:http://www.idpf.org/

標準簡介:為了使電子書能夠成功的開拓市場,並便於閱讀系統(Reading System)之間的資料互通,OeBF(Open eBook Forum)制定OeBPS(Open eBook Publication Structure),以作為電子書內容描述的標準。Open eBook Forum(簡稱OEBF)是一個居於電子書產業領導地位的國際性商業與標準組織,該組織成員包括:軟、硬體公司、出版商、作者、電子書的讀者、以及與電子出版相關組織等等,目前如Adobe、IBM、Microsoft等軟體公司;McGraw Hill、IDG等出版業者都已加入。其揭櫫之目的,除了探討電子書相關議題與技術外,並致力於發展、出版與維護電子書共通規格,以達成系統業者協調合作,消弭彼此間之差異。目前OeBF已進一步改名為 International Digital Publishing Forum(簡稱IDPF),原來的OeBFS標準也進一步分為Open Publication Structure (簡稱OPS) 及 Open Container Format(OCF),這是已被國際普遍接受的標準,若要進入國際市場,電子書應符合OPS及OCF標準



DocBook

標準名稱:DocBook

網址:http://docbook.org/

標準簡介:DocBook一開始由HaL Computer System and O`Reilly於1991年發展,為了使UNIX的文件能夠被互換,後來由軟硬體公司、出版公司等組成Davenport團隊,贊助DocBook的發展,1998年Davenport結束贊助,改由Organization for the Advancement of Structured Information Standars(簡稱OASIS)接手,成立DocBook技術委員會(DocBook TC),繼續DocBook的研發推展,2002年OASIS推出DocBook SGML和XML v4.2,目前DocBook TC積極發展v5.0,已有許多組織採用DocBook作為標準文件交換格式。這是業界實際採用最多的標準,所以也是數位出版進入國際市場重要的標準。



Handle System

標準名稱:Handle System

網址:http://www.handle.net/

標準簡介:Handle System可以定義系統運作上的命名空間,資料型態,服務類型,以及運作模型。DOI標準建構在識別符系統(Handle System)之上,因此增訂識別符系統命名空間與服務定義顯得格外重要,識別符系統命名空間與服務定義(Handle System Namespace and Service Definition)可提供完整的識別符命名空間與服務類型定義;識別符系統協定標準(Handle System Protocol Specification)則提供實作識別符系統之詳細標準。



Multimedia systems and equipment –Multimedia E-Publishing and E-Books –Generic format for E-Publishing(IEC 62448)

標準名稱:Multimedia systems and equipment –Multimedia E-Publishing and E-Books –Generic format for E-Publishing(IEC 62448)

標準簡介:IEC(International Electro technical Commission)成立於1906年,有鑑於多媒體電子書及數位出版市場需要有能讓電子書於people; authors, data preparers, publishers and readers之間交換的格式,因此制定了Multimedia systems and equipment –Multimedia E-Publishing and E-Books –Generic format for E-Publishing (IEC 62448),此格式分為submission format, generic format and reader’s format 三種. submission format 主要用於作者及資料準備者之間的互動, reader’s format 視數位出版設備而定,generic format 則已作為資料準備者及出版社之間的交換格式,因此也不會因數位出版設備而有不同。越來越多的數位出版朝向多媒體數位出版,所以這個標準最具未來性。



Syntax for the digital object Identifier(簡稱DOI)

標準名稱:Syntax for the digital object Identifier(簡稱DOI)

網址:http://www.doi.org

標準簡介:一個數位物件識別符(簡稱DOI)就是一個用在數位網路環境中某項單元的名稱(不是指位置), 它提供了在數位網路環境中所管理資訊的多項特性,包括永久儲存以及可運作識別機制,同時也可進行識別的交換。唯一的識別符在任何進行資訊管理的數位化環境中,是相當重要的。識別符的在某個情境下的指定動作也有可能在別的時間或地點下被重複指定或使用,而不會特別去通知進行指定的人,而這個人當然也無法保證他所認知道的假設(也就是指定動作)會為他人所知。為了達到所謂的交互作用特性,針對識別符的設計上,必須讓識別符的使用服務置於派發識別符指定者的直接控制之外,這個必要性也讓識別符增加了永久儲存特性的需求,也就是說,識別符需要和未來的各項動作進行互動(舉例來說,一個識別符可能在將來進行有意義的存取與使用)。

此外,由於識別符的使用服務置於派發識別符指定者的直接控制之外,其造成的交互互動特性也隱喻了這項設計需要有延伸性。因此DOI在設計上是定義成一個通用的運作架構,可以應用在任何的數位物件上,也提供了結構化且具延伸特性,用以進行識別,描述,以及解析。任何一個指定了DOI的單元可以代表任何的邏輯單位。

DOI系統的建構是以數個現有的標準元件所構成,經整合以及額外的開發之後所形成的一個一致性的系統。DOI的開發是跨產業領域,同時也是非營利的,而其管理則是透過一個開放式的協力會員開發組織來進行,稱為國際DOI基金會(International DOI Foundation,簡稱IDF),於1998年成立。目前DOI已經有廣泛的使用,如科技文獻的識別。目前DOI識別符不需要外顯的進行指定(雖然可能會有幫助),例如,在Web環境下,DOI可以以URL的形式存在HTTP環境中(透過代理伺服器)而維持DOI的永續特性。簡言之,DOI可以用來提供一般系統之間交換不同單元識別形式的機制。

發展維護單位:國際DOI基金會(International DOI Foundation,簡稱 IDF)

最新版本:2005年版



Open Archives Initiative Protocol for Metadata Harvesting(簡稱OAI-PMH)

標準名稱:Open Archives Initiative Protocol for Metadata Harvesting(簡稱 OAI-PMH)

網址:http://www.openarchives.org/

標準簡介:OAI最初目的是為了學術性電子期刊預印本之互運性檢索而設,因為數位圖書館所遇到的互運性檢索問題與之相似,所以2000年上半年,OAI計畫便將其適用範圍擴展至數位圖書館領域。為達成加強系統間之互運性的目的,更準確地取用學術性電子全文資源,OAI進一步發展詮釋資料擷取協定(Protocol for Metadata Harvesting,簡稱OAI-PMH)以利運作。OAI-PMH是以HTTP為基礎,在協定中,儲存地被定義為可取用的網路系統,其包含可使用擷取協定進行檢索的詮釋資料;這些釋資料以XML的編碼(encoding)格式傳回,不過需要使用無修飾詞(unqualified)的Dublin Core-元件集(Element Set)來支援編碼記錄,然而OAI的協定也允許使用其他有支援XML記錄定義。另外,OAI-PMH亦可支援Perl、Java和C++等程式語言。OAI-PMH主要的功能在於從電子全文的典藏處獲得詮釋資料,並予製作索引以為搜尋線索,達到便於搜尋電子全文的目的,而在進行全文檢索時OAI-PMH會以不同的格式提供詮釋資料。

發展維護單位:由數位圖書館聯盟(Digital Library Federation,簡稱DLF)、網 路資訊聯盟(Coalition for Networked Information,簡稱CNI)和NSFG (National Science Foundation Grant)共同維護

最新版本:第2.0版(2002年)



The OpenURL Framework for Context-Sensitive Services:The Key/Encoded-Value(簡稱KEV)Format Implementation Guidelines(簡稱OpenURL)

標準名稱:The OpenURL Framework for Context-Sensitive Services:The Key/Encoded-Value(簡稱KEV)Format Implementation Guidelines(簡稱OpenURL)

網址:http://www.niso.org/committees/committee_ax.html

標準簡介:OpenURL是應用於Web上超連結的一種標準陳述語法。藉由一組已經定義好的標籤 (Tag),增進Web超連結能力。定義一個標準INTERNET資料連結的陳述語法。讓各個網路上的服務提供者只要遵照此機制,就可以輕易解析資料提供者(Source)所傳送的要求。而資料提供者也可經由此規範,輕易對服務提供者送出深度連結服務要求,組成份子包含資料提供者與服務提供者。而就目前狀況已有多家資料提供者提供服務,另亦有相當多的服務提供者已完成支援OpenURL。OpenURL並非取代目前的HTTP既定標準,而只是在強化,並提供不同的資訊提供者、服務提供者,能有標準的語法,互相溝通而沒有阻礙。透過此一標準,能輕易瞭解對方的需求,並提供進一步的服務。

發展維護單位:美國國家資訊標準組織(簡稱NISO)

最新版本:2004年版


數位授權技術相關法源依據與相關授權語言定義

數位出版領域中還有一個相當重要的議題,及數位授權技術相關法源與語言。數位物件一般使用DRM的技術來管理或限制各種權利的實行。MPEG 大會主席Leonardo Chiariglione為DRM下的定義為:DRM 是一個資訊科技元件及服務系統,可配合相關法律、政策及商業模式,致力於分發及控制知識財產及其著作權。

DRM的運作,需要對資源生產者、保存者、重製者、使用者等相關權利人的各項權利進行描述,以作為DRM機制運作的。為釐清各方的權利我國應先對數位商品的流通與授權方式進行研究,尋求合理的數位物件交易與使用的模式,制定相關的法律,以保障各方的權利(目前DRM技術大多只保障販售者)。但是由於數位商品的行銷無遠弗屆,數位權利語言應能與國際接軌。但為適應我國的國情,還是應根據我國的法律,在有限度的範圍之內進行本土化。


未來工作規劃

97年預計工作項目與重點 標準名稱:IDPF(美)Open Publication Structure(OPS)與 Handle System、DocBook及Handle System。

建議採行原因:OPS及OCF已成為出版界普遍認同的數位出版標準,理論與應用接逐漸成熟。DocBook是一業界普遍採用的標準,其The Definitive Guide 及DocBook XSL: The Complete Guide 對數位出版都是實用的知識與工具。此標準與OPC 互相輝映,一個是實務界標準,一個已成國際認可標準。DOI一般要配合 Handle system 使用,這是數位出版以數位發行、數位檢索非常重要的機制,可以確保資料不會因為網址的改變,而使連結失效,可靠的電子商務系統,其數位物件的管理需使用 Handle System。



98年預計工作項目與重點 標準名稱:Multimedia systems and equipment –Multimedia E-Publishing and E-Books –Generic format for E-Publishing(IEC 62448)。

建議採行原因:越來越多的數位出版朝向多媒體數位出版,而Multimedia systems and equipment-Multimedia E-Publishing and E-Books-Generic format for E-Publishing(IEC 62448)標準最具發展性與未來性者,故建議採行。

未來推動之可行方案

數位學習未來計畫推動的可行方案

關於數位學習標準的採用及推行,參考近幾年我國推動之數位學習國家型科技計畫,對台灣數位學習規範與標準的研發與引進,是從協助數位產業的角度著眼。主要採單點深入策略,將重心放在SCORM相符平台、編輯工具與教材的開發,同時為廠商提供SCORM相符產品的認證服務。目前也獲得良好的成果,國內數位學習之平台、編輯工具與教材目前大多都能支援SCORM(1.2 or 2004) 標準。

我國相關標準製定及推動單位除得隨時注意國際標準動態之外,在引用相關標準的同時,亦必須考慮國內實際需求,以及與現有標準的相容或整合性,因此,在標準的採用及推行策略方面,有以下幾點建議: 確認標準採用的效益及可行性

目前國際上數位學習標準相當多,製定與推動單位提出的標準其實不一定能符合使用者的需求,若一昧跟隨採用除無法真正解決使用者面臨的問題外,反而還可能造成使用者的困惑及負擔,因此,如何了解現今數位學習面臨的問題,釐清該標準所能扮演的角色,同時考量實際採行的可行性是採行標準最重要的一環。


成立推動我國數位學習標準發展與應用的正式組織

由國際上其它國家標準推動的狀況來看,英國、加拿大、日本、新加坡和大陸都有正式的組織來推動數位學習標準的制定、推廣、測試與維護工作,我國亦應成立相關組織,以統合國內資源,並落實標準的推廣與應用。


推動標準相關建置及實驗專案

以學習物件資源庫(Learning Object Repository, 簡稱LOR)為例,英國、加拿大、日本、新加坡、澳洲和美國都積極進行相關建置實驗專案,除了參與單位能藉由這些專案切身體會數位學習標準應用上面臨的限制與問題外,也可經由問題解決而累積實務經驗,並可促成學習物件的再用、共享與流通。


加強我國與國際數位學習標準組織間的交流與合作

目前我國在數位學習標準的測試上,與美國ADL互動最為密切,建議日後加強與IMS的互動,以獲取完整的IMS最新發展動態訊息。持續追蹤國際上數位學習標準之最新動態,以掌握各國在標準研發、制定、認證、推廣、維護與應用的最新狀況,並透過電子報傳佈相關訊息。

對97及98年所建議的Common Cartridge及e-Portfolio標準而言,Common Common cartridge標準主要的採用對象將包括平台開發商、教材製作商及工具開發商等,主要的效益是希望藉由本標準增強教材、平台與學習工具(例如,測驗工具、電子助教等等工具)間的互通性,使學習的功能更加的靈活、多元化,進而產生更多學習應用方案,激發更多市場需求,進而帶動整體數位學習產值的提升。

ePortfolio標準的採用對象主要以平台開發商為主,採用此標準的效益在於提升學習服務的吸引力,藉由電子學習檔案以加強個人學習的動機與效果並以聚落學習帯動社會學習。ePortfolio標準推動的成功要素,除了標準的採行之外,政府對於學習護照的相關配套措施更是重要,兩者互相配合才能真正顯示出本標準的價值,標準採用初期建議可以公務人員為推行對象,配合相關法規建立出ePortfolio的最佳實務(best practice),相信以此為示範基礎,往後對於證照學歷電子公信化、人力資源的趨勢、人力資源品質加強亦會有正面影響的帶動,如此應用相信對於未來數位學習產業之產值也能有所提升。


數位典藏未來計畫推動的可行方案

標準的研議與落實

綜觀數位典藏領域中所有標準,根據數位典藏國家型科技計畫多年的成果與經驗,在此建議各個領域為進行數位典藏,最需要研議與落實之標準或標準化流程如下:

數位化流程的最佳典範

數位典藏國家型科技計畫(以下簡稱數位典藏計畫)是我國針對數位內容所進行的最大規模計畫,計畫涵蓋國內最重要的博物館、檔案館,及圖書館。數位典藏計畫在規劃之初,即考慮到不同的需求,對數位典藏品的格式與品質提出規格要求。並曾針對數位圖檔提出典藏級、公眾使用級,及預視縮圖等三項不同規格的構想。數位典藏國家型科技計畫進行至今已進入第六年,三級規格的構想雖然未能全數實現,但是「典藏級」普遍為各機構接受,各機構並針對典藏級的需求,建置了各種高規格的數位圖檔。

但是,除了參與典藏數位化的九大機構之外,其他各公私立機構與民間也可能擁有各種值得進行數位化的典藏品。這些潛在的數位典藏包括:政府各級單位的檔案、公民營中小型博物館典藏、銀行等公開場所展示的單件典藏、私人收藏家等。數位典藏計畫了解這些典藏品的重要性,所以特別設置了開放性計畫,以涵蓋九大機構未盡之處。但是,可預見的,在未來數位化的時代,必然有更多收藏必需數位化。

數位典藏的能力與執行範圍有時而終,需要進行數位化的物件可能沒有窮盡。為使其他機構與個人能夠積極參與,除了透過數位典藏計畫進行補助之外,我國應考慮研擬「數位化流程最佳典範」(Best Practice of Digitization),供有意將其收藏品數位化的各公私立機構或個人進行數位化活動的參考。

最佳典範在歐美已有相關經驗,如美國的NISO已經將IMLS的編寫的Framework of Guidance for Building Good Digital Collections提列正式文件。目前的文件是第二版,但是就NISO的網頁來看,第三版正在修訂中。英國的AHDS編寫了一系列的AHDS Guides to Good Practice,作為不同學科社群數位化其相關典藏品的依據。


不同類型數位典藏品的規格標準

在商業化運用而言,數位典藏品的品質需達到一定的水準,才能便於其他形式的重製利用。但在教學或網路傳播等合理使用(Fair Use)的情境中,並不需要使用太高的規格。為使各種數位典藏品能夠便於商業利用重製的需求,或是在合理使用規範之下,保障相關權利者的權益。規範各類數位藏的規格,是在兼顧商業與公眾之間的利益。法律規範之外,更需要一套標準規範,才能做為法律執行的依據。針對各類型數位典藏,推薦需建置各種參考的標準規格如下:

全文典藏類:

文件編碼格式(Text Encoding Initiative, 簡稱TEI)

雖然原影存真是保存中文典籍的手段之一,但為了使典籍的內容能夠檢索、局部截取以便於重覆使用,全文資料仍然是不可或缺的格式之一。但是缺乏來源註記與章節資訊單純的文字串,在重覆利用時會遇到來源驗證與資訊不足的問題。為了救濟這個問題,文件標誌不失為良好的解決方案。

TEI是牛津文件檔案所接受的全文典藏標誌的標準。台灣目前有中華佛學研究所的大正藏全文資料庫使用TEI做文件標誌。目前TEI已更新至P5,相較於之前的版本,P5最大的變革,在於接納中文資料使用的經驗,將中日韓文缺字的解決方案列入正式章節。未來在通用格式的文件交換上,中文資料的缺字不需再自行定義DTD。

此外,由於TEI起源於英文文獻的數位化,多數的定義仍以英文文獻的格式為主。中文文獻在格式上與英文有極大的不同,為使國內的中文文獻在數位化後能夠在國內環境中通行,必須對現行的TEI標誌語言進行本土化。

缺字交換標準

缺字的問題由來已久。使用電腦來處理漢字資料時,常會遇到一些電腦沒有的字形,以致無法輸入。尤其是在處理古代文獻時,缺字的情況特別嚴重。但若使用「造字」的方式處理缺字問題,由於不同使用者使用的造字檔間碼位不同,導致內容錯誤。為使中文資訊正確傳遞,應建立缺字處理的標準。

目前電腦處理漢字的諸多缺失,例如缺字、異體字等問題,主要的原因在於電腦裡的漢字知識嚴重不足。有鑑於此,中央研究院資訊所文獻處理實驗室自1993 年起,即先由字形著手,建置漢字構形資料庫。漢字構形資料庫目前最主要的應用是用來解決缺字問題。缺字的問題在於漢字的字集是一個開放性質的,它的字數根本不適合作固定數量的限定。現行漢字交換碼利用字碼來區別漢字,以致缺字問題層出不窮,我們認為漢字的差異在於字形,缺字問題的解決應當由字形結構著手,才是根本解決之道。

中央研究院已採用漢字構形資料庫的系統處理缺字問題。除收錄現代楷書字形,系統現已結合文字學家,積極進行古今字銜接的研究,已可處理小篆、金文、楚系簡帛文字等古字形。此外,「漢字構形資料庫」所採用的構字式觀念,已為TEI P5接受為CJK缺字表達的可行方案。


影像類:

影像類應就專業典藏、公眾使用,及預覽縮圖分別制定標準規格。此類規格因牽涉到圖像運算的技術,應尋求圖學專家研議之。

專業典藏:就影像保存細節的品質與可再利用性的廣度而言,高解析度的無壓縮TIFF檔是最佳選擇。但仍需進一步規範掃描的標準解析度等。

公眾使用:為使我國典藏能透過網路傳播,以及支援教學等合理使用,應將高解析度檔案予以壓縮成適合網路傳輸的JPEG檔案,此JPEG檔可使用螢幕清晰瀏覽,但其品質不足以用來商業重製。例如大英圖書館的Image Online,對於其圖像檔的使用說明中,即包含「低解析度影像(約4bm)最佳只重製到四分之一A4紙大小。高解析度影像(有50bm)可重製到A4尺寸。」

其他各類數位檔(如影音檔等)應由專家議定之。


原生數位資源保存的政策與相關法源依據與典藏政策:

除了實體物件的數位化之外,目前已有許多資源只以數位形式存在,例如網頁、電子郵件、電子報等,如何保存此類「原生數位」(Born Digital)資源,也是一大議題。

相關的計畫在執行。在美國方面有NDIIPP,在英國則有DOM。這兩項計畫都是在保存非印刷形式的數位資源。網頁的典藏,在1996年就已開始於澳洲國家圖書館的PANDORA計畫實施。但是英美二國受限於寄存法的限制,直至2003年才開始進行。

目前我國對寄存的規定,是在圖書館法中,明定中華民國國家圖書館為中華民國出版品之法定送存圖書館,負責保存全國之圖書文獻,所有出版品皆需承繳給國家圖書館。但是此項規定是否適用於原生數位資源,有待法律的解釋。

此外,由於網際網路上的數位資源數量與範圍都非常龐大,典藏時必須考慮典藏範圍、典藏價值、典藏方式、典藏空間等政策性的問題。我國目前尚未有原生數位資源典藏的具體政策與落實,應儘速進行,以避免當代重要文獻的流失。


資源編目與後設資料:

網資源資的檢索有賴於後設資料對資源物件的描述,後設資料如同數位物件的「書目」。如同書目需要整合以提供跨系統的查詢,後設資料也需要「聯合目錄」。為使這些後設資料能整合查詢,標準化的後設資料格式有其存在的必要。

由於各領域的知識不同,不同的社群對數位描述的需求也不一樣,故發展出各種描述的架構。以下針對不同的領域分別討論。


一般性與交換標準-DC

DC通行各國,雖然其架構簡單,但是為大多數使用OAI交換後設資料的系統,都採用DC為交換的格式。為使我國的數位資源能與國際接軌,建議將DC的後設資料架構,列為我國描述數位資源時最少量描述的標準。


檔案館社群-EAD

檔案館對資源描述的需求與一般的數位物件不同。DC只適於描述單一的物件,但是檔案有全宗原則,並應著重檔案本身層級的結構的描述,這些都不是只有十五個元素的DC可以達成。既然DC在檔案的運用有限,則應另覓其他適用於檔案館的標準。

EAD的發展,原本就是針對歷史性的資源。EAD的發展甚早,獲得美國國會圖書館及美國各大學的採用,目前並由美國檔案學會與國會圖書館維護。此外,EAD在德、法等國的試用情況,據稱良好。我國數位典藏計畫中,檔案相關的計畫也都將資料庫欄位對EAD的元素做比對,希望能夠符合EAD的架構。

在我國的實施經驗中,發現我國對檔案描述的需求與美國稍有不同。建議可以EAD為底本,進行本土化以符合我國的需求。


博物館社群-CDWA

博物館館對其藏品的描述需求涵蓋面甚廣,且對藏品描述上要求較多的細節。DC只有十五個元素,無法應付博物館藏品對於細節的需求,故建議建構適用於博物館的標準,以符合需求。

CDWA的發展,是針對博物館資源。發展CDWA的Getty機構,為博物館界知名的專門研究機構,CDWA的運用也極為廣泛。我國數位典藏計畫中,博物館相關的計畫都進行過CDWA元素比對,希望能夠透過CDWA的架構進行整合。

在我國的實施經驗中,發現我國博物館的藏品與國外稍有不同,尤其是美術類的藏品,有許多都是CDWA中未能妥善描述的。建議可以CDWA為底本,進行本土化以符合我國的需求。


生物社群-Darwin Core/ABCD/HISPID

生物類的數位典藏,又與博物館類不同,全球知名的物種名錄計畫GBIF雖然同時接受Darwin Core與ABCD的資料,但是其後設資料的架構仍以Darwin Core為主。

由於生物類的後設資料標準非常多樣,建議交由生物領域相關的專家進行更深入的研究,以確立應用的標準。


Data Grid (ISO/TS 10303-1656) Trusted Digital Repositories: Attributes and

Responsibilities

網格是透過網際網路,分享如計算能力和資料的各類資源與服務。網格不止是電腦間單純的通訊功能,其最終目標是要整合分散於全球資源,轉變成一個巨大的計算資源。

網格架構,需要考慮不同網格技術結構間的整合問題。此架構包括網格的基本組成元件、描述元件的目的及功能,以及元件間運作情形的說明。以上兩項標準,即在提供網格架構的標準。


OAIS model+PREMIS

OAIS是一套參考模式而非實作指南。它定義數位典藏資料庫的功能與需求,提供系統間詮釋資料互通的架構,讓不同類型的詮釋資料得以交換與再使用。此模型可確保數位物件典藏時應具備的相關資料,受到各種研發保存性後設資料的計畫廣泛採用。PREMIS即是依據OAIS的模型所發展出來的實作指南,兩者互為表裡。OAIS提供架構,PREMIS則提供落實的細節。

數位保存的議題在國內雖然還未受到重視,但是未來我國必然面臨數位物件長期保存的問題。OAIS的模型已是國際標準,我國應直接採用,不需更改其結構。但是徒有架構沒有保存性後設資料仍然不足以運作。在考慮自行開發或引用現成規範兩者之下,建議可以現有的PREMIS為基礎,進行研譯。除了中文化之外,還需針對我國目前各項數位物件研究其適用性,進行必要之修正。


METS

一位或一組數位物件在產出之後,除了描述其內容供使用者查詢之外,物件身也需要管理,也會產生其他各種不同類型的後設資料,例如管理性的後資料以及各種處理記錄等等。如何整合這些後設資料也就成為一個問題,METS即是為了整合這些不同類型的後設資料而生。METS具有彈性,可以容納任何類型的後設資料,故受到各種長期保存計畫的青睞,例如美國的NDIIPP與英國的DOM,都選擇以MTES作為保存性後設資料的裝載工具。

隨著數位化物件的增多,不同架構的後設資料整合的需求越來越多。此外,同一物件的不同類型後設資料也需要裝載工具。而METS在國際間的長期保存活動中已成為不可或缺的規格,故國內可引用這類成功的經驗,直接與國際接軌。而由於METS不牽涉任何的特定規格,只需要進行中文化的工作,不需另行本土化。


數位授權技術相關法源依據與相關授權語言定義:

數位物件一般使用DRM的技術來管理或限制各種權利的實行。MPEG 大會主席Leonardo Chiariglione為DRM下的定義為:DRM 是一個資訊科技元件及服務系統,可配合相關法律、政策及商業模式,致力於分發及控制知識財產及其著作權。

DRM的運作,需要對資源生產者、保存者、重製者、使用者等相關權利人的各項權利進行描述,以作為DRM機制運作的。為釐清各方的權利我國應先對數位商品的流通與授權方式進行研究,尋求合理的數位物件交易與使用的模式,制定相關的法律,以保障各方的權利(目前DRM技術大多只保障販售者)。

但是由於數位商品的行銷無遠弗屆,數位權利語言應能與國際接軌。但為適應我國的國情,還是應根據我國的法律,在有限度的範圍之內進行本土化。



數位典藏標準的走向

未來數位典藏標準的走向,可朝下列方向發展: 發展不同後設資料的Application Profile

專業的社群自有其需求,而且詳盡的後設資料與完備的元素是研究之不可或缺。但是如果每個社群都以其本位主義使用專業的標準,又會對互通整合造成妨礙。

為了使專業標準能與一般性的標準,如DC與LOM能夠迅速互通,建議參考英國之經驗,開發各種Application Profile,在不影響各館原先使用的後設資料架構下,支援各社群對資料交換的需求。


對各社群提供不同的數位化指引

國內數位典藏的經驗已累積六年,尤其在數位典藏計畫的內容分項下成立了各種工作小組,也針對各類型典藏的數位化工作流程進行文獻化的工作。這些工作,都與英國的AHDS的作法相近,顯見我國數位典藏執行上的水準。

為了提昇這些標準化的流程的實用性,我國應檢視這些文件,並將之標準化,編寫成適合各領域的指引。並善用這些資源,對非國家型計畫所屬之公私機構、團體,及各人推廣,以充實本國數位典藏的深度與廣度。

推行原生數位資源的長期保存


推行原生數位資源的長期保存

長久以來,我國專注於數位化的工作,對於原生數位資源的保存,著力較少。相對的,我國在原生數位資源典藏的流失量距英美兩國已有四、五年之距。所以已在研究國外數位典藏標準時發現問題,故應積極解決。

目前我國的優勢在於國外各種研究與工具都已相當完備,測試的平台可迅速建立。但是我國的劣勢在於原生數位資源合法保存與授權交易的相關法律付諸闕如。故我國應在短期內建立小規模的測試平台,先以政府機構作為對象。在取得經驗的同時,進行相關法律的修訂,以及保存的政策。


數位物件交易法律的完備與數位權利語言

未來數位物件的交易將越來越頻繁,所衍生的問題也將越來越多。數位權利語言即便能協助DRM對使用者進行侵權規範,但是DRM侵害使用者權利的討論也時有聽聞。這都是不了解數位物件交易的狀況所導致。由於數位權利語言牽涉到各項交易權力的描述,故在將數位權利語言中文化之時,應有法學專業者投入相關的研究,至少也必須從旁協助。尤其是各國的法律有所不同,為調合國內法與國際法的差距,故應促使我國法界積極了解數位交易,針對不同適用範圍進行規範,以符合我國及國際交易的情境。

數位權利語言與權利資料字典的本土化,是數位物件交易所必需。數位物件權利持有者與代理商應是期盼已久,不推廣也將無所不用。但是由於目前的數位權利管理機制,多以程式限制保障原物件的持有者與授權單位。甚至許多著作權已消亡幾百年的「公共版權」物件,使用者仍需付出高額的代價取得授權。合法使用在某些曖昧的權利被主張過度的情況下,因為DRM軟體的介入受到極大的限制,消費者明顯處於劣勢。雖然宣稱願意使用合法數位物件的消費者非常多,但是由於權利的不均衡,非法複製仍流傳不斷,而網路上也隨時可以取得各種DRM破解技術。

駭客與超複雜DRM技術的競賽並非權利語言與權利資料字典的制定的目的。如何兼顧各方合理權利,並取得合法使用平衡點,才是未來應該思考的目標。


漢字字形的整理與其周邊效益

為使國內的漢字表達方式一致以便資訊交換,應成立專責機構,由語言學與文字學領域的專家負責構字式的定義,以及文字學相關知識的考訂研究。

若由「字形」的觀點來看,缺字中的確有許多大五碼完全未收錄的字形;但若由「字」的觀點觀之,這些缺字不乏古體、諱字、異寫、訛字等同形異構的狀況。建立漢字的古今對應與時空座標,有助於古文獻於現代情境的教育與傳播。

漢字構形資料庫是以文字學知識為基礎建構,故除了解決缺字問題之外,應可妥善運用背景的文字學知識,做為國語文課程的輔助工具。尤其在標準化之後,各種語文教育的軟體都能直接使用同一編碼格式,不需因不同的軟體轉換造字檔,軟體的適用性將更為普及。

此外,缺字最終仍不脫字形顯示的需求,故需要字形產生器等軟來支援字形的呈現。而除了計算產生的臨時字形,由於編輯美觀的需求,亦需要不同的電腦字體。目前文獻處理實驗室僅提供細明與標楷兩種字形,其餘字形或字形產生器等配套工具期待廠商投入開發。

數位出版未來計畫推動的可行方案

國內數位內容市場小,數位出版是可以數位內容的市場,若要有出路,一定要走國際化,然國內出版界對數位出版了解不夠,數位出版廠商對國際市場了解不夠,這都使得數位出版難以大步發展。藉由這些標準的引入及本土化,將有助於廠商對國外市場的了解與準備。無論政府出版品、商業性出版社都應對這些發展有深入的認識。重要之標準的發展方案如:

DOI

目前國內各數位典藏計畫大都會規劃數位物件的命名方式,同時也會因應國際接軌的要求,制定出具有唯一識別特性的命名規則。包括數位典藏國家型科技計畫和國家文化資料庫建置計畫下的各個數位化建置計畫,都涵括了所謂的數位檔案命名原則。然後透過國際接軌的方式,大多可以順利引用DOI標準成為數位物件識別碼。由於DOI系統規範具有包含如何應用文數字識別字串來定義組成或規範順序,而不致於造成混淆。同時DOI系統可以用在數位環境中參照一個智慧財產單元之用。其中語法的規範可以讓現有的識別字串可以在DOI系統下使用合適的形式來進行表達。DOI系統是由國際DOI基金會開發用來提供管理智慧財產內容的運作架構,其中包括將使用者與內容擁有者進行連結,便利電子商務運作,以及便利自動化的版權管理。因此極適用於數位物件的管理與識別環境中。


OpenURL

固定的一對一靜態連結很快面臨維護困難的問題,有關網域內與網域外連結權限也會有問題。靜態連結到此面臨挑戰,一種需要在系統運作時動態生成的連結漸漸取代靜態連結而成為主流。動態連結的優勢就是它是在系統運作中,隨著系統需要,由程式所產生。它有即時的特性,會隨著環境而改變。動態連結的維護比靜態連結難度高,但是因為是由程式控制,若程式寫得好,反而減輕維護的麻煩。要解決這些連結問題,需要一個開放性的連結語法。OpenURL 就是在這樣的情況下誕生的。目前有將近10個國際性廠商開發相關產品。OpenURL已經成為趨勢,各個學校及學術單位,只要有全文連結的需求,就有OpenURL相關產品的需求。因為OpenURL主要是以強化超連結為主軸,沒有中文化問題,可直接與國際接軌。


結論

總結以上研析,我們建議於97年預計發展的重點標準為:

數位學習方面

教材服務交換標準(IMS Common cartridge)。

數位出版方面

IDPF Open Publication Structure(簡稱OPS)、DocBook及Handle System。

數位典藏方面

檔案編碼描述格式 (Encoded Archival Description, 簡稱EAD)、ISO/IEC 21000(MPEG 21)-Part 5: Rights Expression Language。

於98年預計發展之重點標準為:

數位學習方面

電子學習檔案(護照)終身學習標準(簡稱IMS ePortfolio)。

數位出版方面

Generic format for E-Publishing(簡稱IEC 62448)。

數位典藏方面

Categories for the Description of Works of Art(簡稱CDWA)、PREMIS、古今漢字構形及ISO/IEC 21000(簡稱MPEG 21)-Part 6: Rights Data Dictionary及。

於數位學習領域,未來的可行方案可著重於:確認標準採用的效益及可行性、成立推動我國數位學習標準發展與應用的正式組織、推動標準相關建置及實驗專案,來累積並落實我國數位學習標準之應用及加強我國與國際數位學習標準組織間的交流與合作。

於數位典藏領域,未來的可行方案可著重於:發展不同後設資料的Application Profile、對各社群提供不同的數位化指引及推行原生數位資源的長期保存。

於數位出版領域,目前我國內容市場仍小,為拓展市場,促進數位出版之發展,仍可由國際化作起。然國內出版界對數位出版還了解不夠,廠商對國際市場亦不熟悉,都使得數位出版難以大步發展。藉由所建議之標準的導入及本土化,將有助於廠商對國外市場的了解與準備。無論政府出版品、商業性出版社也都將因此而獲益。

最後就標準的執行效益面而言,數位學習、數位出版與數位典藏三大領域都有各自採行應用之標準,本研究推薦之標準是目前3大領域中重要且較多人採行者。標準的採用可以使相同社群間節省溝通的成本,在軟硬體開發研究上也能達到一致性,節省開發的時間與效益;更進一步,採用相同標準之社群可以達到互通與交換的最大效益。

參考書目

  1. A Framework for Distributed Digital Object Services. Kahn, R., Wilensky, R. (1995):http://www.cnri.reston.va.us/k-w.html
  2. A Framework of Guidance for Building Good Digital Collections, 2nd ed. NISO: http://www.niso.org/framework/framework2.html
  3. Advanced Distributed Learning:http://www.adlnet.org
  4. AHDS Guides to Good Practice:http://ahds.ac.uk/creating/guides/index.htm
  5. British Library:http://www.bl.uk/about/policies/dom/homepage.html
  6. British Library Images Online:http://www.imagesonline.bl.uk/offer.asp
  7. CDWA:http://www.getty.edu/research/conducting_research/standards/cdwa/
  8. IEEE:http://www.ieee.org/portal/site/iportals
  9. Darwin Core:http://wiki.tdwg.org/twiki/bin/view/DarwinCore/WebHome
  10. DC:http://dublincore.org/
  11. Digital Preservation:http://www.digitalpreservation.gov/
  12. DOI:http://www.doi.org/
  13. EAD:http://www.loc.gov/ead/
  14. Handle System:http://www.handle.net/
  15. IEEE P1484.1/D9, Draft Standard for Learning Technology — Learning Technology Systems Architecture, IEEE LTSC: http://edutool.com/ltsa/09/IEEE_1484_01_D09_LTSA.pdf
  16. IEEE LTSC:http://ieeeltsc.org/
  17. IMS Abstract Framework:White Paper Version 1.0, IMS Global Learning Consortium:http://www.imsglobal.org/af/afv1p0/imsafwhitepaperv1p0.html
  18. IMS Global Consortium Inc:http://www.imsproject.org
  19. METS:http://www.loc.gov/standards/mets/mets-schemadocs.html
  20. OpenFoundry:http://www.openfoundry.org/
  21. PANDORA, Australia's Web Archive:http://pandora.nla.gov.au/apps/PandasDelivery/WebObjects/PandasDelivery.woa
  22. Preservation Metadata and the OAIS Information Model: A Metadata Framework to Support the Preservation of Digital Objects:http://www.oclc.org/research/projects/pmwg/pm_framework.pdf
  23. Reference Model for an Open Archival Information System:http://public.ccsds.org/publications/archive/650x0b1.pdf
  24. Sharable Content Object Reference Model 2004 Overview, 3rd Edition, Advanced Distributed Learning:http://www.adlnet.gov/scorm/20043ED/Index.aspx
  25. Text Encoding Initiative:http://www.tei-c.org/
  26. XML台灣資訊網:http://www.xrml.org/
  27. 台灣數位學習白皮書(2005-2006), 資策會數位教育研究所
  28. 全球數位學習標準調查報告,資策會數位教育研究所
  29. 政府數位出版資源管理之研究,行政院研究發展考核委員會編(2005),台北市,研考會。
  30. 當數位出版遇見數位圖書館。薛良凱(2005),臺北市立圖書館館訊,22(3),頁32-41。
  31. 國立台中圖書館「建構國家數位公共圖書館委託研究計畫」期末報告。
  32. 漢字構形資料庫:http://www.sinica.edu.tw/~cdp/cdphanzi/
  33. 數位學習網路科學園區:http://www.epark.org.tw

英中名詞對照表

英中名詞對照表0.jpg
英中名詞對照表1.jpg

參考資料

參與研發單位:中央研究院-計算中心-後設資料工作組、數位典藏技術研發計畫-後設資料工作組、國立臺灣師範大學-圖書資訊學研究所、財團法人資訊工業策進會-數位教育研究所

提供單位:數位典藏技術研發計畫-後設資料工作組

使用單位:經濟部標準檢驗局


說明:本報告係於2007年應經濟部標準檢驗局「規劃與建置數位內容與數位生活應用之技術標準環境計畫(案號:1D15960125-20)」委託進行研析。