國際組織2007年數位學習及數位出版與典藏技術標準發展現況與趨勢調查研究報告
目錄
緒論
中央研究院承接經濟部標準檢驗局96年度「規劃與建置數位內容及數位生活應用之技術準環境」計畫(以下簡稱本計畫),中央研究院本身為「數位典藏國家型科技計畫」執行單位,於91年成立了「數位典藏計畫後設資料工作組」(Metadata Architecture and Application Team,簡稱MAAT),負責此一國家型計畫有關詮釋資料方面的推動與規劃,包含服務與研發兩大範疇,主要目標如下:
l 協助詮釋資料國際標準之策略規劃與應用。
l 研究發展詮釋資料理論,包括詮釋資料方法論、詮釋資料註冊中心、知識組織系統等項目。
目前MAAT共支援超過80個不同的典藏計畫,這些計畫的機構社群包括:圖書館、博物館、檔案館、標本館與數位學習;學科屬性包括:人文藝術、社會科學與自然科學等範圍;資料媒材涵蓋:照片、聲音、影音、拓片、標本、書畫、器物、公文、語料庫、建築文物等類型。
同時,此工作團隊也同時協助「數位學習國家型科技計畫」規劃研擬TW LOM草案及政府相關部會導入,加上負責教育部「九年一貫」教學資源網十二縣市(台中市、彰化縣、宜蘭縣、花蓮縣、台南縣、新竹縣、嘉義市、台北市、台北縣、高雄市、台南市、基隆市)及七大加盟單位(學習加油站、亞卓市、思摩特、原民會、數位典藏學習資源網、社博網、六大學習網)標準推廣作業之豐富經驗,今年承接本計畫目標著重於數位內容八大產業中「數位出版典藏」與「數位學習」兩項內容之技術標準環境規劃與建置。
就本計畫範圍而言,「數位學習」包含學習內容及其製作工具、軟體建置服務、數位學習課程服務等相關產業,而「數位出版典藏」則涵蓋圖像、文字或影音之光碟出版品、電子書、電子期刊、電子資料庫等,為使台灣成為全球華文數位學習及數位出版內容製作與應用服務的主要國家,必須使「數位學習」及「數位出版典藏」的內容產生、儲存、取用、永久保存與應用等,皆能依據國情,也能與國際接軌之標準來研發。
本計畫著手分析歐、美、亞洲等國及國際標準組織(International Organization for Standardization,簡稱ISO)、美國國家標準協會/國家資訊標準組織(American National Standards Institute / National Information Standards Organization,簡稱ANSI/NISO)、電機暨電子工程師學會(Institute of Electrical and Electronics Engineers,簡稱IEEE)、全球學習聯盟(Instructional Management Systems Global Learning Consortium,簡稱IMS)之相關標準與計畫的發展策略與實施現況,再蒐集與分析本國現行規範的需求,作為我國學術、產業與政府界發展數位內容的依據,以奠立我國數位內容產業的環璄與基礎,進而達成數位生活及其品質等目的。
本文將檢視目前國際組織2007年數位學習及數位出版典藏技術標準發展現況與趨勢調查、重要國際組織及關鍵技術,以這些規範在國際使用情況為基礎,作為我國數位內容相關標準制定的參考。
標準發展現況
本計畫之目標為研析數位學習及數位出版典藏技術標準運作方式,以及標準應用範圍,以利我國產官學界的研究及實際應用(如相關系統與工具的開發),同時與國際標準接軌,帶動產業發展,以符合國際標準要求的成本等實質效益。以下就數位學習、數位出版及數位典藏之標準闡述說明如下:
數位學習標準
數位學習標準重要的組織包括IMS、ADL與IEEE通過的規範,以下就此三組織所發展的標準規範描述如下:
2.1.1 IMS通過的規範
IMS目前正式公佈的規範共有18種,還在審定階段的新規範有1種,共計19種規範,其名稱與發佈日期,請見「表1 IMS規範一覽表」。有些公佈的規範,其後續修訂版本已進入公開草案階段。目前外界參照最多的是Meta-Data、QTI、LIP與Content Packaging等項,未來Enterprise、Simple Sequencing等也將陸續被採用。本計畫96年度以IMS兩份規格:Content Packaging與Question and Test Interoperability為參考依據,完成兩份國家標準草案。
IMS為全球制定數位學習標準最積極的單位,且繼續將發展重點置於高等教育機構的數位學習需求,也將擴大與加拿大、英國等國的合作,將來的標準制定會以各種網路服務(web service)以及資訊交換為主軸,在內容包裝標準方面的發展值得參考與關注。
2.1.2 ADL 通過的規範
SCORM(Sharable Content Object Reference Model,共享式內容物件參考模型)為美國ADL(Advanced Distributed Learning)所提出之規範,特色在於採用「教學元件」的理念,藉以提升教材的「可再用性」,並解決教材與平台間互運性的問題。 SCORM版本的演進,可以參考表2所示:
2.1.3 IEEE 通過的標準
依據IEEE LTSC的網站資訊,IEEE通過與學習科技相關的標準有5個,如表3所示。本計畫96年度以IEEE 三份規格:1484.11.1、1484.11.3與1484.12.3為參考依據,完成三份國家標準草案。
觀察近幾年國際標準組織的運作及標準運用狀況,縱使新觀念可以被大眾接受,但要把新觀念用技術實現出來,例如:開發符合學習物件精神的教材或編輯工具,就比較難,更難的是改變人類既有的工作習慣,尤其是當缺乏有力的數據證明新方法與工具是遠比傳統方式有效時,使用者跟隨的意願就更低了。人們在學習新標準之際,也需要更多的應用案例和解說文件來真正推動國家或機構採用新標準。
國際即有之部份數位學習標準已有一定的成熟度,雖然還是可能會有一些新標準產生。大體而言,未來數年國際推動數位學習標準的重心將會擺在「既有標準的應用」上,美國ADL組織就曾提及SCORM版本從1.0版演進至現今的2004版本,近幾年將不會有太大的變動。
IEEE1484.11.3:Content Object Communication (本計畫96年度所完成之國家標準草案「教材物件溝通資料模型之可延伸標示語言架構繫結」)是伴隨著IEEE 1484.11.1的資料裝訂規範,其範圍與內容將會隨著IEEE 1484.11.1的修改而變動。未來在IEEE 1484.11.1標準上極有可能會對於資料的追蹤、傳遞與收集上,隨著更多元的學習模式(模擬與遊戲式學習、社群協同學習、非正式片段學習等等),而有所增減與修正,而IEEE 1484.11.3也會隨著修正。
IEEE1484.12.3:Binding for LOM (本計畫96年度所完成之國家標準草案「學習物件詮釋資料之可延伸標示語言架構定義語言繫結」) LTSC自從在2002年公佈IEEE LOM標準,提供了一組良好的詮釋資料參考定義,然而IEEE LOM所描述的僅僅是詮釋資料的概念模型,也因此LTSC又提出IEEE 1484.12.3標準,更進一步使用可延伸標示語言(Extensible Markup Language,簡稱XML)架構定義語言來將IEEE LOM的內容實做並呈現出來。觀察近幾年的國際標準走向,許多的國家都致力於IEEE LOM的本土化,不論是英國的UK LOM Core、新加坡的Sing Core或者是我國的TW LOM,都或多或少參考IEEE LOM的架構而訂定,儼然可見IEEE LOM在於數位學習領域已經是全球採用的標準之一。就目前的數位學習領域來說,有了IEEE LOM的加持之下,教材的詮釋資料便能輕易地在不同系統間交換,對於資訊搜尋及滙整工作是一大助力,然而,此標準目前所定義的詮釋資料元件其實已經相當足夠,甚至超出一般人所會填寫的範圍,因此,就學習資源之詮釋資料標準而言,未來的發展重點將不是元件的定義,而是標準本身的應用。
數位學習標準間之關係,國際上從事數位學習規範或標準訂定的組織很多,各有不同重點和特色,但其所發展的成果大致上可分為五類,最核心的是與學習資源、學習者和學習環境相關的三類標準,然後是與品質衡量有關的教育管理類標準,此外還有最基本的基礎架構類,表4就國際上各組織所研訂的規範或標準,做一對照表。
二數位出版標準
綜觀國際數位出版相關業務,可將數位出版相關標準依「交換及描述規範」、「數位資源的命名原則」、「數位版權管理標準」、「數位內容交易及流通平台」四個角度來劃分。
2.2.1 電子書描述及交換標準
開放式電子書出版結構(Open eBook Publication Structure,簡稱OeBPS)是由「開放式電子書論壇」(Open eBook Forum,OeBF,已更名為International Digital Publishing Forum,簡稱IDPF)主導,該組織成員包括:軟、硬體公司、出版商、作者、電子書的讀者、以及與電子出版相關組織等等。該組織成立之目的在探討電子相關議題與技術,並致力於發展、出版、維護電子書的共通規範。整合各項現有技術標準的產物。為了讓編輯與系統廠商輕易的跨越電子書的門檻,以最小成本加入eBook行列,OeBPS採用目前網路上通用著名的敘述語言,最新的版本是2002年公布的1.2版。
其標準內容是一個開放式電子書文件(OeB)包含三個部分:OeBPS包裹檔(Package)、OeBPS全文標示詞彙(Document Vocabulary)、OeBPS排版樣式(Style sheets),以下分別說明:
1. OeBPS包裹檔(Package):
(1)每一出版品必須包含一個OeBPS包裹檔,用來指定組成該出版品的 OeBPS文件檔、圖檔、其他物件,以及他們之間彼此的關係。
(2)OeBPS包裹檔的副檔名為 .opf,語法為XML,MIME Type為”text/xml”。
(3)OeBPS包裹檔主要包含以下部份:
a. Package Identity: OeBPS出版品的唯一識別號
b. Metadata: 出版品的Metadata,包含了
(a)dc-metadata: Dublin Core欄位
(b)x-metadata: 其他補充metadata
(c)Manifest: 組成該出版品的檔案(OeBPS文件檔、圖檔、樣式表等)
(d)Spine: 文件所提供的線性閱讀順序
(e)Tours: 文件所提供的其他閱讀順序,例如針對不同的閱讀目的貨不同的閱讀族群
(f)Guide: 出版品結構參考資訊,如目次、前言、書目資料
(4) OeBPS包裹檔的元件與屬性結構如下:
a. <xxx>表欄位,如<package>;xxx = 表屬性,如unique-identifier=
b. 元件與屬性符號意義:
?表非必備且不可重複
- 表非必備且可重複
+表必備且可重複
空白表必備且不可重複
c. 每個元件名稱,都可加上id= , xml:lang= 兩個屬性
d. Dublin CORE欄位內容著錄方式建議參考文學類詮釋資料格式,若欄位重複可在內容值前加入前導語,以茲區別,前導語盡量採用文學類詮釋資料格式的中文欄位名稱,如:
<dc:Type>藏品層次:合集</dc:Type>
<dc:Type>作品類型:文學</dc:Type>
2. OeBPS全文標示詞彙(Document Vocabulary):標示語言宣告,使用以XHTML的元件與屬性。
3. OeBPS排版樣式(Style sheets):顯示樣式宣告,使用串接樣式表(Cascading Style Sheets)。
2.2.2 數位資源命名標準
目前國際上有許多不同的數位資源命名標準,以DOI為例說明如下:
1. 標準研發單位(背景、目的、運作方式)
DOI的全名為Digital Object Identifier,中譯為數位物件識別符,它是起源於美國90年代因為大力發展許多數位出版的計畫,當時為了使這些電子出版品能快速的被檢索和利用,以及給予該出版品一個單一識別的認證,於是由美國出版商協會(Association of American Publisher,簡稱AAP)於1997年提出了數位物件識別符(Digital Object Identifier,簡稱DOI)作為數位資料的識別符的運作模式和架構。DOI目前由國際DOI基金會(International DOI Foundation,簡稱 IDF)負責運作DOI的相關機制,舉凡DOI政策的制定、技術支援、註冊及繳納規費、維護線上的使用指南等,均由該基金會負責執行。DOI系統主要功用就是對網上的內容能作唯一的命名與辨識,藉以保護智慧財產。
國際DOI基金會(簡稱IDF)是一個國際非營利會員組織,目前在美國以及英國有其分支機構。這個基金會的任務包括授權目錄管理者,登錄代理人,以及提供相關技術,訂定系統策略,以及鼓勵相關技術之開發(如版權管理等電子交易系統架構等)。DOI系統最初是由出版業界進行開發,現已受到廣泛的關注,同時也積極與相關標準制定組織進行密切合作。國家資訊標準組織(簡稱NISO)在1998年加入後,開發出DOI識別符的語法標準,目的及在於擴大數位物件識別符的潛力與應用。
DOI識別符目前是透過登錄代理人的聯盟來進行實作,他們透過國際DOI基金會(簡稱IDF)所提供的使用策略以及工具來進行開發。IDF目前是DOI系統的管理主體,責任是確保DOI系統中所有的智慧財產權(包括是自有以及授權過的)可以受到完善保護。同時也透過登錄代理人以及底層相關的技術標準來確保DOI系統的任何功能改善(包括針對DOI識別符的建立,維護,登錄,解析,以及策略制定)都可以讓DOI登錄者使用,同時使用DOI標準時也不會需要任何第三方的授權。DOI識別符的解析動作目前對任何使用DOI識別符的使用者都是免費的.
DOI系統目前可以在任何應用領域中滿足並提供識別以及解析的需求與服務。其中規則包括被識別的東西,以及任兩者的識別結果是否指的是同一個物件,這些在DOI的特定應用上都是基本層次的功能,且都是由DOI登錄代理人的角色所提供。這個功能也讓任何識別系統擁有極大的彈性與能力,可以提升外在的具結構的詮釋層次,因為如果沒有了這樣的識別符,任何出了該特定應用領域之外的識別資訊都不具任何意義.
國際DOI基金會(簡稱IDF)提供了實作上的管理,同時也提供了技術基礎架構(解析技術,代理伺服器,鏡像儲存,備份,以及中央辭典)以及社群基礎架構(永續儲存的承諾,退守程序,成本核定或稱自營模式,以及系統分享使用)。IDF本身並不是標準的主體,而是一個中央授權以及管理的代理人。目前IDF已經是ISO/IEC MPEG 21版權資料辭典的註冊授權者,同時也被提案成為ISO TC46/SC9的DOI系統登錄授權者。IDF授權動作是透過登錄代理人來進行,每個被授權者可以開發自己的DOI應用,並在各自領域社群中進行發展。
2. 標準沿革
數位物件識別符(簡稱DOI)標準最初在1998年釋出,提供了一個針對數位內容管理有彈性的基礎架構。DOI標準最初只是用在出版界中,以一個數位內容命名的工具角色存在,但是後來因為其特性,逐漸發展成為一個一般性的識別標準。最初在Kahn以及Wilensky針對數位物件所發表的論文(“A Framework for Distributed Digital Object Services”,1995)中,提出了相關針對數位物件的模型,也影響了DOI部份標準。在Kahn-Wilensky的論文發表之後,隨後在Kahn等人於CNRI(Corporation for National Research Initiatives)也進行了關於數位物件識別的相關工作,並於1993年註冊了相關專利(Pat. No. 6135,646 – System for uniquely and persistently identifying, managing and tracking digital objects – 10/24/00)。之後DOI的發展逐漸由"單一的DOI對應到單一的URL “擴及到”單一的DOI對應到多種資料型態"的形式,成為現今DOI標準的面貌。
3. 屬性類型
電子出版、數位典藏、分散式查詢協定
4. 應用範圍
根據「財團法人中華民國國家資訊基本建設產業發展協進會」整理國外的相關報告後所提出的一個結論,就是DOI 最大的特色在於數位商品需採用通用資源識別符(Uniform Resource Identifier,簡稱URI)方式得以建立起網路虛擬供應鏈,而DOI則為實際落實URI中之通用資源名稱(Uniform Resource Name,簡稱URN)理念的方式。因為目前網際網路上的網頁均使用URL(Uniform Resource Location)的方式來做網頁的識別,但URL經常會有連結失效或者位置更動的問題產生,因此DOI採以註冊中心方式,動態執行整個流程並更新連結,以確保連結之正確性。DOI系統是一個Handle System®的實作,Handle System®是由Corporation for National Research Initiatives (簡稱CNRI)進行開發,為一個通用型的分散式資訊系統,用來提供網路上一個有效,具延伸性,且安全的全域名稱服務,如網際網路環境,Handle System包含了一組開放式的協定,一個命名空間,以及一個這組協定的參考實作。這組協定使得一個分散式的電腦系統得以儲存數位資源的名稱,或是代碼(handle),同時也可以將代碼解析成為必要的資訊,進而進行定位,存取,以及其他使用這項資源的動作(請見圖1)。而這些由代碼所連結到的資訊也可以因應反映該項資源的現下狀態而進行改變,而不需要更動代碼。因此這項特性允許代碼的永續性,不會因為地點以及其他目前狀態的改變而有所變更。每個代碼都可以指定其管理者(或管理群)且其管理動作可以在一個分散式的環境中進行。這個名稱與資料值的結合方式也是具有安全性的,可以允許代碼在一個信任的管理應用程式中進行使用。
上圖中說明了一旦有了數位資源識別符,數位物件才能有效被控制,而數位資源被移位時,則需要透過彈性的命名管理系統,才可找到該數位物件。而數位資源會改變其存放位置,所以必須要有命名管理系統,將數位資源的識別符(簡稱DOI) 解析為UniformResource Locator(簡稱URL)。單一的數位資源命名管理系統,主要能將唯一識別解析為一個URL,而多重的則可將一個數位資源解析為數個URL。
5. 國際環境與現況概述
基於DOI系統是一個Handle System®的實作,目前Handle System提供了一個一般用途的全域性系統,長時間以來已經用在網路環境中進行可信賴的管理活動,如網際網路環境中。目前也用在許多的專案計畫中使用到Handle System。國際DOI基金會,美國國會圖書館,美國國防技術情報中心,D-Space,美國國防部ADL先導計劃,以及Globus聯盟都是Handle System的實作機構。DOI系統目前是由國際DOI基金會進行管理,包括策略定訂,指定服務提供者,以及確保系統的正常運作。國際DOI基金會同時也維護了一套描述目前DOI實作時所使用的規則和實踐手冊。
6. DOI未來趨勢
目前全球有六個註冊中心,超過三百個機構,一千萬的數位資源登錄在上面。同時Patricia Seybold Group預測,五年內DOI識別碼將會標示在任何行業“published”的產品,換言之,任何資訊只要正式發行,一定會有DOI識別碼。
2.2.3 數位版權管理相關標準
權利表示語言(Rights Expression Language,簡稱REL)是數位權利管理(Digital Rights Management,簡稱DRM)技術其中的一部份,目前仍在發展當中。權利表示語言發展的主要目的是希望藉由完全機讀與自動執行(Mechine-actionable)的方式,提供數位資源強大的保護,以免未授權的不當存取與使用。國際間較為常見且較多人應用的權利表示語言如下介紹:
1. Extensible Rights Management Language (簡稱XrML)
XrML為目前使用最多的數位版權描述語法標準,其發展可以追溯到1994年,Xerox提出了以往不曾處理過的數位物件上的專利權管理,訂出複製、備份、安裝等數位物件上特有的操作行為,並希望能訂定出可機讀(machine-readable)的控制語言來實作此概念。
1998年11月,Xerox提出了以XML製作的數位權利管理規格-Digital Property Rights Language (簡稱DPRL)語言,為XrML的前身。2000年時,Xerox中數位權利管理的團隊,獨立成為子公司ContentGuard,與微軟(MicroSoft)共同經營,並推出了eXtensible rights Markup Language(簡稱XrML) v1.0,為DPRL語言的延伸。2002年,ContentGuard提出XrML 2.0,可以應用於各種權利管理的情境中而不再只侷限於數位物件。ContentGuard繼續維護並發展後續版本XrML2.1,許多不同的領域中數位權利管理也採XrML或REL為基礎發展出該領域各訂的權利管理語言,如Open eBook Forum REL等等。
XrML的主要目的是提供一個國際通用的方法,來達到指定版權、使用條作語保護內容的目的,可視為一種無專利的詳細說明書,以免費使用來鼓勵廣為採用,建接近互運性的達成,對創作者來說,它可以便利版權管理在任何媒體上實現。
2. Open Digital Rights Language (簡稱ODRL )
ODRL是Digital Rights Management community(簡稱DRM)所推薦用以表達數位資源「權利資訊(rights information)」之標準。發展可追溯到1997年,以自動化權利保護為研究專題的John S. Erickson從Dartmouth大學畢業後,在HP實驗室繼續對這塊領域進行研究。Erickson的研究激勵了在澳洲IPR實驗室的Renato Ianella,於是Ianella在2000年提出ODRL這個開放性的標準權利語言。ODRL目前被許多在澳洲以及歐洲的學院、數位圖書館使用,也有商業的應用,如Open Mobile Alliance用其發展無線訊息與行動通訊上的數位權利管理協定。在2002年,ODRL發展出新的版本為ODRL 1.1,而在2003年時則被納入成為W3C之標準,隔兩年2005也被NISO納入成為NISO標準。
ODRL參考了Erickson的研究所得,並以英國的indecs、Editeur等為參考基礎繼續發展。目前由十多個團體共同研發,同時也是W3C所認可的國際標準。
ODRL是一套標準的語言,它具有機械性與插入性兩大特色,其中,機械性是指描述數位資料的權限資訊是可由機器來自行產生;而插入性則是指ODRL可獨立使用,也可插入即有的DRM架構使用。
ODRL適合所有型態的數位內容:它提供了DRM表達上的語義,可以表達詞彙與狀態,像是許可、限制、義務、條件、出價讓版權擁有者的同意,並藉以創設一個開放且可信賴的環境。主要是設計給各類的工作來用,像是電子書、視訊、軟體都包括在內,它保留了延伸性,並提供互運性的機制(Lyon, 2002;Cope&Freeman, 2001;Iannella, 2002;陳映后,2004)。
3. MPEG 21 REL(MPEG 21 Part 5 Rights Expression Language)
在XrML 2.0正式發佈且發展的期間,Motion Picture Experts Group (MPEG)正好在發展一連串數位多媒體影音內容的標準規格,也逐漸發覺數位權利管理再數位影音的使用與傳遞上將是一個不容忽視的重要議題,這部份與MPEG-21規格尤其相關。因此開始研究當時市面上已經被制定出來的各種數位權利管理語言並提出「Call for Proposals for a Rights Data Dictionary and Rights Description Language」。此時XrML與ODRL都提出proposal給ISO,最後ISO決定採用XrML。
MPEG-21 Part 5, Rights Espression Language以XrML為基礎發展,並於2003年成為ISO標準:ISO/IEC 21000-5,刪減了XrML(2.0版)中的解釋性內容(後發展成Part6, Rights Data Dictionary),修改了部份對數位物件的操作,同時不採用XrML的Content Extension,自行發展Multimedia Extension,以符合MPEG影音多媒體的情境。
2.2.4 數位出版之交易與流通平台
數位資源交易牽涉的問題複雜,若從建立交易平台環境的角度而言,應考慮的問題包括:數位內容系統架構、數位資源識別符的登記機制、數位權利管理(簡稱DRM)等問題;下面即介紹Content ID Forum (簡稱cIDf)所提出的數位內容交易的方案作代表。
日本於1999年在東京大學安田教授提議下,結合產官學界的力量,成立了cIDf,致力於數位內容流通平台機制及相關技術的研發。cIDf以數位內容的唯一識別符(Content ID)為基礎,進一步透過其CID辨識內容並傳遞相關權利的資訊,並透過對版權交換與交易的契約的標準與機制的建立,使數位內容交易得以發展。在cIDf中,利用一個參考模型(reference model)來說明整個cIDf規範中整個framework的關係。整個模型分為五個層級:系統、著作權(版權),相關智財權、內容、收費與交易。其關係如圖2所示:
基於上述內涵,cIDf嘗試建立一個能夠使各式數位內容可以流通的平台,主要是由認證機關、Content ID(簡稱CID)發行中心、智慧財產權資料庫以及帳務處理系統四大部份所組成的,此流通運作模式,可以說是著作權所有者與數位內容加值利用者之間協商授權及分配權利金的橋樑。流通平台運作見圖3:
上圖中,CID發行中心及智慧財產權資料庫的運作是由cIDf直接掌控的,認證機關與帳務處理系統則是商請相關業者提供服務,認證機關與帳務處理系統則是由獨立於cIDf外之第三者的身分提供服務。使用平台進行流通交易的著作權所有人及相關業者必須先至認證機關取得認證,並向CID發行中心申請CID,由帳務處理中心依照智慧財產權資料庫中所記載之資料為基準統籌分配權利金。此流通平台運作中,Content ID(簡稱CID)扮演了非常重要的角色,其概念可簡述如下:
1. 「Content ID」是由各數位內容擁有者貨數位內容發行者甚至第三者所各自營運的數位內容管理中心來發出,而且皆在全球唯一的憑證註冊中心(Registration Authority, RA)監督下進行。
2. 在每一個數位內容的標頭或是電子浮水印內建置獨特唯一的「Content ID」,此外,關於屬性等部份資訊則以傳輸內容描述符(Distribution Content Descriptors,簡稱 DCD)來建置於數位內容。
3. 整套的數位內容屬性情報將由各數位內容ID管理中心營運的資料庫(IPR-DB)來管理,其管理方式則是藉由每個數位內容金鑰化的方式進行。
目前cIDf和DOI都已經被ISO MPEG-21遴選為數位項目辨識碼(Digital Item Identifier,簡稱 DII)的基本技術。數位出版相關標準關係表如下表5:
綜觀國際數位出版相關標準發展情形,本研究發現目前國際上電子書交換及描述標準以OeBPS為主流,在數位資源的命名原上以DOI為主,而數位出版品的使用需要REL進行適當的授權與存取,最後在數位內容交易及流通平台上以日本cIDf為代表。
數位典藏標準
數位典藏涵蓋之層面十分廣泛,同樣地其技術標準種類也相當繁多,舉凡詮釋資料、浮水印、文字辨識、語音辨認、缺字技術、跨語言檢索、虛擬時境技術等標準,都是在數位典藏過程中所需要的技術標準。本文以詮釋資料標準為主進行介紹,詮釋資料爲描述數位典藏內涵、特色、背景等資料,目前許多現行數位典藏詮釋資料標準以保存數位典藏之數位內容為目的。這些標準皆具備已經通過國際標準或國家標準的授權認可的重要特徵,如:圖書館社群的「機讀編目記錄」(MAchine-Readable Cataloging record,簡稱MARC)格式也是ISO 2709標準。我們每日經常使用各類的技術標準,例如:ANSI X3.4是1986年國際標準組織公布的字符編碼標準,其以ASCII字碼,廣泛使用於電腦系統。若能正確地遵循此類技術標準(technical standards)中最精確與與最嚴格的形式,將可獲得具一致性的結果。數位內容詮釋資料標準構面如圖1。
2.3.1 標準強度性
爲提供更寬鬆的實務遵循原則與準則,以供組織機構應用,數位標準將採用一套指引(guidelines)準則。以美國研究圖書館組織(Research Library Group, 簡稱RLG)為例,RLG於2002年發行「RLG檔案描述編碼最佳實務指引」(RLG Best Practice Guidelines for Encoded Archival Description),提供RLG所屬會員圖書館在採用Encoded Archival Description,簡稱EAD,雖然EAD標準是檔案類文物的專業性metadata標準,但是進入實務應用的階段,美國RLG參考EAD標準的相關文件,包括:EAD(version 2002) DTD、EAD Tag Library(version 2002)及美國檔案學會的EAD Application Guidelines等,整合並研製實務指引,說明EAD標準如何建置,包括:建立核心元素集、必備的元素與屬性,以提供跨機構組織間檔案資料的互通與資源探索,並提供廠商與EAD系統工具開發者更具體的功能需求指引。
2.3.2 發展標準之社群
數位典藏標準的發展,可分為兩大趨勢:一是特定社群導向的標準,二為跨社群標準。以下就此兩大趨勢標準分別敘述之:
特定社群導向的標準由特定社群的大多數所認同並遵循的標準,這些特定社群包含檔案館、圖書館、博物館及數位學習。以檔案館為例,所發展的標準有EAD,Describing Archives:A Contnent Standard (簡稱DACS),General International Standard Archival Description [簡稱ISAD(G)]等,其中EAD是目前國際間檔案屬性典藏品metadata格式的遵循標準;圖書館社群發展標準有MARC、Library of Congress Subject Headings(簡稱LCSH),Dewey Decimal Classification(簡稱DDC)等,台灣地區圖書館館員處理中文圖書編目時,共同依循的著錄規則則為「中國編目規則」;博物館社群使用的標準則如Categories for the Description of Works of Art(簡稱CDWA)、Cataloguing Cultural Objects(簡稱CCO)等;數位學習社群使用的標準,如:Learning Object Metadata(簡稱LOM)等。
跨社群標準是指不同社群間彼此資料互通所需要較高層次的標準,其中由Dublin Core Metadata Initiative (簡稱DCMI)組織所發展的都柏林核心集(Dublin Core Metadata Element set,簡稱DCMES)目前已經成為ISO 15836標準(本計畫96年度所完成之國家標準草案「都柏林核心集」),此標準也是數位典藏國家型科技計畫跨領域間互通的標準。以下就DC研發單位、標準沿革等分述如下:
1.標準研發單位(背景、目的、運作方式)
The Dublin Core Metadata Initiative (簡稱DCMI)源起於1995年在美國俄亥俄州都柏林市(Dublin, Ohio)為改善資訊資源之搜尋所召開的研討會,該研討會與會人士包括圖書館員、數位圖書館研究者、內容專家、以及全文標示專家等。都柏林核心集(Dublin Core Metadata Element set,簡稱DCMES)原只是一組描述集,然而很快地便引起全球來自藝術、科學、教育、商業、與政府單位等各領域之資訊提供者的注意。
DCMI 是一個跨領域之metadata標準制定、應用與實作為目標的組織,它提出了三個「I」的理念 (International、Independent、Influenceable),可以說,DCMI是推動Dublin Core(最早代表DCMI,後來泛指所有從DCMI衍生出DC Abstract Model、DCMI Metadat terms等之協定模式,簡稱DC)之研究與應用為唯一目標的組織。此組織包括:董事會Board of Trustees、Host、Affiliates、Directorate、Advisory Board、Usage Board、Working Groups等。
DCMI具體的活動主要有兩種:mailing list 及DC Annual Conference,目前的mailing list 主要有下列21個,如下表6:
2.標準沿革
都柏林核心集起源於1995年3月在俄亥俄州的Dublin召開的第一次詮釋資料研討會,這次會議討論制定出一個核心的詮釋資料集合,其功用主要提供數位資源的發現,並以會議的地點為此核心集命名。
DC的年會是一整年活動的總匯整,截至目前為止,今年已是DC第15次的年會,每年約有200-300參加年會,每年的年會都會有重大成果的說明,促使DC不斷的進步。歷屆年會開會地點及主要成就說明如下表7:
DC廣泛為世界各國和國際組織採用,並製定成為詮釋資料的相關規範和標準:
(1)1998年9月,IETF正式接受了DCMES,將其做為一個正式標準予以發布(RFC2413)
(2)1999年7月DCMI頒布了DCMES 1.1
(3)2000年3月通過CEN Workshop Agreement CWA 13874
(4)2001年7月通過美國ANSI/NISO Z39.85-2001標準
(5)2003年2月成為ISO 15836-2003標準
(6)2007年 NISO推出新版ANSI/NISO Z39.85-200X草案。
ISO 15836-2003是採用1999年DCMES的版本,而現今DCMI對DCMES作過多次修正,使得DCMI的最新版DCMES與ISO 15836-2003有所差異,DCMI的最新版DCMES有作了下列改變:
(1)為能語意網更加融合,將元件名稱第一字母由大寫改為小寫。
(2)去除多餘字:將元件定義中的「資源內容」(the content of the resource)改為「資源」(the resource)。將元件定義中的「資源參照」(a reference to a resource)改為「資源」(a resource)。將元件註釋中的「使用字串或數字所組成的正式識別系統」(a string or number conforming to a formal identification system)改為「使用字串組成的正式識別系統」(a string conforming to a formal identification system)。
(3)將「從控制詞彙選一個值」(select a value from a controlled vocabulary)句子用「使用控制詞彙」(use a controlled vocabulary)來代替。
(4)將標籤「資源類型」(Resource Type)改為「類型」(Type)和「資源識別符」(Resource Identifier)改為「識別符」(Identifier)。
(5)將標籤「主題和關鍵字」(Subject and Keywords) 改為「主題」(Subject)。
(6)格式(format)定義清楚化,將「資源之實體或是數位媒體」(The physical or digital manifestation of the resource)改為「檔案格式、實體媒介或資源的度量資訊」(The file format, physical medium, or dimensions of the resource.)。
(7)對元件中識別符(Identifier)、日期(Date)、類型 (Type)、格式 (Format)、語文(Language)和權限 (Rights)之註釋太詳細或過時文字內容作縮減更正。
(8)對涵蓋範圍(Coverage)的定義清楚化,將較模糊字句「資源內容所涵蓋程度或範圍」(extent or scope of the content of the resource)改為「資源的空間或時間性主題」「spatial or temporal topic of the resource」,並增加「或資源相關的政治轄區」(or the jurisdiction under which the resource is relevant)字句。
3. 屬性類型
數位典藏、詮釋資料欄位
4. 應用範圍
DCMES是個易用、易懂的資源描述集,它可以提昇資源在跨領域、跨主題的可見度,同時由於使用成本低廉,因此具有廣泛的吸引力。DCMES可以對資源做一般性的描述,以求跨領域使用者的了解,也可進一步深入的描述,以提供語意較豐富的描述服務。網路資源的使用者可以利用DCMES的檢索詞彙查詢網路資源,獲得基本的指引;雖然若欲深入完整的找到某一文化資源還是必需使用該領域的語彙查詢,但是DCMES這套簡單的描述資訊,卻可以帶領網路資源的使用者注意到其他領域的資訊。
DCMES並不想要取代其他的詮釋資料格式,而希望與其他的標準並存,使得一筆描述記錄中包含不同標準、簡單與複雜兼具的詮釋資料。如在RFC2731文件中所舉的例子就是混合HTML和DCMES的實例。
DCMES的簡易性有其優點也有其缺點,由於其簡易性,因而降低描述資料的成本並增進資訊的互運性,但相對的,也因其簡易性,而無法支援複雜且語意豐富的詮釋資料架構。事實上,DCMES也在到底是要提供語意豐富的資訊或要增加資訊的可見度中做取捨。不過DCMES鼓勵將複雜的詮釋資料架構組合到都柏林核心集中,以彌補此難以兩全的缺失。語意豐富的詮釋資料格式為了轉出或為了跨領域的資訊查尋也可以對映到都柏林核心集。換言之,簡單的DCMES記錄可作為一複雜的詮釋資料之基礎。
5. 國際環境與現況概述
目前DCMI不僅維護DCMES標準,也提出了 DC Abstract Model、Application Profile等規範,並將DCMES翻譯為33種語言格式,成為IETF RFC 2413、ISO15836:2003、CWA/ISSS13874-2000和美國NISO Z39.85-2001、英國、澳大利亞、芬蘭、丹麥等國際組織及國家的正式標準。
為了提供詮釋資料欄位更寬廣應用,DCMI對DCMES不斷擴展其語詞表,並以DCMI 詮釋欄位語詞表 (DCMI Metadata Term)為新元件集合名稱,在2006年12月時DCMI 詮釋欄位語詞表中包含有22個元件(elements)、33個限定詞 (Element Refinements,或稱子元件)、12個DCMI提出來的控制詞 (Controlled Vocabulary Terms)、18個DCMI認可編碼體系規範詞(Vocabulary and Encoding Scheme)。
近年來,DCMI也大力推廣和完善DC的應用綱要 (Application Profile)。既然DC不可能迅速的為某些應用輕易的增加元件或修飾詞,允許複用其他metadata標準規範中的元件就成為一個可行的選擇,這種方法可解決DC的擴展問題,也使得DC可以和其他metadata共存相容。目前DC有都柏林核心集應用綱要使用指南 (CEN CWA 14855: Dublin Core Application Profile Guidelines),為應用規範所應遵守之最低程度的一致性。目前DC有很多Working Group就是為了訂定這些應用規範而存在,如: DC-Library、DC-Agents、DC-Citation、DC-Collection、DC-Administration、DC-Education 、DC-Government等。
6. 未來趨勢
DCMES僅具有15個欄位元件,很難應付現實之複雜環境,故DC 的未來將繼續圍繞這些問題深入展開,DCMI 近年的工作重點:「詮釋資料應用綱要(Metadata Application Profile)」、「詮釋資料抽象模型」和「詮釋資料登記系統」等均是爲了這個目的而提出的,不久的將來就會取得實質性的成果。同時我們也會看到DC與語意網(Semantic Web)的緊密結合,以及DC 努力作爲最一般意義的「資源」描述方式將對未來各類網路應用的語義互通具有核心作用。
在上海圖書館舉行的DC-2004 年會上,來自比利時的Eric Duval 教授作了題爲「讓詮釋資料走開」的發言,宣稱好的詮釋資料應用應該讓用戶感覺不到詮釋資料的存在,甚至讓開發者也能夠使用現成的工具,而無需與詮釋資料方案打交道。雖然很遙遠,DCMI正在朝這個方向努力。
2.3.3 標準描述的層次
數位典藏標準描述的層次則包含資料結構、資料內容、資料值與資訊系統,條列說明如下:
1.資料結構標準(data structure standards)
資料結構是輸入、輸出等組成資訊系統的各式元素,資料結構則為界定一個資訊系統內組成的資訊的元素,包括:輸入格式(如:檔案館或博物館的登錄表單);輸出格式(如:目錄、檔案清單);及紀錄類型(如:館藏、創作者)。是資料元素之間實質或邏輯上的關係,用以支援特定的資料操作功能;特定社群自行發展具共識的資料結構標準最大的好處,是降低軟體開發與資料交換的成本效益。常見的資料結構標準,包括:(1)圖書館社群的MARC;(2)博物館社群的CDWA與VRA;(3)檔案館社群的EAD以及(4)教育社群的LOM等標準。
2.資料內容標準(data content standards)
資料內容是指著錄格式。資料內容標準提供資料結構標準的每個元素資訊輸入的規則、指引用詞的選擇及界定資料值的順序、語法與形式標點,以集結成一筆metadata記錄。主要內容包括:日期與數量表達的格式、每個元素是否為必備或選擇性、每個元素的內容是否為控制詞彙或自由輸入、提供複雜成品或相關作品著錄方法(如:作品之間的組件、層級或粒度關係如何在適當的資料元素內著錄)、提供藏品基本與詳細著錄內容之方法等。常見的資料內容標準,包括:圖書館社群Anglo-American Cataloguing Rules,Second Edution (簡稱AACR2)、博物館社群CCO與檔案館社群的ISAD(G)、DACS等。通常此類型標準需與「資料結構標準」相互搭配運用,例如:圖書館社群的AACR2與MARC、博物館社群的CCO與CDWA;檔案館社群的ISAD(G)與EAD標準。
3.資料值(data value standards)
資料值是指代碼清單與索引典等控制詞彙。資料值標準以控制詞彙方法,提供用詞、名稱(如:人名、團體名稱、地名)、文數字代碼或其他特定內容之清單或表格,用來支援並輸入至資料元素的內容。依控制詞彙結構的深淺度,可以分為用詞清單(term lists)、分類與類目(classification and categories)及關聯性清單(relationship lists)等三大類。第一類「用詞清單」包括:權威檔(authority files)、詞彙表(glossaries)、字典(dictionaries)及地名詞典(gazetteers)。第二類「分類與類目」包括:主題標目(subject headings)及分類表或類目表(classification schemes, taxonomies, and categorization schemes)。第三類「關聯性清單」包括:索引典(thesauri)、語意網路(semantic networks)及知識本體(ontologies)等。常見的資料值標準,包括:圖書館社群DDC、LCSH;博物館社群Art and Architecture Thesaurus (簡稱AAT)、Thesaurus of Geographic Names (簡稱TGN)等標準。
4.資訊系統
在不同資訊系統間之互通是需要有協定的標準,以The OpenURL Framework (簡稱OpenURL)與The Open Archives Initiative Protocal For Metadata Harvesting (簡稱OAI)說明如下:
(1)OpenURL
★ 標準研發單位(背景、目的、運作方式)
Internet 在短短幾年內成長快速,現在幾乎是人們在取得資訊的主要來源之一。也因為Internet 的推出,使得資訊無遠弗界得以實現,反應到學術界則更為明顯,以往需透過層層關卡才可取得的資料,現在只要手指一點就可得到。雖然如此,在資訊不斷膨漲的今天,Internet 是資訊快速取得的地方,同時也是最浪費時間的地方,因為常常會發現要找到想要的資料竟然是那麼困難。此外,許多學術單位,大都多少會訂閱一些電子期刊或是提供研究人員文獻傳遞的服務,要如何快速而且準確的將這些服務提供給單位的使用者是目前所有資訊中心最重視的課題,假設使用者只要在一般的查詢界面,找到某期刊,而此期刊圖書館有訂購電子版,一般做法是使用時必須先連到該電子期刊所屬網站,並且輸入ID與密碼,才可看到該電子期刊,這樣的做法已經不可滿足需求高漲的使用者,如何讓使用者可以用一個滑鼠按鈕就可以達到以往需要3 個或以上個步驟才可達成的成果相對的變得非常重要,但要達成這樣的效果,就必需是在各個網站間,用同一種溝通機制才可以。OpenURL 就是一種在Web 間傳遞訊息的機制,也因此受到學界及市場上的重視。OpenURL 是1990 年代末期,位於比利時的University of Ghent 有一項研究計劃由Herbert Van de Sompel 所領導的團隊執行,當時稱作“Special Effects”,這項研究計劃之研究成果就是我們現在所知道的「與情境相關服務之OpenURL框架鍵與編碼值格式實作指導綱要」 (以下簡稱OpenURL)。
★ 標準沿革
OpenURL 是1990 年代末期,位於比利時的University of Ghent 有一項研究計劃由Herbert Van de Sompel 所領導的團隊執行,當時稱作“Special Effects”,這項研究計劃之研究成果就是我們現在所知道的OpenURL。同一時期,在美國,也有像PubMed,Open Journal Project ……等專案在進行相關的研究。Ex Libris 於2000 年購買 University of Ghent 專案的獨立產權,並在同年發表OpenURL 第一個相關產品SFX Van de Sompel,Herbert 以及Ex Libris 公司的Oren Beit-Arie。之後共同研發OpenURL v0.1。之後並演變成現在的v1.0。也就是正式在NISO 註冊的Z39.88的標準。OpenURL目前是由美國國家資訊標準組織NISO所制定維護。
★ 屬性類型
電子出版、數位典藏、分散式查詢協定
★ 應用範圍
在學術資訊設群中,OpenURL運作架構的主要應用在於將學術資訊系統中一個運用內文的參考對應到相關的資源物件項目。在OpenURL運作架構標準出版之前,已經有相關的應用使用OpenURL草案來進行(也就是目前大家所稱的0.1版) 傳統上使用OpenURL運作架構的方式是: 當一個使用者在摘要以及索引相關資料庫系統或是電子期刊參考列表中,在某個HTML網頁點擊了連結或是按鈕時運作。點擊這個連結的動作將導致一個學術資源(如一篇期刊論文)的描述開始進行傳送,傳送到該項參考相關動態內文的連結伺服器。接著這些相關動態內文將可以提供一個適合使用者使用的相關服務。這個傳送動作是基於HTTP(S)的GET或POST方法參考到一個所謂的OpenURL。當你使用的是OpenURL 0.1版時,所使用的資訊(或稱OpenURL的負載)是透過URL查詢字串來進行傳送。鍵值/編碼資料格式提供了類似的方式來進行參考項目描述的傳送動作。XML格式則是允許XML格式的描述來進行傳送。
西元2000年第一個以OpenURL 為基礎的產品SFX由Ex Libris 發表上市,因為其全文連結的能力,讓圖書館界以及學界造成轟動。一時間,OpenURL這個名詞普遍出現在各個專業性研討會以及專業性雜誌上。隨著市場需求的提昇,相關產品當然就隨市場需要逐漸抓出,到目前為止,除了Ex Libris 的SFX 之外,其他幾個較為知名的相關產品如Innovative 的WebBridge,Openly Information,Inc.的1Cate,這也是目前國內與Muse 所搭配的系統,還有SirsiDynix 的Resolver,其他尚有將近10 個廠商都有開發相關產品。其中也不乏資料庫廠商,如EBSCO,Ovid等等。OpenURL已經成為趨勢,各個學校及學術單位,只要有全文連結的需求,就有OpenURL相關產品的需求。
★ 國際環境與現況概述
OpenURL是應用於Web上超連結的一種標準陳述語法。藉由一組已經定義好的標籤 (Tag),增進Web超連結能力。定義一個標準INTERNET資料連結的陳述語法。讓各個網路上的服務提供者只要遵照此機制,就可以輕易解析資料提供者 (Source)所傳送的要求。而資料提供者也可經由此規範,輕易對服務提供者送出深度連結服務要求,組成份子包含資料提供者與服務提供者。服務提供示意圖5如下:
而就目前狀況已有多家資料提供者提供服務,另亦有相當多的服務提供者已完成支援OpenURL。OpenURL並非取代目前的HTTP既定標準,而只是在強化,並提供不同的資訊提供者、服務提供者,能有標準的語法,互相溝通而沒有阻礙。透過此一標準,能輕易瞭解對方的需求,並提供進一步的服務。
★ 未來趨勢
在2001 年7 月,OpenURL 的創始者Van de Sompel,Herbert 及Oren Beit-Arie 於D-Lib Magazine中發表了一篇“Open Linking in the Scholarly Information Environment Using the OpenURL Framework”。文中闡述了如何在OpenURL 的框架中,讓學術資訊可以開放方式連結。至此我們瞭解,OpenURL 是連結標準,非查詢標準。本標準目前漸趨成熟,而Google 於2004 年11 月推出Google Scholar,而從2005 年2 月開始,它就與主要的幾家OpenURL 解析器進行測試。到目前為止,以SFX 為例,大部分的SFX 用戶都順利的註冊成Google Scholar 的OpenURL解析器。當然,Google Scholar也同時開始成為OpenURL 的提供者。
(2)OAI
★ 標準研發單位(背景、目的、運作方式)
開放典藏推動之詮釋資料擷取協定(以下簡稱OAI-PMH)提供一應用程式獨立互動架構,供詮釋資料檢索。在這架構下有二種類型的使用者:
◎ 資料提供管理系統支援OAI-PMH協定以用來輸出詮釋資料;及
◎ 服務提供者用以透過OAI-PMH協定查詢詮釋資料,並提供其它加值服務。
電子化文件典藏的取用做為增進學術傳播獲取率的手段是OAI努力的方向。OAI主要任務是,開發及推動有助於有效傳播學術內容的互運性標準 (interoperability standards)。由數位圖書館聯盟(Digital Library Federation,簡稱DLF)、網路資訊聯盟(Coalition for Networked Information,簡稱CNI) 和National Science Foundation Grant(簡稱NSFG)共同發展。這幾個組織持續舉辦會議以促進OAI概念和協定的發展,並推廣與OAI相關的活動。Andrew W. Mellon Foundation亦提供經費進行相關專案研究。
★ 標準沿革
◎ 1999年10月數位圖書館聯盟(Digital Library Federation,簡稱DLF)、美國研究圖書館協會(Association of Research Libraries)和Los Alamos國家實驗室(National Laboratory,簡稱LANL)於美國新墨西哥州(New Mexico)的聖大非(Santa Fe)召開第一次Universal Preprint Service Initiative會議,參與人員包括研究員、電腦科學家和圖書館員等,共同研擬建立一個能夠讓作者自行典藏(self-archived)學術性文獻的全球服務機制。
◎ 2001年1月發表Open Archives Initiative Protocol for Metadata Harvesting(簡稱OAI-PMH)網路通訊協定,提供網路資源互運搜尋一個可行的解決方案。OAI-PMH詮釋資料擷取協定運用網際網路及詮釋資料(metadata)兩種技術,在增強功能及降低實施困難度上有很好的效果。
◎ 2002年6月發表Harvesting Protocol (version 2.0)。
◎ 2003年9月26日發表OAI-Rights White Paper,敘述 OAI的範圍及出版權利。
★ 屬性類型
電子出版、數位典藏、分散檢索協定
★ 應用範圍
OAI最初目的是為了學術性電子期刊預印本之互運性檢索而設,因為數位圖書館所遇到的互運性檢索問題與之相似,所以2000年上半年,OAI計畫便將其適用範圍擴展至數位圖書館領域。為達成加強系統間之互運性的目的,更準確地取用學術性電子全文資源,OAI進一步發展詮釋資料擷取協定(Protocol for Metadata Harvesting,簡稱OAI-PMH)以利運作。OAI-PMH是以HTTP為基礎,在協定中,儲存地被定義為可取用的網路系統,其包含可使用擷取協定進行檢索的詮釋資料;這些釋資料以XML的編碼(encoding)格式傳回,不過需要使用無修飾詞(unqualified)的Dublin Core-元件集(Element Set)來支援編碼記錄,然而OAI的協定也允許使用其他有支援XML記錄定義。另外,OAI-PMH亦可支援Perl、Java和C++等程式語言。OAI-PMH主要的功能在於從電子全文的典藏處獲得詮釋資料,並予製作索引以為搜尋線索,達到便於搜尋電子全文的目的,而在進行全文檢索時OAI-PMH會以不同的格式提供詮釋資料。
★ 國際環境與現況概述
現各資料庫大多已提供OAI介面,供外界查詢使用,其比較有名的計畫、組織如下:
◎ 電子預刊本計劃:目前最著名且發展相當成功的兩大預刊本伺服器為arXiv e-Print和CogPrints。arXiv e-Print Archive為最重要且最先創立的預刊本伺服器和檔案系統,收錄物理學、數學、非線性科學、電腦、定量生物學等領域文獻預刊本,係Cornell 大學所支持的非營利性教育機構,如今已成為國際著名的物理學電子預刊本交換典藏中心。CogPrints亦是 OAI架構建置之個人著作典藏中心,收錄學科領域含括心理學、神精科學、語言學、電腦科學、哲學、生物學和認知科學的文獻。其他幾個應用OAI架構的計畫如:收集電腦科學領域技術報告的NCSTRL、收集生物方面預刊本的PubMed Central、建立電子博碩士論文數位圖書館的NDLTD等。
◎ Open Language Archives Community: OLAC是由100位語言學家、軟體開發者和檔案管理專家於2001年所創立的國際性組織,主為研擬語文文字數位典藏一致性且最有效的作業,及發展不同平台典藏庫與服務的網路,以利資源的取用。OLAC依循OAI-PMH資料的詮釋標準,另在檔案的描述中加入管理者(curator)、管理者頭銜、管理者電子郵件信箱和個人或機構檔案四項元件,以提供整合式的查尋介面。唯這些檔案均需向OLAC註冊,亦即想要成為OLAC的資料提供者,必須先將檔案的目錄以Dublin Core和OLAC的詮釋資料格式輸出,以便於OAI-PMH和註冊器(register)進行資源的擷取。
◎ 其他組織所發展的OAI應用:OCLC對OAI的發展也是不遺餘力,發展出三個與OAI相關的工具,作為增進圖書館館藏管理環境(Advanced Library Collection Management Environment--ALCME)的一部份。ALCME主要在創造open-source工具,以支援分散式的圖書館館藏管理系統,這三項工具分別為:
a. OAIHarvester:從OAI相容的伺服器中擷取詮釋資料的Java應用程式
b. 將MARC轉為Dublin Core的轉譯器(translator)
c. OAICat:為一伺服器,能置於現存資料庫的頂端以便於將詮釋資料傳回OAI的儲存地
針對資訊系統部份,由MIT實驗室所發展的Dspace(http://www.dspace.org/) ,亦提供了OAI介面,供外部查詢程式使用。
★ 未來趨勢
未來的二年OAI將發展以數位物件(Digital Object)之資訊交換規範。此規範將讓各典藏單位之間彼此交換所典藏的內容資訊。而規範也包含數位物件的呈現方式與如何去存取(Access)與整合(Ingest)這些內容,強化典藏單位之間橫向的鏈結與資訊的交換。不單是數位物件本身,更包含其延伸的部份,例如:聲音、影像、文字與軟體。並建立新的引文(citation)格式,允許利用物件本身的儲存位置建立虛擬館藏,協助提供新的工作流程以分散註冊、認證、同儕審查及保存的方式增加物件本身的附加價值。且嘗試將其應用
重要國際組織
國際上數位學習、數位出版典藏相關的組織甚多,皆為訂定國際通用技術標準準則之單位。以下就數位學習、數位出版及數位典藏三大類之重要國際組織加以介紹。
數位學習重要國際組織
國際上與數位學習標準需求的提出,並形成雛形的先期規範(specification)的組織中,以IMS最為重要,ADL則偏重於現有數位學習規範與標準的整合與測試,IEEE負責美國數位學習標準的制定工作。這幾個單位是全球相當重要的數位學習標準訂定組織。
3.1.1 IMS
IMS是Instructional Management Systems的縮寫,但此三字目前已不足以代表這個組織的內涵,它原是由致力於推動美國大學應用資訊科技的EDUCOM,在1997年末所推出的IMS專案,由於工作範圍遠超出當初預期,乃於2000年一月轉型為非營利機構,並取名為IMS全球學習聯盟公司(IMS Global Learning Consortium, Inc,簡稱IMS)。IMS以結合大學、政府、產業界與其他非營利機構共同合作,來推動並發展全球分散式學習為主要任務,且所有參與單位都將秉持著堅定不移的承諾,致力於開發、應用與改善前瞻分散式學習環境。
IMS最關注開放性規範(open specifications)的定義與維護工作,它針對產官學界提出的需求而制定規範,以敦促它的成員能在促成資源共享與交換的共識下,來開發學習產品與服務。這些規範主要功用為協調、促成有效的線上學習活動,例如尋找及使用教材、追蹤學習者進度、報告學習者的績效、與其他行政應用系統交換學生記錄等。IMS同時也對全球推廣所定規範的應用方法與相符認證服務。
IMS全球學習聯盟的兩大目標如下:
1. 定義、發展所需的相關技術規範,以達成在分散式學習環境下應用系統或服務的互運功能(互操作性)。
2. 協助其他單位,將IMS規範納入產品或服務中。
IMS全球學習聯盟公司設有總經理和董事長各一人,董事長由贊助會員推選產生,總經理則對董事長負責,總經理之下有技術委員會(Technical Board)和行政小組,行政小組內的少數工作人員負責支援IMS的各項活動。
為支援學習科技標準的建置和採用,IMS設置國際相符方案﹙International Conformance Program﹚,由IMS新設立的相符委員會(Conformance Committee)來督導。IMS全球學習聯盟的組織架構如圖6所示:
IMS全球學習聯盟是非營利組織,採會員制。會員有各式的e-learning廠商,學術機構和政府單位。IMS的營運費用大部分來自會員所繳的會費,會員加入的方式有兩種,即贊助會員(Contributing Member)和一般會員。
贊助會員可說是IMS的核心團隊,他們可以派代表參加各類規範的發展,但一般會員卻無此特權,但各規範工作小組卻可視需要邀請任何單位的專家參與,IMS每年開一次贊助會員大會,贊助會員對技術委員會(Technical Board)的成員有投票權,技術委員會指導規範的開發,IMS另有一更小型的管理委員會(board of governors),來負責未來方向及政策的制定。
一般會員可接觸IMS網站上的內部資料,比如不同論壇的討論內容,與各種規範發展相關的文件,以及規範草案的早期版本,一般會員可由定期舉辦的電話會議裡得知新規範發展中的最新狀況。
IMS全球學習聯盟是目前對E-Learning規範投入最深,也最積極的單位,它可說是學習科技標準推動的上流源頭,與產業界的互動極為密切。IMS每季至少舉辦一次面對面會議,輪流在世界各地召開,通常是由能提供場地設施的贊助會員協助。 IMS每季會議都邀請各國分散式學習的推動主將,到會場做未來方向和目前推動現況報導,讓大家分享最新、最先進的觀念與做法。
IMS與ADL合作密切,但ADL背後所代表的是美國政府單位人員的訓練市場,跟成人學習息息相關,為配合不同工作者的學習內容、時間與環境,以自學模式的教材較為合適,而IMS背後所代表的是美國高等教育業者,主要需求是群體學習的教育模式。未來這兩個機構的發展重點將因服務對象不同,而差異會愈形突顯。
3.1.2 ADL
美國柯林頓總統主政時代,就積極推動學習科技的運用,除了在1996年積極推動中小學教室與網路相連外,1997年時,美國國防部與白宮科技會期待能用學習科技紓解政府與軍事人員龐大的在職訓練需求和費用,故聯合推動Advanced Distributed Learning Initiative(簡稱ADL)計畫,其目的在確保學習者無論在何時何地,都能及時獲取所需的高品質訓練或學習資源。
由於在2000年6月以前,軍方的訓練無法做到把任何一個廠牌的學習管理系統(簡稱LMS)內的課程轉移到別廠的LMS上,也無法在不同的LMS上執行或再用同一課程內容,更未建立可搜尋學習內容或媒體的機制,這都造成訓練經費的重複投資、資源無法有效運用、訓練成本高漲等問題。
ADL先導計劃則希望透過「教材再用與共享機制」的建立,來縮短教材開發時程、減少教材開發成本、促成教材能在各學習平台間流通自如,讓美國的公務員與軍事人員未來都能隨時、隨地、在需要時,就能運用任何裝置(如個人電腦、數位助理、大哥大或網路電視),來取得所需的學習資源,即刻進行學習,同時在這教材共享機制下,也能達成大幅降低美國政府訓練費用的目標。
為解決數位學習標準混亂、學習素材難以重覆使用、不同單位學習素材無法互運等問題,ADL結合教材開發商、使用者,以及數位學習標準推動單位(IMS、AICC、IEEE),研究制定出一套共用的數位學習標準「共享式內容物件參考模型」(Sharable Content Object Reference Model,簡稱SCORM)。希望透過教材再用與共享機制的建立,縮短教材開發時間、減少開發成本、促使用教材在各學習平台間自由流動。
為刺激產業界瞭解並採用SCORM標準,ADL(2004)列出對於使用標準的期望:
1. 易用性(Accessibility)
學習者可以在任何時間、任何地點接近取得適當的學習內容。
2. 適應性(Adaptability)
可隨學習者之經驗調整其學習內容,達成彈性化學習。
3. 經濟性(Affordability)
能以經濟有效的方式開發教材。
4. 耐久性(Durability)
電腦科技提升或改變時,不須重新修改應用程式或教材。
5. 互運性(Interoperability)
教材可以在任何開發系統和教學平台上使用。
6. 可再用性(Reusability)
在不同應用環境下,學習內容或學習物件可以重複使用。
由此可知,SCORM的理想是希望能為教材製作者、教學設計者和學習者獲得最大的利益;教材製作者可以有更多的心力製新的素材,而無需因為規格不同而做重複的事;教學設計者可以快速的找到所需的素材,組合成新的教材;學習者更可以在任何時間、任何地點,做適性的學習。
ADL每年舉辦2-3次的PlugFest活動,除了說明ADL規範製定的現況外,也進行標準互運性的測試活動。ADL計畫主要透過4個協同實驗室(Co-Lab)及2個技術中心(Technology Center)來推動,其中位於維吉尼亞州的主協同實驗室(Co-Lab Hub)是ADL建立的第一個協同實驗室(Co-Lab),主要負責培育合作研發數位學習需要的工具、標準、內容與準則等,其它3個協同實驗室為:威斯康辛的學術協同實驗室(Academic Co-Lab)、孟菲斯市的人力協同實驗室(Workforce Co-Lab)、奧蘭多市的接合協同實驗室(Joint Co-Lab)。兩個ADL技術中心則分別為:賓夕法尼亞州的技術中心(Technology Center)與維吉尼亞州的工作成果技術中心(Performance Technology Center)。
ADL除了在美國本土上成立Co Lab外,亦積極於全球與各國合作建立所謂的合作關係實驗室(Partnership Laboratory),並已於英國與加拿大成立ADL Partnership Lab,彼此相互合作研究。亞太地區目前有韓國、澳洲、墨西哥陸續成立。
ADL目前除了持續推廣SCORM之外,更著手整合各軍種學習元件資料庫,以建置國防部資料倉儲(DOD Repositories)為目標。由於全球在學習元件資料庫的建置上,還缺乏成熟的標準、也未有業界共同遵守的法則,促使ADL於2004年2月底的第一屆國際Plugfest大會上即提出內容元件倉儲發現與註冊架構(Content Object Repository Discovery and Registration Architecture,簡稱CORDRA)計畫構想,目的在研究如何串連整合世界各地之教學資源庫,滙整分散各地的數位學習資訊,促進資源的分享與流通。CORDRA試圖由現存的各種不同標準、不同結構之Repository系統為出發點,定義出適當的規範來統合搜尋使用這些已經存在的課程元件資源庫,持續朝達成『無論在何時何地都能提供實惠、符合個人需求、最高品質的教育訓練』的遠景努力。
3.1.3 IEEE_LTSC
電子電機工程師協會(Institute of Electrical and Electronics Engineers,簡稱IEEE)是一個由技術專業人員組成的國際性非營利團體, 在電子、電機與電腦工程領域素負盛名,共有三十七萬七千多名會員,當中包含八萬名以上之學生,遍佈一百六十餘國(2006年年底)。IEEE也是正式標準的研定機構,其下所設的學習科技標準委員會(Learning Technology Standard Committee,簡稱LTSC)組織,主要職責就是數位學習相關標準的發展, LTSC由四個工作小組形成,以促進教育資源的開發、使用、維護及互運為目標,由於IEEE採審慎且公開(會員皆可參與)的標準研定程序,所以正式標準通過的進度比較慢。
IEEE學習科技標準委員會(LTSC)成立的目的有二大重點:
1. 發展科技標準、建議實踐方式及建立軟體元件、工具與科技應用指南。
2. 針對教育訓練系統及元件的實作,設計一套簡化發展、佈署、維護與整合的方法。
而LTSC組織共包含四個主要工作小組,分別是:
1. Digital Rights Expression Languages, WG4:負責蒐集數位權利表達語言相關所有需求,以推動學習內容交換體系所需的智慧財產權描述和線上交易活動。
2. Computer Managed Instruction, WG11:在電腦輔助訓練(Computer-Based Training,簡稱CBT)這個領域,全球有許多的組織在制定其標準以及工具,但其實當中大多可以做統合合作,互相參考,運用不同的工具來達到相同的目標,因此設立此CMI的統一標準制定的工作小組來讓全世界這些CBT制定小組能夠有所依循的目標。
3. Learning Object Metadata, WG12:對於學習物件描述資料(Learning Object Metadata,以下簡稱LOM)的標準,在世界上同樣也有不同的規範,此工作小組主要在推動對於學習物件的描述上有個完整的需求屬性來做到完整詳實的描述。
4. Competency data standards, WG20:此工作小組主要在於可再利用技能定義(Reusable Competency Definition,簡稱RCD)的草稿擬定,並且試著去加入新的相關技能科技標準。
IEEE標準發展流程訂定之四項原則
1. 共識(Consensus):以共識作為接受度的衡量基礎,而非需全部同意,雖然很難找出對共識的真確定義。但操作上將「通過」認定為超過3/4的投票者同意。
2. 公開(Openness):開放任何對內容有興趣的團體或會員參加,所有的會議,電子郵件的回應等等內容,都受此原則約束。
3. 明定的流程(Due Process):所有參加者都必須依照此明定流程運作,也就是說必須提供所有參加者足夠的參與和評論機會。
4. 申訴的權利(Right of Appeal):IEEE 的組織架構必須有申訴管道,讓參與者能對其不同意的程序或決定提出申訴。因此,任何對標準有興趣的團體都可加入LTSC,文件的通過與否由共識決定,電子郵件論壇與電話會議也對所有參加者公開,會議細節都會公佈,參加者也能就程序或結果向電腦社群或IEEE申訴。
IEEE標準的發展與制定流程,LTSC的標準發展流程從專案授權申請(Project Authorization Request,簡稱PAR)開始。申請書中需說明所提議標準的範圍及目的。經IEEE同意後,LTSC的一個工作小組就透過反覆的程序來產生符合PAR的標準草案。此反覆過程包含面對面會議,電子郵件回應區,及可能舉行的電話會議。 每個專案都有一位技術編輯。工作小組的目標是達成對文件的共識,並將之移轉給正式的IEEE步驟。討論過程中所有的改變和改變的理由,都必須做成文件紀錄。工作小組所花的時間可長可短,對於已經測試過的標準就很快,對於需從頭起草的標準就非常慢。
當工作小組認為妥當,也獲取共識後,就送請LTSC執行委員會同意,經其認可後再將標準草案送交給IEEE ,以舉行正式投票。IEEE會為此目的,而組一個投票委員會,其成員來自工作小組,也可能邀請外界人士。當每一輪投票時,委員們必須針對所提送的標準做出「是」或「否」的選擇。不同意的人必須說明理由,最好能提出改善建議。
一個標準若要獲得通過,就必須投票時有3/4以上的委員參加,並至少獲得3/4參加者的同意。 跟工作小組一樣,對標準草案的任何變更與理由,都必須紀錄。委員會中只要有可能還會改變的否定票,就必須盡力修改標準草案,以獲取其同意,同時還不能流失既有的同意票。這個技術改版的工作通常由少數專家組成的投票爭議解決委員會來處理其會員通常是工作小組中的活躍份子,有時也會邀請外界專家參加。
當投票委員會達成3/4的同意門檻後,此標準草案就送給IEEE來做最後同意的步驟。這最終同意的審核依據是:
1. 文件是否符合PAR的要求;
2. 文件格式是否正確;
3. 標準制定是否遵循正確流程來進行。
IEEE LTSC未來將致力於跟全球各標準組織協調,並已與ISO/SC36達成協議,未來將以全球共同參照一套詮釋資料抽象模式為原則,並持續進行詮釋資料架構的維護與修改工作。LTSC提出的數位權利表達語言(Digital Rights Expression Language,簡稱DREL)標準專案,已獲IEEE同意進行,這是LTSC獨自發起的標準,也是它的特色項目。
數位出版重要國際組織
在數位出版標準發展方面,國際上重要組織主要圍繞在數位內容格式、數位版權管理及數位行動閱讀設備標準三個範疇。本節介紹國際數位出版論壇 ( International Digital Publishing Forum,簡稱IDPF)、國際DOI基金會(International DOI Fundation,簡稱IDF)與eNews計畫;IDPF為一居於電子書產業領導地位的國際性商業與標準聯盟,IDF為發展數位出版資源登錄授權的國際非營利機構;eNews計畫則為新興的國際性跨領域的行動電子閱讀設備開發計畫;以下分別詳細介紹之。
3.2.1 國際數位出版論壇
國際數位出版論壇(International digital Publishing Forum,簡稱IDPF),為使電子書能成功開拓市場,並便於閱讀系統(Reading Sysytem)間的互運,IDPF前身為—開放電子書論壇(Open eBook Forum,簡稱OeBF),其制定了Open eBook Publication Structure(簡稱OeBPS)作為電子書內容描述的標準。IDPF是一國際性商業與標準組織,成員包括:軟硬體公司(如Adobe、IBM、Microsoft)、出版業者(McGraw Hill、IDG等)、數位學習/數位圖書館組織、作者、電子書的讀者及相關組織等等;該組織之主要目標,除致力於發展電子書相關議題與技術外,並致力於發展、出版與維護電子書共通規格,以達成系統業者協調合作,消弭彼此間差異。
3.2.2 國際DOI基金會
國際DOI基金會(International DOI Foundation,簡稱IDF)是一個國際非營利會員組織,目前在美國以及英國有其分支機構。這個基金會的任務包括授權目錄管理者,登錄代理人,以及提供相關技術,訂定系統策略,以及鼓勵相關技術之開發(如版權管理等電子交易系統架構等)。美國國家資訊標準組織(簡稱NISO)在1998年加入後,開發出DOI識別符的語法標準,期望擴大數位物件識別符的潛力與應用。
國際DOI基金會(簡稱IDF)提供了實作上的管理,同時也提供了技術基礎架構(解析技術,代理伺服器,鏡像儲存,備份,以及中央辭典)以及社群基礎架構(永續儲存的承諾,退守程序,成本核定或稱自營模式,以及系統分享使用)。IDF本身並不是標準的主體,而是一個中央授權以及管理的代理人。目前IDF已經是ISO/IEC MPEG 21版權資料辭典的註冊授權者,同時也被提案成為ISO TC46/SC9的DOI系統登錄授權者。IDF授權動作是透過登錄代理人來進行,每個被授權者可以開發自己的DOI應用,並在各自領域社群中進行發展(Paskin, N., 2006)。
3.2.3 eNews計畫
德國的報紙出版商協會Ifra主導的eNews計畫,為期三年,旨在研究行動電子閱讀設備的商機,並期望制定行動電子閱讀設備相關的產業標準。參與該計畫的國際出版商共有超過20家,包括美國紐約時報(The New York Times)、英國每日電訊報(The Daily Telegraph)、法國的La Parisienne、西班牙的El Paris及日本讀賣新聞(Yomiuri Shimbun)等等。此計畫除了國際性媒體的結盟,並與英國塑料公司Plastic Logic合作,針對電子閱讀設備技術(可撓性底板半導體技術)進行開發,提供數位出版相關產品在電腦與行動手機外的另一種顯示選擇。
eNews先導計畫預計持續到2008年,活動內容主要包括研討會、巡迴研究活動、消費者研究等。該計畫的相關計畫—eNews2010及eNews Asia則由2007啟動,eNews Asia由新加坡負責主持,預計進行至2010年。
數位典藏重要國際組織
國際上數位典藏相關的組織甚多,部分組織建立跨學科領域的數位典藏標準,部分則偏重於某些特別領域,如藝術、視覺、地理等;又數位典藏國家型科技計畫內容涵蓋自然科學與人文科學兩大類,因此以下就全球目前重要的數位典藏標準訂定組織做一介紹:
3.3.1 The Getty
J. Paul Getty Trust 是世界上最大的藝文信託基金會之一,本機構主要的贊助、研究與收藏範疇為視覺藝術。本信託基金會運籌的機構,除了位於Brentwood的J. Paul Getty Museum及加州馬里布的Getty Villa以外,主要的運作機構有三:蓋提基金會(Getty Foundation)、蓋提研究學院(Getty Research Institute),以及蓋提保存學院(Getty Conservation Institute)。
為加強視覺及相關學科資訊的取得,蓋提研究學院啟動了名為「蓋提標準與數位資源管理計畫」(The Getty Standards and Digital Resource Management Program),希望藉由推廣和使用標準及發展標準工具及準則,促進電子形式的資訊傳遞的發展、管理與保存。目前蓋提已發展的標準與字彙包括藝術與建築索引典(Art& Architecture Thesaurus,簡稱AAT)、地理名稱索引典(Getty Thesaurus of Geographic Names,簡稱TGN)與藝術家名稱聯合名錄(Union List of Artist Names,簡稱ULAN)。
由於Getty這個組織專注於藝術、建築和文化文物的發展與保存,因此其所發展的詞彙(vocabularies)偏重於此領域的專門術語、相關的文物、思想、藝術家以及與上述相關的地方資訊。地方資訊以地理名稱索引典(Getty Thesaurus of Geographic Names,簡稱TGN)為例,TGN是一結構性的詞彙,有多達百萬餘筆地名和資訊,涵蓋當今世界各洲、國家以及歷史地點。TGN記錄(record)的焦點在於「地方」(place),標示為資料庫的唯一值,以連結至其名稱、階層結構中的上層地方、關聯性、地理座標、附註、資料來源、以及地方屬性(如居住地、州郡)。此外,為解決創作者姓名混淆的情況,也發展出上述的藝術家名稱聯合名錄(Union List of Artist Names,簡稱ULAN),使得在編輯視覺藝術文件時,藝術家姓名形式具一致性,有助於資源的檢索與取得。
3.3.2 VRA
視覺資源協會(Visual Resources Association,簡稱VRA) 於1982年成立,是一個以影像媒體專業為主的國際組織。本協會是由北美藝術圖書館組織(Art Libraries Society of North America,簡稱ARLIS/ NA) 及中美洲學院藝術聯盟(Mid-America College Art Association,簡稱MACAA)所組成的學院藝術聯盟(College Art Association,簡稱CAA)所成立。雖然是以藝術與幻燈片圖書館的角度為創立基礎,但是視覺資源協會也同時著重其他學科與形式對圖像的需求。本協會設有分支,且一直是專業圖像教育與圖像媒體創造、描述與散播的最前線。
視覺資源協會致力於不管在教育、文化歷史或是商業的環境中,圖像管理的前瞻研究與教育,這個協會被委託領導視覺資源領域、開發與宣傳標準、提供社區福利性質的教育工具與機會。視覺資源協會透過教學活動與出版計畫來達到這些目的,也提供了重要議題討論論壇,如:視覺文化數位類比圖像的獲得與保存。
此外,視覺資源協會研發出的標準包含博物館社群的標準編目,文物編目:文物及其影像指南(Cataloguing Cultural Objects: A Guide to Describing Cultural Works and their Images,簡稱CCO),是視覺影像學會2003年11月推展的計畫,由保羅‧蓋蒂信託基金補助計畫(Getty Grant Program)、數位圖書館聯盟(The Digital Library Federation)以及梅樂基金會(the Mellon Foundation)所贊助,主要是在協助視覺資源編目員、博物館登錄人員、以及圖書館編目員、檔案管理、以及其他從事文物及影像整理著錄等人員在描述、著錄以及編目上的一個準則。目前這項計畫也持續朝著建立一致性文化遺產目錄環境的目標努力。
另一項標準為視覺資源學會核心類目(VRA Core Categories),VRA以視覺資源社群為焦點,提供指引以描述藝術品、建築物、器物,大眾或民族文物等視覺資源。為了便利於視覺資源社群間資訊的交流與分享,其設計原則著重元素(共17項元素)簡單、彈性、可重覆應用,並提供元素資料值(data value)建議標準,以利資料的一致性與正確性,目前仍持續發展中。
3.3.3 LC
美國國會圖書館(Library of Congress,簡稱LC)成立於1800年,開館時僅有圖書740冊,現已成為全世界館藏資料最多的圖書館全部超過1億個項目,國會圖書館組織龐大,體系複雜,除直屬館長室的數十個行政單位外,主要的業務單位可以歸納為6個部門:(1)國會研究服務部(Congressional Research Service,簡稱CRS),負責提供國會立法所需的各種資料與參考諮詢服務;(2)版權局(Copyright Office),為美國版權法的執行機構,掌管各種圖書館資料之版權登記;(3)法律圖書館(Law Library),蒐藏美國以外的其他各國的法律資料,並爲國會提供32種不同語言的法律諮詢服務;(4)全國性計畫部,包括美國民俗物出版中心、兒童文學中心、盲人與殘障圖書館、出版處等單位;(5)採編部,負責各類資料之徵集、編目分類、自動化與網路規劃,標準研訂、書目產品之出版與分發等事務;(6)研究服務部,包括一般參考服務、區域研究資料之典藏與服務、特種資料之典藏與服務等。
由於性質甚為特別,美國國會圖書館是國會圖書館,也是國家圖書館。因為是國會圖書館,所以要特設一個國會研究服務部,維持一個法律圖書館;因為是國家圖書館,所以又負責全國出版物的版權登記,並設立了一些全國性的服務計畫,如DDC之研究修改、NUC之編印發行、MARC之研訂等。
上述的Machine Readable Cataloguing Record(簡稱MARC),機讀編目格式為圖書館界的編目格式,而非單一標準。起源於1965~6美國國會圖書館發展一套標準化的資料記錄架構(LC MARC),以利圖書館間書目資料的交換。之後各國紛紛採用,並以國情加以修訂。機讀編目格式通常包含3要素,記錄結構(record structure)、內容標示(content designation)與記錄的資料內容(data content of the record)。
3.3.4 TEI
文件編碼組織(Text Encoding Initiative,簡稱TEI),主要為定義一套電子文獻的索引,使各類用戶可不受軟、硬體及應用環境的限制而達到資源共享。TEI規定每一份TEI文件前面都要有TEI Header(由歐洲、北美的圖書館學界與檔案學界所組成的委員會訂立)來描述該文件,包括文獻書目特徵描述、編碼描述、非書目性特徵描述、修訂描述。
TEI是一個跨學科的全文標示標準,主要應用在文學與語言文字領域。TEI Header的編碼必備項只有”文獻書目特徵描述”中關於題名、出版者、來源的三個數據項,描述項目可根據需要以SGML DTD來擴增,因此編碼結構極有彈性;又因著錄項目多為直接填寫,所以不需要專業的編碼技能。
3.3.5 (参见:张娴 萧国华.网上文献信息资源的描述、规范与检索. 图书馆理论与实践, 2000(6))()DCMI
都柏林核心詮釋資料組織(Dublin Core Metadata Initiative,簡稱DCMI)源起於1995年在美國俄亥俄州都柏林市(Dublin, Ohio)為改善資訊資源之搜尋所召開的研討會,該研討會與會人士包括圖書館員、數位圖書館研究者、內容專家、以及全文標示專家等。都柏林核心集原只是一組描述集,然而很快地便引起全球來自藝術、科學、教育、商業、與政府單位等各領域之資訊提供者的注意。
都柏林核心集(The Dublin Core Metadata Element Set,簡稱DC)是個易用、易懂的資源描述集,它可以提昇資源在跨領域、跨主題的可見度,同時由於使用成本低廉,因此具有廣泛的吸引力。DC可以對資源做一般性的描述,以求跨領域使用者的瞭解,也可進一步深入的描述,以提供語意較豐富的描述服務。網路資源的使用者可以利用DC的檢索詞彙查詢網路資源,獲得基本的指引。
數位學習及數位出版典藏關鍵技術
數位學習、數位出版與數位典藏都屬於數位內容產業之一,各自有其關鍵技術的發展,在此依據數位學習、數位出版與數位典藏之關鍵技術,分述如下:
數位學習關鍵技術
國際上從事數位學習規範或標準訂定的組織很多,各有不同重點和特色,但其所發展的成果大致上可分為五類,最核心的是與學習資源、學習者和學習環境相關的三類標準,然後是與品質衡量有關的教育管理類標準,此外還有最基本的基礎架構類,表8就國際上各組織所研訂的規範或標準,做一對照表。
下表9則列出數位學習各項關鍵技術標準之分類,及其功能互補對照表。
圖7為數位學習各項關鍵技術標準之關連圖。
數位學習主要國際標準之優缺點整理如下表10:
數位出版關鍵技術
數位出版的關鍵技術,目前電子書標準主要有兩種:一是由國際組織EDItEUR所發展的Online Information eXchange(簡稱ONIX)標準,強調資料的著錄與交換;一是由Open eBook Forum(簡稱OeBF)所發展的Open eBook Publication Structure 1.2(簡稱OEBPS)標準,著墨於電子書內容的標準規範。
4.2.1 ONIX
1997年7月美國出版者協會(Association of American Publishers,簡稱AAP)召開會議,與60多家出版社及線上書商共同討論如何在網際網路銷售圖書,會中決定成立一項計畫,探討出版社提供產品資訊給網際網路書店的資料需求。六個月之後,2000年AAP的ONIX第一版問世。
ONIX國際標準是針對圖書而發展的著錄及行政詮釋資料,目的在於增進電子商務,提供網際網路書商豐富而標準化的產品資訊,並因應圖書批發商及零售商各種格式書目資訊交換的需求。
維護ONIX標準的單位主要是歐洲EDI團體(European EDI Group,簡稱EDItEUR)、圖書工業研究團體(Book Industry Study Group,簡稱BISG)以及英國圖書工業通訊組織(Book Industry Communication,簡稱BIC)三個單位。ONIX主要奠基於EDItEUR之前所發展的國際標準(EDItEUR Product Information Communication Standards,簡稱EPICS)。EPICS示範為叫廣的產品資訊交換標準,嚴守電子商務系統資料互通標準(Interoperability of Data in E-Commerce System,簡稱INDECS)。INDECS是電子商務詮釋資料的基礎架構,該計畫成員主要有六個,包括EDItEUR和國際DOI基金會在內。
ONIX1.2版於2000年11月公布,1.2.1版於2001年7月1日,2.0版於2001年7月25日公布,2.0修正版於8月2日,目前最新版為2004年公布的ONIX for Books 2.1版修正版。
在ONIX標準中,一筆ONIX記錄代表一個產品的資訊訊息,採用XML作為交換語法,利用XML DTD來定義欄位的必備與非必備、可重複與順序關係,並有指引手冊詳述每一欄位的標準定義,以確保傳送者與接收者所指的是同一件事。ONIX原始設計分為兩個層級:Level1 與Level2。Level1是一較小的子集,主要設計給小型出版社,並採用人類可閱讀的參考名稱(XML Reference Name),Level2則盡量採用集合,以著錄更豐富的資訊並增加彈性,採用機器可讀的標籤(tag)。所謂的集合就是盡量不明訂欄位名稱,而已其屬性表現,並以代碼表來給予識別,以增加彈性。
ONIX for Books2.1共包含:XML訊息規格(message specification)、產品記錄規格(product record specification)、主系列記錄規格(main series record specification)與子系列記錄規格(subseries record specification)四個部份的規範指引。
ONIX的XML產品資訊訊息由四個部份組成:一為起始(start of message),XML標準在此宣告此格式、內容以及ONIX產品資訊訊息的根元素;二為標頭資料(header block),主要記錄訊息規格;三為主體(the body of the message),包含產品,主系列與子系列記錄以及結尾(the end of message)等四部份。
ONIX International 的使用者包括網路書店、圖書批發商與零售商、聚集資料庫廠商(aggregators)、出版社、索摘服務、書目共用中心、系統廠商、標準團體與圖書館等。早期採用ONIX的主要是網路書店,例如Amazon及BN.com等。
4.2.2 OeBPS
為使電子書能夠成功開拓市場,並便於閱讀系統間的互通, Open eBook Forum(簡稱OeBF)制訂Open eBook Publication Structure(簡稱OeBPS),以作為電子書內容描述及封裝的標準。Open eBook Forum是一個居於電子書產業領導地位的國際性商業與標準組織,該組織成員包括:軟、硬體公司、出版商、作者、電子書的讀者、以及與電子出版相關組織等,目前如Adobe、IBM、Microsoft等軟體公司;McGraw Hill、IDG等出版業者都已加入。該組織成立之目的在探討電子相關議題與技術,並致力於發展、出版、維護電子書的共通規範,以達成系統業者協調合作、消弭彼此間的差異。OeBF具體目標為:
1. 提供內容提供者(Content Provier)及工具提供者(Tool Provider)一個最基本、最普遍的指導方針,且可保證期內容在不同電子書平台皆能很精準、正確且適當的呈現。
2. 建立內容格式的標準。
3. 定義一資料內容描述的標準,讓電子書的提供者能滿足多元的閱讀系統(Reading System)。
OeBPS的最新版本為2002年所公布的1.2版,它是運用現有技術標準,加以整合應用的產物,這些技術包括:HTML、XML都柏林核心集(Dublin Core)等,而任何電子出版品只要依據OeBPS中所規定的規格來製作,便可稱為一OEB文件。OeBPS1.2標準包含三大部分:OeBPS包裹檔(Package)、基本OeBPS全文標示詞彙(document vocabulary)、OeBPS排版樣式(Style sheets),以下分別說明:
1. OeBPS包裹檔(Package):
(1)每一出版品必須包含一個OeBPS包裹檔,用來指定組成該出版品的OeBPS文件檔、圖檔、其他物件,以及他們之間彼此的關係。
(2)OeBPS包裹檔的附檔名為.opf,語法為XML,MIME Type為”text/xml”。
(3)OeBPS包裹檔主要包含以下部份:
a. Package Identity:OeBPS出版品的唯一識別號。
b. Metadata:出版品的Metadata包含:dc-metadata:Dublin Core欄位,及x-metadata:其他補充metadata。
c. Manifest: 組成該出版品的檔案(OeBPS文件檔、圖檔、樣式表等)。
d. Spine:文件所提供的線性閱讀順序。
e. Tours: 文件所提供的其他閱讀順序,例如針對不同的閱讀目的或不同的閱讀族群。
f. Guide:出版品結構參考資訊,如目次、前言、書目資料。
2. 基本OeBPS全文標示詞彙(document vocabulary)包含的元素與屬性摘自XHTML(源於HTML 4.01)。
3. OeBPS排版樣式(Style sheets):以CSS為排版樣式
OeBPS標準的出現,將使業者之間的系統得以互通,有助於電子書數位出版的推動。
數位典藏關鍵技術
數位典藏之關鍵技術,以數位典藏國家型科技計畫為例,本計畫包含自然科學與人文科學兩大類領域,典藏內容分屬12個主題,使用和規劃設計中的數位典藏系統超過90個,又基於數位典藏各機構本身業務或研究需求的不同,典藏系統往往採用不同的資料結構,典藏品的目錄也往往各不相同,由於考量到數位內容的檢索效率、資料即時同步更新等效能指標,數位典藏之聯合目錄系統即採用Open ArchivesInitiative Protocol for Metadata Harvesting(簡稱OAI-PMH)為資料交換標準規範。採OAI 技術為基礎的全國性數位典藏藏品檢索與搜尋引擎,透過單一網站窗口來檢索全國百餘組跨十二領域數位典藏資料庫的典藏資料,同時也作為學術研究、教育發展與企業應用的最佳瀏覽平台。以下就數位典藏聯合目錄,說明數位典藏OAI與Dublin Core此兩個互通的關鍵技術。
數位典藏聯合目錄系統採用OAI 架構設計,以整合各計畫的藏品資料與檢索介面,在聯合目錄檢索瀏覽模組方面,依據需求分析聯合目錄系統至少必需具備分類目錄瀏覽、Dublin Core 檢索與全文檢索等功能,以提供跨越典藏單位的資料檢索與瀏覽各館藏單位的藏品內容。此外,Catalog 類別負責維護階層性分類目錄的完整性,透過此類別可存取本系統中任意層次的目錄資料,將Catalog類別所取得的分類目錄代碼, 傳入ArchiveRecord 類別中的getRecord 方法便能取得特定目錄下的藏品資料,據此便可設計分類目錄瀏覽功能;至於檢索功能,因Search 類別具有基本檢索的特性,可快速實作不同的檢索方法,因此可透過呼叫相對應的檢索介面,完成Dublin Core 與全文檢索功能的設計。
要將所有的藏品資料整合到聯合目錄系統不失為一諾大的挑戰,所以必須設法降低資料轉換過程中的複雜度與成本,由於OAI 對於聯合目錄資料系統資料匯入的格式並無明確的規範,典藏系統可用任意的格式將藏品資料匯給聯合目錄資料系統,所以為了處理不同格式的資料,聯合目錄資統系統必需額外增加能夠處理該格式的介面,如此一來便大幅增加資料轉換的成本。因此便設計一個共同的資料匯入格,此一資料匯入格式則是以DublinCore 做為描述藏品資料的核心項目,同時也加入管理性的控制資料 ,如計畫描述資料(Project)元素,描述此筆藏品資料屬於哪個計畫的產出,此文件係由誰或哪個系統所建立與何時被建立等,其中文件建立時間為資料是否需要更新的判斷依據;而資料分類目錄(Catalog)元素則是記錄此筆藏品資料被分類到哪幾個的分類,以方便聯合目錄資料系統建立起藏品資料與分類目錄的對應關係;數位藏品編號(DigiArchiveID)則描述此筆藏品資料的識別編號,以做為判斷此筆資料是否已經被建檔;及描述相關的藏品資料鏈結,以增加共同目錄系統資料的完整性。雖然在Dublin Core的15 個元素中亦有可描述管理性資訊的項目,但由於將管理性描述資訊放置於DublinCore 中會與藏品內容產生混淆的情況,尤其是將多項的藏品資料項目對應到單一的Dublin Core 元素時尤為嚴重。為了避免產生類似的問題,因此在設計此資料匯入介面時,便將管理性描述資訊與藏品資料區分在不同的位置,以更明確定位出何者係管理性的描述資訊。
隨著數位典藏相關計畫陸續完成典藏資訊系統的開發,典藏品資料得以有效地管理,但因系統彼此獨立,無法進行跨系統間的藏品資料檢索,阻礙了資訊的流通,因此,OAI架構的導入將能將不同類型的藏品資料與檢索服務整合。
結論
綜觀上述,本報告分別以數位學習、數位出版及數位典藏三大領域中,關鍵技術標準與重要組織的發展現況與趨勢進行檢視,研究發現數位學習標準主要由三個重要的國際組織IMS、ADL與IEEE各自發展與控管,如:IMS主要著重於高等教育、ADL特色在「教材再用與共享機制」的建立,此三大組織將會以各種網路服務以及資訊交換為主軸發展。而在數位學習標準上,雖然國際上從事數位學習規範與標準訂定的組織繁多,各有不同的重點與特色,但所發展的成果大致上可分位五類,最核心的是與學習資源(如:IMS Question & Test Interoperability、IMS Content Packaging Specification等,此兩份標準已於本計畫研擬完成國家標準「問題與測驗互運性」「內容包裝」草案兩份)、學習者(如:IMS Learner Information Package),以及學習環境(如:IMS Enterprise Specification)相關之三類標準,其次為與品質衡量有關的教育管理標準與最基本的基礎架構標準。
數位出版方面著重於三個重點:首先,數位出版成品以電子書為主,因此電子書相關標準格外重要,目前國際上以OeBPS為主流;其次,為使數位出版成品能在網際網路有效地被利用與檢索,重要的機制為給予一個數位識別符,國際上以DOI標準為主流(本計畫依此研擬完成國家標準「數位物件識別符語法」草案);最後,數位出版品的使用與權利表示語言(REL)密不可分,REL目的是希望藉由完全機讀與自動執行的方式,提供數位資源強大的保護,以免為授權的不當存取與使用,目前發展中的標準包括:XrML與ODRL等。
最後,數位典藏在國際發展趨勢上則以各社群獨立發展為導向,社群大致區分為博物館、檔案館、圖書館、數位學習等,這些社群所發展出來的標準也相對重要,如檔案館社群所發展出的EAD,數位學習社群的LOM等。同樣地,國內數位典藏的發展也遵循此模式,更進一步,我國數位典藏國家型科技計畫採用DC與OAI作為跨社群間資料交換的機制,建立收藏量豐富的聯合目錄(2007/11/01查詢已有300多萬筆數位化媒材)。基於跨領域間標準在我國數位典藏領域實際應用之需求,本計畫依DC、OAI分別研擬完成國家標準「都柏林核心集」「開放典藏推動之詮釋資料擷取協定」兩份草案。後續則建議於數位典藏領域國家標準之研擬上可以依各社群間所發展之標準,視國內各社群間之需求依序進行。
參考書目
1. AAP (2000). Digital Rights Management for eBooks: Publisher Requirements. Version 1.0. Association of American Publishers: http://publishers.org/digital/drm.pdf
2. Advanced Distributed Learning (ADL):http://www.adlnet.org
3. Bormans, J., Grant, K. (2002). MPEG-21 Use Case Scenario Document: http://www.chiariglione.org/mpeg/working_documents.htm#MPEG-A
4. Content ID Forum (2003). cIDf Specification 2.0: http://www.ee.nthu.edu.tw/whhsu/Biometric/20050401/CIDFSPECV2E
5. Cope, B., Freeman, R. (2001). Digital Rights Management and Content Development. Common Ground Publishing : Australia.
6. CORDRA:http://cordra.net/
7. DCMI:http://dublincore.org/
8. Dublin Core Metadata Initiative:http://dublincore.org/index.shtml
9. eNews Initiative:http://www.ifra.com/website/website.nsf/html/CONT_ENEWS?OpenDocument&ENW&E&
10. Gill, T., Gilliland-Swetland, A.J. and Baca, M. (1998). Introduction to metadata: pathways to digital information. US: Getty Research Institute.
11. Hillmann, D. (2006). Using Dublin Core: http://dublincore.org/documents/2005/11/07/usageguide
12. Iannella, R. (2002). Open Digital Rights Language (ODRL):http://odrl.net/1.1/ODRL-11.pdf
13. IDPF:http://www.idpf.org/
14. IEEE:http://www.ieee.org/portal/site/iportals
15. IEEE LTSC:http://ieeeltsc.org/
16. IMS Global Consortium Inc:http://www.imsproject.org
17. International Council on Archives:http://www.ica.org/en/node/30000
18. Kahn, R., Wilensky, R. (1995). A Framework for Distributed Digital Object Services:http://www.cnri.reston.va.us/k-w.html
19. Lyon, G. E. (2002). Information technology: A Quick-Reference List of Organizations and Standards for Digital Rights Management. NIST Special Publication 500-241.
20. Open eBook Forum (2002). Open eBook™ Publication Structure 1.2 Recommended Specification: http://www.openebook.org/oebps/oebps1.2/download/oeb12-xhtml.htm
21. Paskin N. (2006). The DOI Handbook. from http://dx.doi.org/10.1000/186
22. Text Encoding Initiative Consortium (2002).The TEI Guidelines: http://www.tei-c.org/Guidelines2/index.html
23. The Getty. Data Standards and Guidelines: http://www.getty.edu/research/conducting_research/standards/
24. The Society of American Archivists:http://www.archivists.org/catalog/pubDetail.asp?objectID=1279
25. Visual Resources Association. Brief History of the VRA: http://www.vraweb.org/about/index.html
26. 陳和琴、歐陽慧,「圖書線上資訊交換標準(ONIX for Books)之探究」,教育資料與圖書館學41卷2期,民國92年12月,頁220。
27. 陳和琴、歐陽慧,「圖書線上資訊交換標準(ONIX for Books)之探究」,教育資料與圖書館學41卷2期,民國92年12月,頁221-222。
28. 陳和琴、歐陽慧,「圖書線上資訊交換標準(ONIX for Books)之探究」,教育資料與圖書館學41卷2期,民國92年12月,頁224。
29. 陳和琴、歐陽慧,「圖書線上資訊交換標準(ONIX for Books)之探究」,教育資料與圖書館學41卷2期,民國92年12月,頁228-229。
30. 陳映后(2004)。數位版權描述語言—ODRL、XrML、MPEG-21 REL之比較研究。國立臺灣師範大學圖書資訊學研究所,碩士論文。
31. 陳昭珍研究主持,行政院研究發展考核委員會編(2005)。政府數位出版資源管理之研究。台北市:研考會。
32. 陳昭珍研究主持(2007)。國立台中圖書館「建構國家數位公共圖書館委託研究計畫」期末報告。
33. 陳淑君(民94年)Metadata專論. 數位典藏國家型科技計畫教育訓練推廣分項94年度Metadata專業培訓課程(7月23日)。
34. 張嫻,蕭國華。網上文獻信息資源的描述、規範與檢索。圖書館理論與實踐, 2000(6)。
35. 數位典藏國家型科技計畫後設資料工作組:http://www.sinica.edu.tw/~metadata/standard/standard-frame.html
36. 數位典藏聯合目錄:http://catalog.ndap.org.tw/dacs5/System/Main.jsp
37. 數位學習網路科學園區:http://www.epark.org.tw
英中名詞對照表
參考資料
參與研發單位:中央研究院-計算中心-後設資料工作組、數位典藏技術研發計畫-後設資料工作組、國立臺灣師範大學-圖書資訊學研究所、財團法人資訊工業策進會-數位教育研究所
提供單位:數位典藏技術研發計畫-後設資料工作組
使用單位:經濟部標準檢驗局
說明:本報告係於2007年應經濟部標準檢驗局「規劃與建置數位內容與數位生活應用之技術標準環境計畫(案號:1D15960125-20)」委託進行研析。