檔案類後設資料導論與實務一:Metadata 與 EAD
本段預期目標包括以下幾點:
▓ 建立對metadata 清晰與具體的概念
● Metadata 基本理論(包括:簡史、發展類型、方式、結構、功能、特徵等)
● 了解metadata 與數位典藏/學習的關係(包括:數位化、組織、內容管理、檢索、使用、數位智財權管理、永久保存等)
▓ 建立檔案類metadata 標準的初步概念
目錄
Metadata 的名詞界說
▓ Metadata:名詞創造於1969 年
▓ Meta-data:Metadata 的另一稱法
▓ Metadatabase:資料庫的資料庫
▓ Meta- :變化,在~之後,超越,在~之間
▓ Data:代表任何的資源
▓ 後設資料
▓ 詮釋資料
▓ 元資料(元數據)
共識?
Metadata 的定義探討
有關資料的資料(data about data)
Metadata標準,是為支援互通性的資料描述,所取得一致的準則Metadata standards are agreed-on criteria for describing data to support interoperability.
Example: July 3, 2003
3 Juillet 2003
2003-07-03
07-03-2003
03072003
▓ 描述資源屬性的資料(Data describes attributes of resources)
▓ 有關資料背景與關聯性、資料內涵以及資料控制等相關資訊( Information about the context of data and the content of data and the control of or over data)
卡片目錄的例子
▓ Metadata是有關一個數位典藏品的資料,通常由典藏品的創作者或提供者來建立,並將數位典藏品串聯或埋置於後設資料中。因此,metadata可以作為資訊儲存與檢索系統很有用的基礎。(ALA, 美國圖書館學會)
▓ 它最簡單的定義是「有關資料的結構性資料」。(DC, 都柏林核心集)
▓ 任何協助辨識、描述與放置網路化電子資源的資料。目前存在許多不同的metadata格式,有些在描述上很簡單,有些則相當複雜而豐富。(IFLA, 國際圖書館協會)
▓ 記載資料元素或屬性(如:名稱、大小、資料類型等)的資料、有關紀錄或資料結構(如:長度、欄位、行列等),以及有關資料的資料(如:位置、關聯、擁有者等)
▓ metadata就是資料(Metadata is data)
▓ …超過30種的定義
Metadata 的面貌探討
不同社群的習慣稱呼
▓ 電腦界:資料字典(Data Dictionary)
▓ 圖書館界:圖書館目錄(Library Catalogue)
▓ 博物館界:記錄、登錄、資料標準(Documentation, Register, Data Standard)
▓ 檔案館界:檢索工具(Finding Aids)
▓ ...
一個簡例
Metadata 的應用範圍
▓ 編目(cataloging)
- Item Level: 個別性資源,如:文件、圖檔、錄音帶...
- Collection Level: 合集性資源,如:網站,資料庫...
- 如何呈現二者關聯性?
- 內容目次-章-圖表
- 網站地圖-網頁
▓ 資源探索(Resource Discovery)
- 使搜索引擎更了解資源的內容
- 達成更精確的查尋結果
- 達成更自動的查尋效果
▓ 電子商務(E-Commerce)
電子商務每一階段所需的資訊,可藉由metadata機制管理與達成任務.並管理快速變化之工商規則之複雜性
例:找到賣/買者&產品(檢索工商名錄)
例:商定銷售條件(價格,付款條件,合約資訊)
例:交易(傳遞機制,日期,期間/限)
▓ 內容分級(Content Rating)
- 使用者可以選擇想看到的內容種類
- 兒童保護
- PICS(Platform for Internet Content Selection)
▓ 智財權(Intellectual Property Rights)
文件使用與傳佈權的合約期限
▓ 私隱政策(Privacy Preferences & Policies)
- 不同的metadata格式支援不同的目的需求描述使用者公開個人資訊的意願
- 描述使用者公開個人資訊的意願
- 描述網站管理者收集訪站者資訊的意願
Metadata 的作用
▓ 不同的metadata格式支援不同的目的需求
- 簡單 vs. 豐富
- 一般性 vs. 特定性
▓ 數位典藏品的擁有者、管理者 與提供者 希望metadata能夠協助他們
- 建置數位資源控制的機制
- 管理數位資源
- 數位資源使用與檢索
▓ 數位典藏品的終端使用者希望借助後設資料協助他們
- 找尋
- 辨識
- 選擇
- 獲取使用
- 詮釋
這些數位資源。
數位典藏/圖書館metadata 需求與屬性
Metadata 與數位典藏的關係
數位典藏面臨的環境與議題
▓ 如何找到龐大的數位典藏品?(Discovery)
▓ 如何確保數位典藏品的長久保存與取得?(Longevity)
▓ 如何讓數位典藏品達到互通與共享?(Interoperability)
Metadata 是支援上述問題的一種方法
▓ 一項內涵結構化的標準與技術
▓ 傳統的內涵資訊把文本(data/content)與呈現程序(presentation/procedure)融合一起
▓ 在數位典藏中,若將兩者分開處理:
▓ 對內涵進行結構化分析與描述、發展
▓ 多樣化的呈現樣式
▓ 如此,我們的數位典藏品將可視使用者的需求與目的,以多元化的方式重新組合、呈現、 再使用(reuse)與轉換(transformation),及有效的知識組織與檢索(access)
Metadata 與標準的關係
你知道衣服的尺寸嗎?
- 相同的尺寸:
38 丹麥,荷蘭,德國,法國(有時)
C38 挪威,瑞典,芬蘭
40 比利時,法國(有時)
44 義大利
44/46 葡萄牙,西班牙
12 英國
- 尚有:
…, S, M, L, XL, XXL, …
…, 39, 40, 41, …
…, 80B, 100C, …
Metadata 與標準的關係
Metadata 的類型-以功能為導向
▓ 描述性metadata
描述一項文件或資源的內涵與關聯性,以便發現與辨識資源.如:書目紀錄、Dublin Core。
▓ 結構性metadata
給予數位典藏品實質的結構,以便瀏覽、檢索與呈現上述資源.如:讓電子全文具翻頁功能、 全文與相關影像的適切連結、書的章節結構。
▓ 管理性metadata
為俾便長久管理、使用、觀看與保存數位化資源的相關資料.如:檔案格式、 數位化解析度、多媒體資訊壓縮、像素、尺寸、智財權管理資訊。
Metadata 的標準探討
一般性後設資料
▓ 特色:簡單,具延展性,跨學科,跨資料類型。
▓ 典型代表:都柏林核心集(Dublin Core),強調支援數位典藏品的資源探索(Resource Discovery)。
特定性後設資料
▓ 特色:著重特定領域資訊的共同需求與著錄標準。
▓ 典型代表
- 圖書館社群:MARC
- 博物館社群:CDWA,CIDOC
- 檔案館社群:EAD
- 政府社群:GILS
- 視覺資源社群:VRA Core Categories
- 植物標本館社群:HISPID, DarwinCore
- 教育社群:IEEE LTSC LOM
- 音樂社群:SMDL
- 數據型資料:ICPSR Data Documentation Initiative
- 文字型資料:TEI
- 靜態影像:NISO Dictionary for Technical Metadata for Digital Still Images
- 地理資料:CSDGM(FGDC)
- 視聽媒體資料:MPEG-4, MPEG-7 for Audio and Video
都柏林核心集(Dublin Core)
檔案描述後設資料標準介紹:EAD(Encoded Archival Description)
一種編碼式檔案目錄指引(finding aids)的標準
▓ 發展目的:支援檔案與手稿的收集保存
▓ 方法:以機讀方式展現檔案描述,EAD 的標籤文件類型定義(Tag DTD)是根據SGML DTD而發展
▓ 結構:階層式的結構,以詳實呈現檔案和圖書館的目錄系統
▓ 助益:協助典藏在圖書館與檔案館的手稿與檔案資源,易於在網路上取得EAD 發展簡史
▓ 1993-1995:發展EAD前身—Berkeley Finding Aid Project(BFAP)
▓ 1995/7:更名為Encoded Archival Description(EAD)
▓ 1996/2-9:陸續完成alpha、beta 版的EAD DTD
▓ 1998/8:出版1.0 版本的EAD DTD、Tag Library
▓ 2001/2:出版EAD 應用指引(Application Guidelines for Version 1.0)
▓ 2003:出版EAD 2002 版(EAD DTD、Tag Library)
▓ 主要發展單位:柏克萊大學(1993)、美國檔案工作者學會(Society of American Archivists)(1995)、美國國會圖書館(Library of Congress)
EAD 結構
▓ 檔案描述編碼格式(Encoded Archival Description, EAD)
▓ 3大結構,146項基本元素
- EAD標目<eadheader>:記錄查檢工具本身的書目性與描述性資料
- 前面事項<frontmatter>:說明<檔案描述(archdesc)>之前的前言文字,主要敘述查檢工具的產生、出版與使用,而非描述資料的資訊。如:封面、前言、獻辭,及查檢工具的使用說明等
- 檔案描述<archdesc>:記錄整個的EAD檔案的封包元素,包括描述檔案資料的內容、背景和範圍,以及有助資料使用的管理與補充資訊。
EAD 結構一覽
<ead>
<eadheader>EAD標目
<frontmatter>前面事項
<archdesc>檔案描述
EAD 結構一覽:EAD @ UC Berkeley
▓ American Heritage Project http://sunsite.berkeley.edu/amher/
▓ MOAC(美國加州數位博物館計畫) http://ark.cdlib.org/?relation=bampfa.berkeley.edu;type=archival+collection;xslt=moaccol;pageSize=50
▓ 哈佛大學檔案http://findingaids.harvard.edu/dfap/html/hua16002frames.html
參考資料
參與研發單位:中央研究院-計算中心-後設資料工作組
提供單位:中央研究院-計算中心-後設資料工作組
使用單位:臺灣省諮議會




