後設資料專論:後設資料概論
目錄
界定Metadata
現存很多後設資料(Metadata)的各種定義,端視特定社群或使用情境而不同。
- 字義與抽象的定義:有關資料的資料(data about data)。
- 更明確的定義:有關資訊物件之結構的資訊(structured information about an information object)。
- 其他重要的定義:
- 圍繞資料物件的一大群附屬(間接)的資訊(A cloud of collateral information around a data object)。
- 描述資源屬性的資料(Data describes attributes of resources)。
- 有關資料背景與關聯性、資料內涵以及資料控制等相關資訊(Information about the context of data and the content of data and the control of or over data)。
- 任何協助辨識、描述與放置網路化電子資源的資料。目前存在許多不同的後設資料格式,有些在描述上很簡單,有些則相當複雜而豐富(IFLA, 國際圖書館協會)。
- 記載資料元素或屬性(如:名稱、大小、資料類型等)的資料、有關記錄或資料結構(如:長度、欄位、行列等),以及有關資料的資料(如:位置、關聯、擁有者等)。
- 當後設資料是以結構的層級方式編排時,可以稱為「知識本體」(Ontology)或綱要(schema)。
- 後設資料就是資料(Metadata is data)。
Metadata的面貌
電腦界:資料字典、綱要(Data Dictionary, Schema)
圖書館界:圖書館目錄(Library Catalogue)
博物館界:館藏記錄、登錄、資料標準(Documentation, Register, Data Standard)
檔案館界:檔案描述、檢索工具(Archival Description, Finding Aids)
Metadata的實例
圖書館卡片目錄
資料字典(data dictionary)
博物館登錄資料庫
檔案館登記表
XML Metadata
Metadata的類型
v 描述性:描述或識別資訊資源(如:編目記錄);
v 管理性:管理與控制資訊資源(如:採購資訊,版權與重複追蹤,合法取用需求的記載說明,數位化典藏品選擇準則,相似資訊物件的版本控制,文書系統產生的稽核痕跡);
v 技術性:有關系統功能或後設資料的運轉(如:軟硬體記載文件,數位化資訊, 如:格式與壓縮率,系統反應時間追蹤);
v 保存性:資訊資源的保存管理(如:實體與數位版本的保存方式記載,包括資料的更新與轉移);
v 使用性:用者或使用追蹤,展覽記錄,內容再使用;
v 分析性;
v 結構性;
v 智財權性。
Metadata的功能
v -資源探索;
v -資源描述:包括相關資源的識別、相似資源的組合、不同資源的區別;
v -資訊物件的檢索、保存與管理;
v -多個部件的連接,提供資源內部的結構;
v -追蹤智財權資訊,並指引或限制資源的使用方式;
v -促進互通;
v -數位識別;
v -長久保存。
DCMI工作小組
Borrowed from: David Bearman’s WGSAD Matrix (1989)
完整的Metadata結構之組成要件
v 語意;
v 內容規則;
v 控制詞彙;
v 語法。
Met adata的特質與屬性
v Metadata的來源
n 內部metadata,來自資訊物件的建立者在產生或數位化的當刻;
n 外部metadata,來自資訊物件產生之後,通常並非物件創造者所建立。
v Metadata的產生方法:
n 自動:關鍵字索引,用者使用檔;
n 人工。
v Metadata的本質:
n 一般性;
n 專門性。
v Metadata的狀態:
n 靜態-動態;
n 長期-短期。
Metadata的互通與交換
v Metadata對照
n 元素,語意,語法。
n 成功的對照與互通:
u 不同Metadata格式間的相似性;
u 不同Metadata格式的元素間之粒度性;
u 每一Metadata格式的元素之內容規則的相容性。
Metadata記錄的儲存方式
Metadata標準綜覽
標準的詳簡類型
一般性Metadata
特色:簡單,具延展性,跨學科,跨資料類型。
典型代表:都柏林核心集(Dublin Core),強調支援數位典藏品的資源探索(Resource Discovery)。
特定性Metadata
特色:著重特定領域資訊的共同需求與著錄標準。
典型代表:
-圖書館社群:MARC, MODS;
-博物館社群:CDWA, VRA, CIDOC;
-檔案館社群:EAD;
-政府社群:GILS;
-視覺資源社群:VRA Core Categories;
-植物標本館社群:HISPID, DarwinCore;
-教育社群:IEEE LOM;
-音樂社群:SMDL;
-出版業:ONIX;
-電子商務:INDECS, ONIX;
-數據型資料:ICPSR Data Documentation Initiative;
-文字型資料:TEI;
-靜態影像:NISO Dictionary for Technical Metadata for Digital Still Images;
-地理資料:CSDGM (FGDC);
-視聽媒體資料:MPEG-4, MPEG-7 for Audio and Video。
Metadata的方法學
參考資料
參與研發單位:技術研發分項計畫-後設資料工作組
提供單位:技術研發分項計畫-後設資料工作組
使用單位:各主題計畫