檔案類後設資料導論與實務一:Metadata 與 EAD

出自 TELDAP
前往: 導覽搜尋

本段預期目標包括以下幾點:

▓ 建立對metadata 清晰與具體的概念

● Metadata 基本理論(包括:簡史、發展類型、方式、結構、功能、特徵等)

● 了解metadata 與數位典藏/學習的關係(包括:數位化、組織、內容管理、檢索、使用、數位智財權管理、永久保存等)

▓ 建立檔案類metadata 標準的初步概念


Metadata 的名詞界說

▓ Metadata:名詞創造於1969 年

▓ Meta-data:Metadata 的另一稱法

▓ Metadatabase:資料庫的資料庫

▓ Meta- :變化,在~之後,超越,在~之間

▓ Data:代表任何的資源

▓ 後設資料

▓ 詮釋資料

▓ 元資料(元數據)

共識?


Metadata 的定義探討

有關資料的資料(data about data)

Metadata標準,是為支援互通性的資料描述,所取得一致的準則Metadata standards are agreed-on criteria for describing data to support interoperability.

Example: July 3, 2003

3 Juillet 2003

2003-07-03

07-03-2003

03072003

▓ 描述資源屬性的資料(Data describes attributes of resources)

▓ 有關資料背景與關聯性、資料內涵以及資料控制等相關資訊( Information about the context of data and the content of data and the control of or over data)

卡片目錄的例子

卡片目錄的例子.jpg

▓ Metadata是有關一個數位典藏品的資料,通常由典藏品的創作者或提供者來建立,並將數位典藏品串聯或埋置於後設資料中。因此,metadata可以作為資訊儲存與檢索系統很有用的基礎。(ALA, 美國圖書館學會)

▓ 它最簡單的定義是「有關資料的結構性資料」。(DC, 都柏林核心集)

▓ 任何協助辨識、描述與放置網路化電子資源的資料。目前存在許多不同的metadata格式,有些在描述上很簡單,有些則相當複雜而豐富。(IFLA, 國際圖書館協會)

▓ 記載資料元素或屬性(如:名稱、大小、資料類型等)的資料、有關紀錄或資料結構(如:長度、欄位、行列等),以及有關資料的資料(如:位置、關聯、擁有者等)

▓ metadata就是資料(Metadata is data)

▓ …超過30種的定義


Metadata 的面貌探討

不同社群的習慣稱呼

▓ 電腦界:資料字典(Data Dictionary)

▓ 圖書館界:圖書館目錄(Library Catalogue)

▓ 博物館界:記錄、登錄、資料標準(Documentation, Register, Data Standard)

▓ 檔案館界:檢索工具(Finding Aids)

▓ ...

一個簡例

一個簡例.jpg


Metadata 的應用範圍

▓ 編目(cataloging)

  • Item Level: 個別性資源,如:文件、圖檔、錄音帶...
  • Collection Level: 合集性資源,如:網站,資料庫...
  • 如何呈現二者關聯性?

- 內容目次-章-圖表

- 網站地圖-網頁

▓ 資源探索(Resource Discovery)

  • 使搜索引擎更了解資源的內容
  • 達成更精確的查尋結果
  • 達成更自動的查尋效果

▓ 電子商務(E-Commerce)

電子商務每一階段所需的資訊,可藉由metadata機制管理與達成任務.並管理快速變化之工商規則之複雜性

例:找到賣/買者&產品(檢索工商名錄)

例:商定銷售條件(價格,付款條件,合約資訊)

例:交易(傳遞機制,日期,期間/限)

▓ 內容分級(Content Rating)

  • 使用者可以選擇想看到的內容種類
  • 兒童保護
  • PICS(Platform for Internet Content Selection)

▓ 智財權(Intellectual Property Rights)

文件使用與傳佈權的合約期限

▓ 私隱政策(Privacy Preferences & Policies)

  • 不同的metadata格式支援不同的目的需求描述使用者公開個人資訊的意願
  • 描述使用者公開個人資訊的意願
  • 描述網站管理者收集訪站者資訊的意願

Metadata 的作用

▓ 不同的metadata格式支援不同的目的需求

  • 簡單 vs. 豐富
  • 一般性 vs. 特定性

▓ 數位典藏品的擁有者、管理者 與提供者 希望metadata能夠協助他們

  • 建置數位資源控制的機制
  • 管理數位資源
  • 數位資源使用與檢索

▓ 數位典藏品的終端使用者希望借助後設資料協助他們

  • 找尋
  • 辨識
  • 選擇
  • 獲取使用
  • 詮釋

這些數位資源。

數位典藏/圖書館metadata 需求與屬性

需求與屬性.jpg


Metadata 與數位典藏的關係

數位典藏面臨的環境與議題

▓ 如何找到龐大的數位典藏品?(Discovery)

▓ 如何確保數位典藏品的長久保存與取得?(Longevity)

▓ 如何讓數位典藏品達到互通與共享?(Interoperability)

Metadata 是支援上述問題的一種方法

▓ 一項內涵結構化的標準與技術

▓ 傳統的內涵資訊把文本(data/content)與呈現程序(presentation/procedure)融合一起

▓ 在數位典藏中,若將兩者分開處理:

▓ 對內涵進行結構化分析與描述、發展

▓ 多樣化的呈現樣式

▓ 如此,我們的數位典藏品將可視使用者的需求與目的,以多元化的方式重新組合、呈現、 再使用(reuse)與轉換(transformation),及有效的知識組織與檢索(access)


Metadata 與標準的關係

你知道衣服的尺寸嗎?

- 相同的尺寸:

38 丹麥,荷蘭,德國,法國(有時)

C38 挪威,瑞典,芬蘭

40 比利時,法國(有時)

44 義大利

44/46 葡萄牙,西班牙

12 英國

- 尚有:

…, S, M, L, XL, XXL, …

…, 39, 40, 41, …

…, 80B, 100C, …

Metadata 與標準的關係

Metadata 與標準的關係.jpg


Metadata 的類型-以功能為導向

▓ 描述性metadata

描述一項文件或資源的內涵與關聯性,以便發現與辨識資源.如:書目紀錄、Dublin Core。

▓ 結構性metadata

給予數位典藏品實質的結構,以便瀏覽、檢索與呈現上述資源.如:讓電子全文具翻頁功能、 全文與相關影像的適切連結、書的章節結構。

▓ 管理性metadata

為俾便長久管理、使用、觀看與保存數位化資源的相關資料.如:檔案格式、 數位化解析度、多媒體資訊壓縮、像素、尺寸、智財權管理資訊。


Metadata 的標準探討

一般性後設資料

▓ 特色:簡單,具延展性,跨學科,跨資料類型。

▓ 典型代表:都柏林核心集(Dublin Core),強調支援數位典藏品的資源探索(Resource Discovery)。

特定性後設資料

▓ 特色:著重特定領域資訊的共同需求與著錄標準。

▓ 典型代表

  • 圖書館社群:MARC
  • 博物館社群:CDWA,CIDOC
  • 檔案館社群:EAD
  • 政府社群:GILS
  • 視覺資源社群:VRA Core Categories
  • 植物標本館社群:HISPID, DarwinCore
  • 教育社群:IEEE LTSC LOM
  • 音樂社群:SMDL
  • 數據型資料:ICPSR Data Documentation Initiative
  • 文字型資料:TEI
  • 靜態影像:NISO Dictionary for Technical Metadata for Digital Still Images
  • 地理資料:CSDGM(FGDC)
  • 視聽媒體資料:MPEG-4, MPEG-7 for Audio and Video

都柏林核心集(Dublin Core)

都柏林核心集.jpg


檔案描述後設資料標準介紹:EAD(Encoded Archival Description)

一種編碼式檔案目錄指引(finding aids)的標準

▓ 發展目的:支援檔案與手稿的收集保存

▓ 方法:以機讀方式展現檔案描述,EAD 的標籤文件類型定義(Tag DTD)是根據SGML DTD而發展

▓ 結構:階層式的結構,以詳實呈現檔案和圖書館的目錄系統

▓ 助益:協助典藏在圖書館與檔案館的手稿與檔案資源,易於在網路上取得EAD 發展簡史

▓ 1993-1995:發展EAD前身—Berkeley Finding Aid Project(BFAP)

▓ 1995/7:更名為Encoded Archival Description(EAD)

▓ 1996/2-9:陸續完成alpha、beta 版的EAD DTD

▓ 1998/8:出版1.0 版本的EAD DTD、Tag Library

▓ 2001/2:出版EAD 應用指引(Application Guidelines for Version 1.0)

▓ 2003:出版EAD 2002 版(EAD DTD、Tag Library)

▓ 主要發展單位:柏克萊大學(1993)、美國檔案工作者學會(Society of American Archivists)(1995)、美國國會圖書館(Library of Congress)

EAD 結構

▓ 檔案描述編碼格式(Encoded Archival Description, EAD)

▓ 3大結構,146項基本元素

  • EAD標目<eadheader>:記錄查檢工具本身的書目性與描述性資料
  • 前面事項<frontmatter>:說明<檔案描述(archdesc)>之前的前言文字,主要敘述查檢工具的產生、出版與使用,而非描述資料的資訊。如:封面、前言、獻辭,及查檢工具的使用說明等
  • 檔案描述<archdesc>:記錄整個的EAD檔案的封包元素,包括描述檔案資料的內容、背景和範圍,以及有助資料使用的管理與補充資訊。

EAD 結構一覽

<ead>

<eadheader>EAD標目

<frontmatter>前面事項

<archdesc>檔案描述

EAD 結構一覽:EAD @ UC Berkeley

▓ American Heritage Project http://sunsite.berkeley.edu/amher/

▓ MOAC(美國加州數位博物館計畫) http://ark.cdlib.org/?relation=bampfa.berkeley.edu;type=archival+collection;xslt=moaccol;pageSize=50

▓ 哈佛大學檔案http://findingaids.harvard.edu/dfap/html/hua16002frames.html

參考資料

參與研發單位:中央研究院-計算中心-後設資料工作組

提供單位:中央研究院-計算中心-後設資料工作組

使用單位:臺灣省諮議會