後設資料內涵分析報告:以中研院傅斯年圖書館善本計畫為例

出自 TELDAP
於 2010年1月12日 (二) 07:01 由 Tulip0409 (對話) 所做的修訂

前往: 導覽搜尋

前言

本報告為分析傅斯年圖書館善本圖書著錄時不同標準之適用性,將採用『解學士文集 十卷』為例子,分別套用『MARC21』及『EAD』兩套標準,提出其建檔、呈現及工作流程上的差異,並依據主題計畫目前的現狀與未來目的以及資源評估何者較為適用。

報告中將先就『解學士文集 十卷』的資料架構進行結構分析,進而分別就『MARC21』、『EAD』兩套標準,提出其建檔方式及呈現畫面之差異,而套用標準的方式又分成『MARC』、『EAD』、『MARC+EAD』,同時並提出分析說明與建議。


個案資料架構

『解學士文集 十卷』

解學士文集 十卷0.gif
解學士文集 十卷1.gif


標準套用分析

在標準套用範例中將提出『MARC』、『EAD』、『MARC+EAD』這三種套用 方式,分別提出其資料建檔、呈現畫面及工作流程的分析介紹。


資料建檔

以下就資料架構分析之後,分別提出「MARC」、「EAD」、「MARC+EAD」 建檔所需欄位以供對照:

(1)「MARC」

MARC.gif

(2)「EAD」

EAD.gif

(3)「MARC+EAD」

MARC+EAD.gif
  • 此為原MARC 編目資料,但需加註856 段,以連結至EAD finding aid。原來的505段保留與否,則視館內政策決定,這部分可以經由EAD finding aid 的撰寫呈現。


呈現畫面

在呈現方面則是由各單位設計呈現方式,再經由語法設計及系統作業產生,若不論其美編設計,建檔之後的呈現方式大抵如下:

(1)「MARC」

「EAD」.gif

(2)「EAD」

「MARC」.gif

(3)「MARC+EAD」

「MARC+EAD」.gif
  • 在呈現部分,若有「作者姓名」可連結至人名權威檔; 「主題」可各自連結至相關主題的查詢結果畫面; 「詳細資訊」為856 段,可連結至設計好的html; 「EAD SGML 格式」為856 段,可連結至sgml。


工作流程

(1)「MARC」

工作流程0.gif

(2)「EAD」

工作流程1.gif

(3)「MARC+EAD」

工作流程2.gif


標準適用性分析

標準適用性分析.jpg


分析與建議

數位典藏之主要目的,除了保護珍貴資料避免再度受到人為破壞之外,此外,展現資料之全貌,促進資料之研究價值,提高資料之使用量,也是其重要目 標之一。因此依據上述適用性之比較評估,最適用的為「MARC+EAD」,因為 如此不但可以較簡潔的方式呈現,也可使研究人員窺其全貌,未來在國際交換機> 制中,也可以輕易的與他人做交換,此外,MARC 亦是傅斯年圖書館原本採用 的著錄方式;但如此一來必定耗費更多人力及時間,故若傅圖希望採用此方法, 可先行評估其人力及時間,在兩者皆許可的條件下,本工作組建議採用此種著錄 格式。

而依據主題計畫目前的現狀,若確定採用此種方法,單純延續目前的工作進度看來,主要的工作項目可為:

  1. 完成目前metadata 的建置;
  2. 檢視原有資料庫與目前metadata 欄位的對應結果;
  3. 建置資料庫並轉入原有資料;
  4. 依metadata 欄位輸入及更新資料;
  5. 檢視目前metadata 與EAD 和MARC 的對應結果(mapping);
  6. 撰寫SGML 文件(除了原來metadata 欄位外,尚需包含其他相關資料以及排版的部分);
  7. 轉出原建置於資料庫的資料,並將SGML 文件轉換成HTML。

在這些工作項目中,還需評估一些必要的資源需求,如:

  1. 人力:需評估是否應增加工作人員;此外,工作人員(無論編目或是系統人員)需大致了解EAD 以及SGML 的應用。
  2. 設備:需評估原來的軟硬體是否符合需求;若不符,是否添購軟硬體? 要購置哪些?
  3. 經費:需評估總預算以及可能增加的人事費、設備費、材料費等。

此外,因選用EAD 需付出一定的人力與時間,加上傅圖的善本資料為數龐 大,因此建議評估過後若確定採用EAD,可採循序漸進的方式進行,先選定幾 項資料進行,以下提供幾個要點作為參考:

  1. 檢視目前最完整的資料為何(如同一作者的著作);
  2. 檢視目前最常被使用的資料為何;
  3. 檢視最重要的館藏為何;

在選定預先做成EAD 的資料之後,即可開始進行相關工作,不過此部分的工作不只是需要傅斯年圖書館相關工作人員的努力,亦需要MAAT 以及相關系統人員共同的研析。

而在評估是否採用EAD 時,本工作組提供EAD Application Guidelines Appendix D:Implementation Checklist 之中譯作為參考,見附件。


EAD Application Guidelines for Version 1.0

附錄D:應用核對清單(Implementation Checklist)

多數存藏所在應用EAD 時,都需面對多種階段過程:

‧ 轉換舊的查檢工具

‧ 產生新的查檢工具

‧ 在網路上公佈查檢工具

在第二章、第四章、第五章詳細的說明每一階段的挑戰及可利用方法。以下的確認清單可協助存藏所運用EAD 功能為架構時應思考的問題。

1. 評估查檢工具在目前檢索或參考服務環境下所扮演的角色。

a. 目前查檢工具如何被使用?

‧ 使用群為何?

‧ 被使用的為哪些範圍的項目(circumstances)?

‧ 這些被使用的項目,那些反映出最高層次的使用?

‧ 在查檢工具中,哪些資料類型最常被搜尋?

‧ 哪些疑問能使用查檢工具有效地解決?哪些不能?

‧ 線上的查檢工具能維持目前有效的檢索效能,並可能應付那些查檢工具尚未能有效滿足的部分?

‧ 線上查檢工具,能否為存藏所產生新的資料使用群?

b. 目前查檢工具的狀態?

‧ 目前查檢工具的實體格式(physical format)為何?

‧ 查檢工具的完整程度?對資訊的正確度有多少把握?

‧ 查檢工具的結構成分及其所包含的資料的一致性程度?這些成分標示的清楚度?

‧ 建構查檢工具所遵循的指引?

‧ 希望有多少查檢工具可直接或最後可轉換為EAD?呈現多少頁的文字資料?

‧ 目前新產生的查檢工具所佔比例?

c. 目前存藏所是否有產生MARC 格式記錄,若有,則這些記錄格式和你的查檢工具的關係?

2. 如何處理轉換現行的查檢工具?

a. 現行查檢工具轉換的優先順序

‧ 最重要的館藏

‧ 最常使用的館藏(與最少使用的館藏輪流交替)

‧ 最容易轉換的查檢工具(需要最少的massaging)

‧ 若為網路上利用,最能有效被利用的查檢工具

‧ 分享多個存藏所的館藏,產生虛擬的查檢工具

‧ 網路上可利用的電子資料的館藏集合

b. 採用的轉換方式

‧ 機構內部轉換

‧ 委托代理商

‧ 參與提供轉換服務的合作計畫

3. 希望提供什麼方法讓使用者搜尋查檢工具?

a. 連結網站上的線上目錄

b. 藉由網站爬蟲(Web crawler)如Alta Vista 或Yahoo 搜尋網際網路

c. 直接進入機構網站瀏覽查檢工具

d. 在自身網站上使用搜尋引擎(search engine)

4. 產生EAD 編碼的查檢工具及在網路上公佈時,所需的資源

a. 人力需求配置

b. 需求人員的教育訓練

c. 所需的專業技術為何?若無法從存藏所內獲得,是否可從館內其他單位獲得? 或能否加入已應用SGML/XML 的聯合團體?是否能加入已發展的體系或分享資源和專業技術?

d. 需要那些專業文件及需要多少分?

‧ EAD DTD files 或特定應用軟體的DTD 版本(如.rls file for uthor/Editor, .lgc file for WordPerfect)

‧ EAD Tag Library

‧ EAD Application Guidelines

‧ 採聯盟方式進行時,所需的編碼指引(Encoding guideline)

e. 需要展的個別環境(Local convention)

‧ 查檢工具所遵循的標準格式(standard format)

‧ 著錄至各元素的標準規範

‧ 控制展現查檢工具的樣式表(stylesheet)

‧ 非標準權威來源所包含的檢索詞彙的權威形式

f. 產生或公佈新的查檢工具所需的軟體(並非每一查檢工具需完全採用以下工具)

‧ SGML/XML authoring package

‧ 具編輯SGML/XML 功能或具有轉換附加程式的文書處理軟體

‧ Database

‧ 轉換SGML 為 HTML 轉換軟體或HTML 編輯工具(authoring tool)

‧ 轉換工具如perl scripts、macros

‧ SGML/XML parser

‧ SGML/XML browser

‧ 樣式表編輯軟體(Stylesheet authoring software )

‧ 搜尋引擎(Search engine)

g. 產生或公佈新的查檢工具所需的硬體

‧ 電腦工作站(Computer workstation )

‧ 內部網路聯結(Local network connection )

‧ 網際網路聯結(Internet connection)

‧ 備份裝置(backup mechanism )

‧ 伺服器(Server)

‧ 印表機(Printer)

h. 如何掌握品質控制?

i. 如何維持及更新查檢工具?

j. 如何管理伺服器的運作及維修?

5. 分析每一過程需要的成本。

a. 那些費用是目前預算中有列項的?

b. 那些為新的支出費用?是一時的或會持續?

c. 那些費用是會隨時間而逐漸減少或增加?

d. 那些費用可從外部基金獲得?如補助金。

e. 是否有潛藏需進一步細查的費用?

f. 是否會因完成EAD 應用,而節省某些部分費用?


參考資料

參與研發單位:中央研究院-計算中心-後設資料工作組

使用單位:中央研究院-史語所-傅斯年圖書館

提供單位:中央研究院計算中心-後設資料工作組