後設資料內涵分析報告:以中研院傅斯年圖書館善本計畫為例
前言
本報告為分析傅斯年圖書館善本圖書著錄時不同標準之適用性,將採用『解學士文集 十卷』為例子,分別套用『MARC21』及『EAD』兩套標準,提出其建檔、呈現及工作流程上的差異,並依據主題計畫目前的現狀與未來目的以及資源評估何者較為適用。
報告中將先就『解學士文集 十卷』的資料架構進行結構分析,進而分別就『MARC21』、『EAD』兩套標準,提出其建檔方式及呈現畫面之差異,而套用標準的方式又分成『MARC』、『EAD』、『MARC+EAD』,同時並提出分析說明與建議。
個案資料架構
『解學士文集 十卷』
標準套用分析
在標準套用範例中將提出『MARC』、『EAD』、『MARC+EAD』這三種套用 方式,分別提出其資料建檔、呈現畫面及工作流程的分析介紹。
資料建檔
以下就資料架構分析之後,分別提出「MARC」、「EAD」、「MARC+EAD」 建檔所需欄位以供對照:
(1)「MARC」
(2)「EAD」
(3)「MARC+EAD」
- 此為原MARC 編目資料,但需加註856 段,以連結至EAD finding aid。原來的505段保留與否,則視館內政策決定,這部分可以經由EAD finding aid 的撰寫呈現。
呈現畫面
在呈現方面則是由各單位設計呈現方式,再經由語法設計及系統作業產生,若不論其美編設計,建檔之後的呈現方式大抵如下:
(1)「MARC」
(2)「EAD」
(3)「MARC+EAD」
- 在呈現部分,若有「作者姓名」可連結至人名權威檔; 「主題」可各自連結至相關主題的查詢結果畫面; 「詳細資訊」為856 段,可連結至設計好的html; 「EAD SGML 格式」為856 段,可連結至sgml。
工作流程
(1)「MARC」
(2)「EAD」
(3)「MARC+EAD」
標準適用性分析
分析與建議
數位典藏之主要目的,除了保護珍貴資料避免再度受到人為破壞之外,此外,展現資料之全貌,促進資料之研究價值,提高資料之使用量,也是其重要目 標之一。因此依據上述適用性之比較評估,最適用的為「MARC+EAD」,因為 如此不但可以較簡潔的方式呈現,也可使研究人員窺其全貌,未來在國際交換機> 制中,也可以輕易的與他人做交換,此外,MARC 亦是傅斯年圖書館原本採用 的著錄方式;但如此一來必定耗費更多人力及時間,故若傅圖希望採用此方法, 可先行評估其人力及時間,在兩者皆許可的條件下,本工作組建議採用此種著錄 格式。
而依據主題計畫目前的現狀,若確定採用此種方法,單純延續目前的工作進度看來,主要的工作項目可為:
- 完成目前metadata 的建置;
- 檢視原有資料庫與目前metadata 欄位的對應結果;
- 建置資料庫並轉入原有資料;
- 依metadata 欄位輸入及更新資料;
- 檢視目前metadata 與EAD 和MARC 的對應結果(mapping);
- 撰寫SGML 文件(除了原來metadata 欄位外,尚需包含其他相關資料以及排版的部分);
- 轉出原建置於資料庫的資料,並將SGML 文件轉換成HTML。
在這些工作項目中,還需評估一些必要的資源需求,如:
- 人力:需評估是否應增加工作人員;此外,工作人員(無論編目或是系統人員)需大致了解EAD 以及SGML 的應用。
- 設備:需評估原來的軟硬體是否符合需求;若不符,是否添購軟硬體? 要購置哪些?
- 經費:需評估總預算以及可能增加的人事費、設備費、材料費等。
此外,因選用EAD 需付出一定的人力與時間,加上傅圖的善本資料為數龐 大,因此建議評估過後若確定採用EAD,可採循序漸進的方式進行,先選定幾 項資料進行,以下提供幾個要點作為參考:
- 檢視目前最完整的資料為何(如同一作者的著作);
- 檢視目前最常被使用的資料為何;
- 檢視最重要的館藏為何;
在選定預先做成EAD 的資料之後,即可開始進行相關工作,不過此部分的工作不只是需要傅斯年圖書館相關工作人員的努力,亦需要MAAT 以及相關系統人員共同的研析。
而在評估是否採用EAD 時,本工作組提供EAD Application Guidelines Appendix D:Implementation Checklist 之中譯作為參考,見附件。
EAD Application Guidelines for Version 1.0
附錄D:應用核對清單(Implementation Checklist)
多數存藏所在應用EAD 時,都需面對多種階段過程:
‧ 轉換舊的查檢工具
‧ 產生新的查檢工具
‧ 在網路上公佈查檢工具
在第二章、第四章、第五章詳細的說明每一階段的挑戰及可利用方法。以下的確認清單可協助存藏所運用EAD 功能為架構時應思考的問題。
1. 評估查檢工具在目前檢索或參考服務環境下所扮演的角色。
a. 目前查檢工具如何被使用?
‧ 使用群為何?
‧ 被使用的為哪些範圍的項目(circumstances)?
‧ 這些被使用的項目,那些反映出最高層次的使用?
‧ 在查檢工具中,哪些資料類型最常被搜尋?
‧ 哪些疑問能使用查檢工具有效地解決?哪些不能?
‧ 線上的查檢工具能維持目前有效的檢索效能,並可能應付那些查檢工具尚未能有效滿足的部分?
‧ 線上查檢工具,能否為存藏所產生新的資料使用群?
b. 目前查檢工具的狀態?
‧ 目前查檢工具的實體格式(physical format)為何?
‧ 查檢工具的完整程度?對資訊的正確度有多少把握?
‧ 查檢工具的結構成分及其所包含的資料的一致性程度?這些成分標示的清楚度?
‧ 建構查檢工具所遵循的指引?
‧ 希望有多少查檢工具可直接或最後可轉換為EAD?呈現多少頁的文字資料?
‧ 目前新產生的查檢工具所佔比例?
c. 目前存藏所是否有產生MARC 格式記錄,若有,則這些記錄格式和你的查檢工具的關係?
2. 如何處理轉換現行的查檢工具?
a. 現行查檢工具轉換的優先順序
‧ 最重要的館藏
‧ 最常使用的館藏(與最少使用的館藏輪流交替)
‧ 最容易轉換的查檢工具(需要最少的massaging)
‧ 若為網路上利用,最能有效被利用的查檢工具
‧ 分享多個存藏所的館藏,產生虛擬的查檢工具
‧ 網路上可利用的電子資料的館藏集合
b. 採用的轉換方式
‧ 機構內部轉換
‧ 委托代理商
‧ 參與提供轉換服務的合作計畫
3. 希望提供什麼方法讓使用者搜尋查檢工具?
a. 連結網站上的線上目錄
b. 藉由網站爬蟲(Web crawler)如Alta Vista 或Yahoo 搜尋網際網路
c. 直接進入機構網站瀏覽查檢工具
d. 在自身網站上使用搜尋引擎(search engine)
4. 產生EAD 編碼的查檢工具及在網路上公佈時,所需的資源
a. 人力需求配置
b. 需求人員的教育訓練
c. 所需的專業技術為何?若無法從存藏所內獲得,是否可從館內其他單位獲得? 或能否加入已應用SGML/XML 的聯合團體?是否能加入已發展的體系或分享資源和專業技術?
d. 需要那些專業文件及需要多少分?
‧ EAD DTD files 或特定應用軟體的DTD 版本(如.rls file for uthor/Editor, .lgc file for WordPerfect)
‧ EAD Tag Library
‧ EAD Application Guidelines
‧ 採聯盟方式進行時,所需的編碼指引(Encoding guideline)
e. 需要展的個別環境(Local convention)
‧ 查檢工具所遵循的標準格式(standard format)
‧ 著錄至各元素的標準規範
‧ 控制展現查檢工具的樣式表(stylesheet)
‧ 非標準權威來源所包含的檢索詞彙的權威形式
f. 產生或公佈新的查檢工具所需的軟體(並非每一查檢工具需完全採用以下工具)
‧ SGML/XML authoring package
‧ 具編輯SGML/XML 功能或具有轉換附加程式的文書處理軟體
‧ Database
‧ 轉換SGML 為 HTML 轉換軟體或HTML 編輯工具(authoring tool)
‧ 轉換工具如perl scripts、macros
‧ SGML/XML parser
‧ SGML/XML browser
‧ 樣式表編輯軟體(Stylesheet authoring software )
‧ 搜尋引擎(Search engine)
g. 產生或公佈新的查檢工具所需的硬體
‧ 電腦工作站(Computer workstation )
‧ 內部網路聯結(Local network connection )
‧ 網際網路聯結(Internet connection)
‧ 備份裝置(backup mechanism )
‧ 伺服器(Server)
‧ 印表機(Printer)
h. 如何掌握品質控制?
i. 如何維持及更新查檢工具?
j. 如何管理伺服器的運作及維修?
5. 分析每一過程需要的成本。
a. 那些費用是目前預算中有列項的?
b. 那些為新的支出費用?是一時的或會持續?
c. 那些費用是會隨時間而逐漸減少或增加?
d. 那些費用可從外部基金獲得?如補助金。
e. 是否有潛藏需進一步細查的費用?
f. 是否會因完成EAD 應用,而節省某些部分費用?
參考資料
參與研發單位:中央研究院-計算中心-後設資料工作組
使用單位:中央研究院-史語所-傅斯年圖書館
提供單位:中央研究院計算中心-後設資料工作組










