善本類:善本圖籍後設資料需求規格書(原 6-1-39 )

出自 TELDAP
前往: 導覽搜尋

計畫說明

  • 1.1 計畫簡介

中央研究院歷史語言研究所(以下簡稱史語所)自民國17年(1928)立所以來,即重視學術文獻的蒐集。歷經已故傅孟真(斯年)所長、胡適之(適)院長等的規劃,文獻耆宿張菊生(元濟)等先生的襄助,以及史語所同仁的努力經營下, 70年之間,蒐藏了舉世稱羨的漢學圖籍。

傅斯年圖書館(以下簡稱傅圖)重要典藏包括:A.善本圖籍45,644 冊,主要來源是(a)民國23年(1934)院方撥存購自南京鄧邦述氏「群碧樓」的藏書, 共四百三十餘種;(b)民國35年(1946)教育部移交接收自日本北平東方研究 所為編纂《續修四庫全書》所蒐之善本書,共1萬5千餘種,後經本所張政烺等人就該批藏書挑出本館未有或具史料價值的著作七百餘種運臺;(c)購自江安傅增湘 「藏園」的部份藏書;(d)民國57年(1968)洽購李宗侗(玄伯)散出之善本書百餘種。傅圖藏善本圖籍以罕見者居多,複本較少(如北宋刊南宋配補本的《史記》、烏絲欄鈔本的《三朝北盟會編》等)。主要為宋、元、明及清初刊本、稿本, 以及名人批校本、手鈔本、寫繪本等;B.吳式芬、劉體智、李宗侗等名家舊藏歷代 金石拓片約四萬幅(善拓552 號,拓片28,260 號),其中大多數的原器物已不傳世, 或已漫漶無法再椎拓,而館藏拓片品質優良,除了具有史料價值外,亦是十分珍貴的文化資產(另見項目二:金石拓片與其他媒材古文書);C.極具特色的俗文學資料11,900 冊,主要來源是(a)民國初年劉復(半農)先生擔任史語所「民間文藝組」 時,為研究民間文藝而徵集的曲本,有《中國俗曲總目稿》可參考。另史語所同仁就整理這批資料的初步成果,包括李家瑞撰《北平俗曲略》;(b)史語所遷臺以前於 各地蒐集之曲本,包括有抄自「車王府」的曲本等;(c)曾永義先生蒐集之臺灣歌 謠、曲本;(d)傅圖舊藏中析出之相關曲本等。這批資料依其內容及演出性質,可分為戲劇、說唱、雜曲、雜耍、徒歌、及雜著等六大類,論時間可上溯清乾隆間, 論地域則遍及全中國、臺灣地區,為研究我國民間文學,以及下層社會非常重要的素材;D.少數民族文書,如傅圖館藏彝族經典係早期尊師所有之本子,質量極佳。 晚近中國大陸因宗教信仰薄弱,西南邊區之祭典日趨簡化,祭文多所刪節,更顯珍貴(另見子計畫四:民族學調查標本、照片與檔案);以及E.類善本書4,273 冊, 古籍線裝書144,712 冊,主要為清代及民國初年刊本,以史部、集部居多。其中地 方志836種8,746 冊、日本刊本二百七十餘種一千五百餘冊、韓國刊本70種三百四十餘冊,都是國際漢學界十分重視且經常研用的學術文獻。

民國77年(1988),傅圖為使善本圖籍有妥善的保存環境,以及提供讀者更方便、更迅速的檢索,評量當時電腦科技的發展、文獻複製技術以及儲存媒體的現況,認為「典藏數位化」是文獻保存與傳遞最優勢的方法,也是未來必然之趨勢, 於是毅然決然地在台灣地區最早以影像數位化方式來保存學術文獻,並採用當時最先進的「王安整合影像資訊系統(Wang Integrated Image System,簡稱 WIIS)」,以光碟媒體儲存館藏善本圖籍的影像檔(規格:B & W/200 dpi),避免紙本圖籍因經常性的使用而損毀,同時也以改善典藏環境、引進維護的新技術來延長珍貴文獻的壽命。迄民國85年(1996)止,善本圖籍已掃描成影像檔有51萬頁,並於十月間傅圖「善本書全文影像系統」正式建構在史語所Novell 網路上,提供讀者檢用。此後,因王安公司不再支援WIIS 系統,同時,傅圖為因應當前資訊科技的 發展、系統整合的需求等,改採「漢珍TTS 影像系統」(規格:B & W/300 dpi)。 截至民國88年(1999)11月止,總計完成黑白影像檔126萬頁,尚未完成者約150萬頁。民國89年為配合國家數位典藏計畫,原件掃描乃改以 全彩數位化(300dpi)影像儲存,希望藉此機會參酌國科會數位博物館專案計畫訂立之規範,並與合作館共同研議最優化的規格與標準,一體施用,以期建置高品質的數位典藏資料庫,於民國89年底「善本書光碟影像計畫」總計已存有善本古 籍1,430 種,12,980 冊,收錄影像全文913,220 頁(B&W);俗文學材料11,781 冊, 收錄影像全文264,561 頁(B&W)。民國88(1999)年二月,在史語所網頁中 http://www.ihp.sinica.edu.tw/ 建置的「傅斯年圖書館善本書全文資料庫」為傅圖善本圖籍改為Web 版之試用版;民國88(1999)年十月,於傅圖網頁上再建置「傅斯年圖書館善本書全文資料庫」(目前網址 http://www.ihp.sinica.edu.tw/ttsweb/fsn/opac.htm) ,各界人士可以透過網際網路 (Internet)檢索已數位化的善本圖籍書目性資料,經申請許可後,可閱覽全文影像資料及列印所需之資料。民國89年十二月,於傅圖網頁又增建「傅斯年圖書館珍藏善本圖籍書目資料庫」,包含了館藏善本書、古籍線裝書、金石拓本、俗文學等書目資料,讀者可上線主題檢索或跨資料庫檢索傅圖珍藏資料,民國九十一年 已將上述善本古籍相關資料庫整合於一檢索網頁 http://www.ihp.sinica.edu.tw/ttsweb/fsn/opac.htm ,可直接經由該網頁點選所需檢索 的資料庫,未來待開放機制建立後,亦會納入相關申請須知及程序,以提供檢索利用。另本館早期使用INNOPAC 自動化系統,以發展圖書館各項業務,所有珍藏古籍文獻皆可利用 http://www.sinica.edu.tw 於中央研究院Home Page 點選『圖書館服務』,或利用遠程載入telnet 140.109.4.14(las.sinica.edu.tw)連線中央研究院圖書館 線上公用目錄檢索書目資料,目前仍保持續更新。

  • 1.2 計畫預期目標

本計畫目的在於使善本圖籍有妥善的保存環境,以及提供讀者更方便、更迅速的檢索,除了與其他合作館共同建構相關主題的數位典藏外,並針對本所典藏的特色以及幾個近現代研究較為重要的主題,分別規劃擬數位化的清單,以利主題性、 集結性的完整呈現。目前本計畫第一階段主要進程「明版明人詩文集」、「古籍附圖數位典藏」等為共同主題進行研發;第二階段將針對傅圖珍藏與醫學、考古、金石等研究主題相關的古籍進行數位化工作。本計畫另一重點是在選定擬數位典藏的主題以及進行文獻的分析與整理之後,建構一套「掃校流程的品質管制」、「影像與後設資料資料庫」、「流通與安全管理機制」等整合性的自動化系統。

傅圖在善本圖籍數位化工作已行之有年,也獲得相當的經驗與成果,於今電腦及通訊(網路)科技日新月異,「資訊共享」以及「全球村」也隱然成為人類普遍的共同願望,更促使傅圖有重新評估如何提昇數位典藏的質量,豐富資料庫的內容,加強資料管理與檢索的效能,強化與世界其他數位資料的互通性,以及向漢學界及社會大眾提供寶貴的文化資產的必要性,當然,有待努力也是多方面的。

傅圖為配合「國家典藏數位化計畫」,與國家圖書館、國立故宮博物院、臺灣大學圖書館、臺灣省文獻會等單位合作執行,同時也考慮與國外重要漢學研究及收藏單位合作,希望以既有的數位化經驗為基礎,共同發展並建置專題數位典藏資料庫。

  • 1.3 計畫參與人員

v 中研院史語所傅斯年圖書館:陳弱水先生、柳立言先生、吳政上先生、湯蔓媛小姐、林妙樺小姐、呂純怡小姐、階宗芳小姐、郭紋秀小姐

v 中研院後設資料工作組:陳亞寧、陳淑君、張怡婷、林靖恩、傅怡婷、沈漢聰(需求規格書撰寫)

後設資料需求規格書範圍與進度限制

本份後設需求規格書依據主題計畫92年3月20日回傳之「史語所傅斯年圖書館藏善本圖籍後設資料需求規格書version 0.5」修改完成。


系統目標與系統範圍

  • 3.1 系統目標
  1. 數位典藏著錄格式(metadata)的標準化

目前傅圖館藏善本圖籍的書目性資料,除了在本院INNOPAC 圖書館自動化系統依循國際及國家書目著錄規範為標準,建置圖書館書目資料庫外,並為配合影像檔另建有相應之「全文影像系統書目資料庫」,著錄項目包括書名項、著者項、 版本項、稽核項、附註項以及主題項等。本格式係依據現行著錄規範、影像檔的特性、文獻內涵分析、記錄與記錄之間的關連性、以及研究需要等而加以訂定, 與其他數位資料庫的描述方式及欄位未必全然相同。為利於將來國內外各學術數位典藏機構進行資訊交換之便,傅圖希望藉此機會參酌國科會數位博物館專案計畫訂立之規範、本院後設資料(metadata)工作小組之研究,研擬一套標準且適用的文獻著錄格式。

  1. 與其他相關metadata 資料庫連結

善本圖籍數位典藏系統應可依需求連結本館建製之其他關連資料庫,目前已初步規劃完成印記資料庫、人名權威檔等系統規格書之初稿,其次再建立「主題」等相關權威檔,透過關聯性整合各項建製資源,以方便學者及社會大眾更快速便捷地利用館藏資源。


  • 3.2 系統範圍
  1. 使用範圍

傅圖希望以既有的數位化經驗為基礎,發展並建置專題數位典藏資料庫,可透過不同欄位之設計,串連相關之典藏系統,以滿足各種不同使用對象的資訊需求。

  1. 使用對象

使用對象可分為三個層次,由繁至簡依序為研究層級、教育層級、公眾層級。研究層級所提供之內容為最完整之系統欄位,由使用者個人選擇所需資源;教育層級則依其學校課程彈性萃取所需教材資源;公眾層級則提供一般大眾對善本圖籍之基本認識及圖像。

著錄架構與著錄範例

6142.4. 著錄架構與著錄範例.jpg
6142.4. 著錄架構與著錄範例2.jpg
6142.4. 著錄架構與著錄範例3.jpg
6142.4. 著錄架構與著錄範例4.jpg
6142.4. 著錄架構與著錄範例5.jpg
6142.4. 著錄架構與著錄範例6.jpg
6142.4. 著錄架構與著錄範例7.jpg

需求欄位建置表

本需求欄位建置表主要是把主題計畫所提出的需求欄位經系統化、架構化與後設資料標準化之後,並列成表單供系統開發人員建置資料庫時設定欄位所用,同時也供程式設計人員在撰寫程式時參考使用。需求欄位建置表之各項說明如下:

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 英文名稱:項目名稱對應之英文名稱。

v 資料型態:著錄資料之資料型態。包括:

n Int 存放有效的整數型態的資料。

n Varchar、Text 存放純文字型態的資料。

v 大小:欄位所需之空間,以byte 為單位。一個英文字元或一個阿拉伯數字需用一個byte 表示,而一個中文字元則需兩個byte 表示。

6142.5. 需求欄位建置表.gif
6142.5. 需求欄位建置表2.jpg
6142.5. 需求欄位建置表3.jpg
6142.5. 需求欄位建置表4.jpg

需求欄位屬性表

需求欄位屬性表主要是把主題計畫之需求欄位的屬性彙集整理,並列成表單供系統建置人員參考使用.需求欄位屬性表之各項說明如下:

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 必填:標示「*」者表示為必填欄位,建檔時需填寫該欄位之值,不能空白。

v 多值:標示「◎」者表示為多值欄位,該組欄位資料可重複著錄。

v 屬性:標示該欄位的屬性,包括:

n 「唯一」表示欄位的值在資料庫中是唯一存在的。

n 「遞增」表示系統設定成每新增一筆紀錄則其值加一。

n 「不開放」表示該欄位只供管理者使用,不對外開放。

n 「下拉式選單」表示著錄方式為下拉式的選單。

n 「下拉式選單與自行填寫」表示此欄位同時需下拉式選單與自行填寫兩種著錄格式。

n 「二維下拉式選單」表示此欄位需呈現兩個層次的著錄格式。

n 「預設值」表示由系統先預設一個值,著錄人員在著錄時可變更此值。

n 「固定值」表示由系統產生一個固定值,且著錄人員無法變更此值。

n 「系統自動產生」表示該欄位的值是由系統自動產生,非由著錄人員著錄。

n 「link」表示該欄位需連結外部資料庫。

v 提供者:記錄這筆資料是由系統自動產生或由填表人所填入。

6142.6. 需求欄位屬性表.gif
6142.6. 需求欄位屬性表2.jpg
6142.6. 需求欄位屬性表3.jpg
6142.6. 需求欄位屬性表4.jpg

代碼表

6142.7. 代碼表.jpg

後設資料標準對照表

後設資料標準比對是作為本計畫後設資料欄位與國際後設資料的接軌,以及與國際間其他主題計畫作XML 資料交換的關鍵機制。以下係傅圖善本元素後設資料欄位與Dublin Core、MARC 21、CMARC 的比對:

6142.8. 後設資料標準對照表.jpg
6142.8. 後設資料標準對照表2.jpg
6142.8. 後設資料標準對照表3.jpg
6142.8. 後設資料標準對照表4.gif
6142.8. 後設資料標準對照表5.jpg
6142.8. 後設資料標準對照表6.jpg
6142.8. 後設資料標準對照表7.jpg
6142.8. 後設資料標準對照表8.jpg

查詢功能需求

傅圖善本典藏數位化計畫之查詢功能分為關鍵字查詢與進階查詢兩種。關鍵字查詢係指系統會對下表單之關鍵字查詢欄位中所有標示 「△」之欄位做查詢,檢索欄位資料是否符合使用者鍵入的關鍵字。而進階查詢則可以對下表單之進階查詢欄位中表示「○」的個別欄位做獨立查詢。在關鍵字查詢方面,使用者可以對下表單中之關鍵字查詢欄位(有 △ 者)做出關鍵字查詢,若有符合之結果,則依照檢索簡要 顯示款目欄位(有 ▲ 者)顯示列表回應給使用者。在進階查詢方面,院內使用者也可 以對下表單中之進階查詢欄位(有 ▲ 者)做出進階查詢,符合之結果也是先依照檢索簡要顯示款目欄位(有 ○ 者)顯示列表回應給使用者,使用者也可進一部點選做詳細款目的查詢,系統依詳細顯示款目欄位(有 ▲ 者)顯示列表供使用者瀏覽。

6142.9. 查詢功能需求.jpg
6142.9. 查詢功能需求2.jpg
6142.9. 查詢功能需求3.jpg

系統功能需求說明

1. 與權威檔連結需求:

目前僅有「人名權威檔」已建置,而地名權威檔以及標題權威檔建置計畫不在今年度計畫中執行。

1.1 人名權威檔:

撰述者、其他貢獻者、序跋題校者姓名、刻工、避諱之避諱人名之欄位需與人名權威檔連結。

1.2 地名權威檔:

出版資訊中的出版地欄位需與地名權威檔連結。

1.3 標題權威檔:

主題、關鍵詞、以及傅圖類目需與標題權威檔連結。

2. 需可與中西曆對照表連結查詢:

撰述者、其他貢獻者、序跋題校者之生卒年,出版時間、印刷時間欄位需可連結中西曆對照表做查詢。

3. 編目紀錄需求:

需求欄位總表中建檔紀錄之建檔人員、建檔時間與修改時間均由系統自動產生:著錄人員進入著錄介面之前需經過身份的確認,皆由著錄人員輸入的姓名與密碼,系統自動把著錄之姓名存放到建檔人員欄位,紀錄該筆記錄由誰人建檔,且不得修改。當此筆記錄正式建檔時,建檔時間也需紀錄在建檔時間欄位。

在紀錄資料的修改方面,更新者要修改、更新資料時,也需經過身份的確認才能登入管理系統。

4. 語言代碼自動產生:

「語言代碼」項目由填表人著錄「語文」項目後由系統產生對應值,其對應情況如下所示:漢—chi|滿—mnc|滿漢合刻-chi-mnc|蒙—mon|藏— tib|其他-other(勾選此項可輸入文字)

5. 善本系統與庫房模組連結需求

庫房模組為管理性後設資料,預計明年度持續開發執行。

6. 影像圖檔著錄之需求

圖檔著錄以著錄TIFF 或JPG/TIFF 為主,JPG 檔以及TUMBNAIL GIF 檔為系統自行產生。

7. 使用權限之需求:

使用者可分為三個層級:一般大眾、已申請帳號者、以及傅圖館內使用者。需做權限控制的欄位如下表所示。

6142.10. 系統功能需求說明.jpg

8. 關連之連結:

關連之欄位以著錄主要題名來連結各筆獨立之資料。

需求規格書確認表單

6142.11. 需求規格書確認表單.jpg

參考資料

參與研發單位:中央研究院-計算中心-後設資料工作組、中央研究院-史語所

提供單位:中央研究院-計算中心-後設資料工作組

使用單位:中央研究院-史語所