檔案類:外交經濟重要檔案數位典藏計畫-經濟重要檔案後設資料需求規格書(原 6-1-23 )

出自 TELDAP
於 2013年5月15日 (三) 06:39 由 Cxcdx (對話 | 貢獻) 所做的修訂 (10個修訂: 分類:技術彙編)

(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)
前往: 導覽搜尋

前言

  • 1.1.後設資料功能需求書

本份「Metadata功能需求書」主要是作為主題計畫提出功能需求之彙整、後設資料工作組分析結果之發表與提供系統開發人員快速建置系統的相關資訊。

對主題計畫而言,本份需求書主要彙集了主題計畫提出的兩部份需求,一部份為metadata之需求,另一部份為系統之功能需求。在metadata需求的部份,主題計畫提出藏品單元之間層級與群組關係的連接需求、後設資料欄位架構著錄需求等;而在系統功能需求的部份,主題計畫則提出了需求欄位之必填性、多值欄、著錄形式等需求,此外,也提出了有關資料建檔、紀錄查詢與權限管控方面的系統需求。

對後設資料工作組而言,分析人員會依據主題計畫提出之藏品單位層級、群組關係與後設資料欄位需求遵循標準的作業流程來進行相關的內涵分析與標準比對,並與主題計畫往返確認分析結果,最後呈現在本份需求書上。

對系統建置人員來說,我們希望本份「Metadata功能需求書」能提供系統人員足夠的資訊,包括資料庫的建置欄位、欄位大小與資料型態、欄位層級等,讓系統建置人員能夠快速建設主題計畫所需之資料庫。此外,本書也收錄了主題計畫資料建檔的流程、著錄介面需求等,讓系統建置人員除了可快速建置資料庫之外,也能快速設計一套web-based的資料庫操作介面,在最短的時間內提供主題計畫最健全的系統雛形。需特別說明的是,本份「Metadata功能需求書」之7、系統說明至10、功能需求說明,僅以工作表單的形式調查出主題計畫對系統的初步需求,後設資料工作組分析人員並不針對系統的需求作更進一步的分析。有關系統分析的工作留待系統建置人員建置系統期間與主題計畫確認清楚。


  • 1.2後設資料內涵、系統分析流程
6125.1.2後設資料內涵、系統分析流程.jpg
圖1:後設資料(Metadata)生命週期作業模式

(一)需求訪談:

需求訪談的目的是為了解主題計畫典藏品的內容,及其著錄上的需求和呈現需求。為將主題計畫的需求更具體化和結構化方式表達,本組會請主題計畫填寫「後設資料工作表單」。為便於主題計畫明瞭所要填寫的內容,本組亦提供「後設資料工作表單填表說明」供主題計畫填寫參考。

(二)工作表單說明與填寫:

本部分將以書畫、器物、拓片、魚類、明清檔案等六類主題計畫回填表單(皆為pdf檔)為例,說明後設資料工作表單填寫的方式與內容。其中並提供後設資料工作組和故宮書畫處的晤談表。

(三)計畫需求與屬性分析:

在主題計畫填寫工作表單的同時,本組開始進行藏品內涵屬性分析、內涵結構分析以及關連分析。最後本組會提出欄位調整與建議給主題計畫參考。

(四)計畫相關標準觀察與分析:

在進行主題計畫藏品屬性分析的同時,本組也會觀察國際上通用的後設資料標準,並和主題計畫的後設資料進行分析比較。

(五)回填工作表單的初步分析:

後設資料分析人員在接獲主題計畫回傳之工作表單後,即進行初步的分析,包括工作表單填寫的正確性與完整性。

(六)後設資料標準比對、評估、採用及調整 分析與建議:

接著,本組會將主題計畫的欄位與後設資料標準進行比對;對標準應用於計畫的適用性提出評估;最後提出分析與建議。

(七)Metadata功能需求書

在與主題計畫完成相關的分析與建議確認後,本組分析人員即把分析的成果撰寫在「Metadata 功能需求書」。

主題計畫計畫簡介

  • 2.1 計畫說明與目標

中央研究院近代史研究所檔案館典藏含外交部門(1860-1928)與經濟部門檔案(1903-1980年代),及個人資料。外交部門檔案於民國93年完成影像製作1,138,988頁、Metadata277,059筆(件)、16,394筆(冊)、權威控制115,718筆。影像資料庫於93年8月正式對外開放。94年起,除繼續完成外交人名權威制外,另進行中研院前院長朱家驊先生檔案及全國經濟委員會檔案的影像製作、後設資料分析、後設資料的建置以及數位典藏計畫網頁、近代外交史研究網站的維護與更新。

檔案館近年來積極推動檔案數位化,除了考慮製作複製件以避免原件或因天然災害、或過度使用而毀損之外,更希望藉由自動化,節省管理檔案的人力,透過聯合目錄檢索以方便讀者利用,更可透過網路的傳輸,方便館際交流。總之,製作數位化檔案取代過去的微縮片,將是未來史料整理及檔案管理的明顯趨勢。本計畫擬選擇本館典藏年代最久遠之外交部檔案及近代中國及戰後臺灣經濟發展相關檔案進行數位化典藏計畫,進而達成數位化檔案館的建立。


  • 2.2 計畫參與人員

v 中研院近史所:

謝國興副所長、莊樹華主任、林威妏

v 數位典藏國家型科技計畫後設資料工作組:

中研院Metadata工作組:陳亞寧、陳淑君、王智豐、沈漢聰(需求規格書撰寫者)

藏品單元層級關係圖與說明

6125.3. 藏品單元層級關係圖與說明.jpg


後設資料欄位需求架構與著錄規範

此份後設資料需求架構是主題計畫經濟檔案特性之內涵需求,其目的在於讓主題計畫參與同仁確認建檔時之資訊,包含:後設資料的項目名稱欄位、欄位定義與著錄規範,並供日後系統設計人員參考之用。【註:主題計畫目前暫未提供有關欄位定義與著錄規範的資料。】

6125.4. 各經濟檔案.jpg
6125.4. 各經濟檔案2.jpg
6125.4. 後設資料欄位需求架構與著錄規範.jpg
6125.4. 後設資料欄位需求架構與著錄規範2.jpg
6125.4. 後設資料欄位需求架構與著錄規範3.jpg


著錄範例

依上述之後設資料需求架構所填寫之著錄範例如下所示:

  • 範例一:17-23(全宗-副全宗)
6125.5. 著錄範例.gif
6125.5. 著錄範例2.gif
6125.5. 著錄範例3.gif
  • 範例二:05(全宗)
6125.5. 範例二.jpg
6125.5. 範例二2.jpg
6125.5. 範例二3.jpg


後設資料國際標準之應用

為數位典藏國家型科技計畫之主題計畫後設資料與國際後設資料標準接軌之重要依據,作為主題計畫與國際間或國內其他主題計畫進行XML資料交換時,彼此互通之基礎。「6. 後設資料國際標準之應用」共包含三部份:

6.1 建議採用之標準

6.2 實際應用情形

6.3 國際標準對照表

6.3.1 EAD Mapping

6.3.2 DC Mapping

  • 6.1 建議採用之標準

在資料結構的描述標準上,本工作組建議採用EAD (Encoded Archival Description),主要原因為(1) EAD是針對檔案資料結構描述而發展的標準,具階層性的架構;同時,(2) EAD獲多項國外大型圖書館及檔案計畫採用;另外,(3) 國史館為我國國家檔案典藏機構,此計畫為檔案類型資料。在適用性的考量及評估下,建議採用此標準。

EAD是由由美國檔案學會的檔案描述編碼格式工作小組負責更新及編輯,主要的目標描述檔案的內容、典藏狀況、組織及層級結構等。EAD官方網站URL:http://www.loc.gov/ead/。


  • 6.2 EAD標準實際應用情形

為協助主題計畫了解其後設資料應用國際標準(EAD)之情形,後設資料工作組研製完成此份分析比對表,提供主題計畫參考。EAD Tag Library的元素依字母順排列,共計146個,各元素中又有其適用的各種屬性。EAD元素與屬性的結構方式是依使用者的需求而訂,各元素與屬性的使用與層級並沒有一定的限制,除了極少數EAD DTD中指定必備者,EAD並未設定核心元素,或對元素與屬性進行其他類似的權重評價。

以下共有兩份比對表格,第一份「EAD-經濟檔案」為以EAD架構為主,將EAD後設資料元素置於左方,以方便看出各層級使用狀況;第二份比對表「經濟檔案-EAD SGML編碼」為以近史所經濟檔案為主,將近史所經濟檔案之元素置於左方,以方便看出所使用的EAD元素及SGML編碼,並方便未來進行資料交換及轉出。

6.2.1 EAD-近史所 經濟檔案

比對說明

  1. 下表EAD之架構,為本工作組根據EAD Tag Library 中各元素之定義及說明所整理出來,非EAD官方發佈之架構。
  2. 粗體標示者為RLG(Research Libraries Group,美國研究圖書館組織)建議最少量使用元素。
  3. 「※」標示者,表該元素為EAD建議必備元素。
6125.6.2.1 EAD-近史所 經濟檔案.jpg
6125.6.2.1 EAD-近史所 經濟檔案2.jpg
6125.6.2.1 EAD-近史所 經濟檔案3.jpg
6125.6.2.1 EAD-近史所 經濟檔案4.jpg
6125.6.2.1 EAD-近史所 經濟檔案5.jpg
6125.6.2.1 EAD-近史所 經濟檔案6.jpg
6125.6.2.1 EAD-近史所 經濟檔案7.jpg

6.2.2 經濟檔案-EAD SGML 編碼

6125.6.2.2 經濟檔案-EAD SGML 編碼.jpg
6125.6.2.2 經濟檔案-EAD SGML 編碼2.jpg
6125.6.2.2 經濟檔案-EAD SGML 編碼3.jpg
6125.6.2.2 經濟檔案-EAD SGML 編碼4.jpg
6125.6.2.2 經濟檔案-EAD SGML 編碼5.jpg
6125.6.2.2 經濟檔案-EAD SGML 編碼6.jpg
  • 6.3 Dublin Core比對表

DC是由The Dublin Core Metadata Initiative(DCMI)所研發,為一組具簡單性、普遍性、延展性、國際性的後設資料元素,用以描述廣泛的網路資源,作為跨學科領域資源分享的交換格式。透過DC與EAD之應用及比對,不同典藏機構可以達到彼此交換、共享典藏品資訊之目標;也是數位典藏國家型科技計畫聯合目錄(http://catalog.ndap.org.tw/System/) 所採用之互通依據。

目前檔案主題小組所建置中的「檔案聯合檢索」平台,所使用的互通依據則為「檔案核心元素」(92/8/8檔案主題小組第二次討論會中公佈,目前為v1.2版)作為互通之依據;未來則會透過檔案核心元素轉出聯合目錄所需之資料。因此下列比對表中,亦加入檔案核心元素的比對,以順利進行各方面的接軌。

6125.6.3 Dublin Core比對表.jpg
6125.6.3 Dublin Core比對表2.jpg
6125.6.3 Dublin Core比對表3.jpg

系統說明

  • 7.1 系統目標

建置符合檔案階級處理之著錄及查詢系統


  • 7.2 系統範圍

可與外交檔案資料庫及人名權威資料庫可作聯合查詢。


資料結構表

  • 8.1 需求欄位建置表

本需求欄位建置表主要是把主題計畫所提出的需求欄位經系統化、架構化與後設資料標準化之後,並列成單表供系統開發人員建置資料庫時設定欄位所用,同時也供程式設計人員在撰寫程式時參考使用。需求欄位建置表之各項說明如下:

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 英文名稱:項目名稱對應的英文名稱。

v 資料型態:著錄資料之資料型態。包括:

n Int 存放純數字型態的資料。

n Float存放浮點數型態的資料。

n Varchar、Text 存放純文字型態的資料。

v 大小:欄位所需之空間,以byte為單位。一個英文字元或一個阿拉伯數字需用一個byte表示,而一個中文字元則需兩個byte表示。

6125.8.1 需求欄位建置表.jpg
6125.8.1 需求欄位建置表2.jpg
6125.8.1 需求欄位建置表3.jpg
  • 8.2 需求欄位屬性表

需求欄位屬性表主要是把主題計畫之需求欄位的屬性彙集整理,並列成表單供系統建置人員參考使用.需求欄位屬性表之各項說明如下:

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 必填:標示「*」者表示為必填欄位,建檔時需填寫該欄位之值,不能空白。

v 多值:標示「◎」者表示為多值欄位,該組欄位資料可重複著錄。

v 屬性:標示該欄位的屬性,包括:

n 「唯一」表示欄位的值在資料庫中是唯一存在的。

n 「下拉式選單」表示著錄方式為下拉式的選單。

n 「關聯下拉式選單」表示該欄位與某他欄位形成二維下拉式選單,其選單代碼會因關聯欄位值之改變而變化。

n 「下拉式選單與自行填寫」表示此欄位同時需下拉式選單與自行填寫兩種著錄格式。

n 「單選選項選單」表示以點選radio button的方式進行資料著錄。

n 「單選選項選單與自行填寫」表示此欄位同時需建置radio button與自行填寫兩種著錄格式。

n 「複選項選單與自行填寫」表示此欄位同時需建置check box與自行填寫兩種著錄格式。

n 「固定值」表示由系統產生一個固定值,且著錄人員無法變更此值。

n 「預設值」表示由系統產生一個預設值,著錄人員可以變更此值。

n 「系統自動產生」表示該欄位的值是由系統自動產生,非由著錄人員著錄。

n 「link」表示該欄位需連結外部資料庫。

v 提供者:記錄這筆資料是由系統自動產生或由填表人所填入。

6125.8.2 需求欄位屬性表.jpg
6125.8.2 需求欄位屬性表2.jpg
6125.8.2 需求欄位屬性表3.gif

代碼表

在需求欄位屬性表之屬性欄位有標示「下拉式選單」者,其對應之下拉選單內容如下:

6125.9. 代碼表.jpg
6125.9. 代碼表2.jpg
6125.9. 代碼表3.jpg
6125.9. 代碼表4.jpg


功能需求說明

  • 10.1 系統功能說明

10.1.1 避免重複建檔檢查機制

本計畫冊層次之館藏號欄位具有唯一性,系統可以「館藏號」欄位作為主鍵欄位。另外,也能以「館藏號」欄位作為檢查紀錄是否重複建檔之檢驗欄位。如若發現有相同資料建檔的情況,系統應提醒著錄人員,並請求著錄人員再次確認所著錄的資料。


10.1.2 館藏號欄位驗正機制

本計畫可將「館藏號」作為主鍵元素,其架構格式為:

全宗號—副全宗號—副副全宗號—系列號—副系列號—宗號—冊號

全宗號:兩個阿拉拍數字

副全宗號:兩個阿拉拍數字

副副全宗號:兩個阿拉拍數字

系列號:兩個阿拉拍數字

副系列號:兩個阿拉拍數字

宗號:三個阿拉拍數字

冊號:三個阿拉拍數字

如範例:17-23-01-01-02-001-001


  • 10.2 建檔功能說明

10.2.1 處理資訊需求說明

系統需記錄著錄者與著錄時間:著錄人員建檔時,進入著錄介面之前需經過身份的確認,藉由著錄人員輸入的姓名與密碼,系統自動把著錄人員之姓名存放在著錄者欄位,同時也把建檔時間存放到著錄時間欄位去。登錄者欄位的資料不可更修或刪除。如若紀錄有發生修改,系統需把修改人的姓名與時間存放到著錄者欄位與著錄時間欄位,將原先的資料取代掉。


10.2.2 建檔資料確認需求說明

建檔的著錄人員在填寫完資料按下確定鍵時,系統必須顯示一確認頁面供著錄人員確認剛所填寫的資料是否正確無誤,著錄人員確認過按下確定鍵時,系統才把資料存入資料庫。另外,冊層級的確認頁面需連同由系統自動產生的館藏號一併顯示供著錄人員確認。


  • 10.3 查詢功能說明

關鍵字查詢係指系統會對下列表單「關鍵字查詢欄位」中所有標示「○」欄位作查詢,檢索所有欄位資料是否符合使用者提出的關鍵字。而進階查詢則可以對下列表單「進階查詢欄位」中標示「●」的個別欄位作獨立查詢。在關鍵字查詢方面,使用者可以對下列表單「關鍵字查詢欄位」中有「○」者作出關鍵字查詢,若有符合之結果,則依照「簡要顯示款目欄位」中有「△」者顯示列表回應給使用者。在進階查詢方面,使用者也可以對下列表單「進階查詢欄位」中有「●」者作出進階查詢查詢,符合之結果也是先依照「簡要顯示款目欄位」中有「△」者顯示列表回應給使用者,使用者也可進一步點選作詳細款目的查詢,系統依「詳細顯示款目欄位」中有「▲」者顯示列表供使用者瀏覽。

6125.10.3 查詢功能說明.jpg
6125.10.3 查詢功能說明2.jpg
6125.10.3 查詢功能說明3.jpg

工作進度記錄檔

6125.11. 工作進度記錄檔.jpg


參考資料

參與研發單位:中央研究院-計算中心-後設資料工作組、中央研究院-近史所

提供單位:中央研究院-計算中心-後設資料工作組

使用單位:中央研究院-近史所