檔案類:外交經濟重要檔案數位典藏計畫-外交重要檔案後設資料需求規格書(原 6-1-22 )

出自 TELDAP
於 2013年5月15日 (三) 06:39 由 Cxcdx (對話 | 貢獻) 所做的修訂 (25個修訂: 分類:技術彙編)

(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)
前往: 導覽搜尋

計畫簡介與說明

本計畫擬選擇本館典藏年代最久遠之外交檔案及最完整之戰後台灣經濟發展相關檔案進行數位化典藏計畫,進而達成數位化檔案館的建立。

  1. 資料庫的建立:檔案的數位化只是將檔案以數位化的方式儲存在不同媒介上,透過目錄的檢索,找尋需要的文件。後設資料(Metadata)是對檔案作更進一步之詮釋及辨識,以對資料系統之檢索、管理及分析。其內容包括關鍵字的設定、相關資料的搜集、主題權威檔的建立等等。凡此均需靠具有專業知識之研究人員對檔案作更詳細之分析與詮釋。
  2. 多媒體的展現方式:
    根據潛在使用者的資訊需求與查尋行為,設計檔案資料庫的聯結模式,以最人性化的表現方式讓使用者對資料庫可作多元性的搜尋。
  3. 建立自動化資料管理系統。
  4. 網路資源的整合及交換:
    推動檔案館資訊交換相關標準,以利資源分享。
  5. 成立戰後台灣經濟發展研究史料中心:
    檔案館保存有豐富的戰後台灣經濟史料,如戰後台灣經濟部檔案、各國營事業檔案、行政院經濟安定委員會、行政院美援運用委員會、國際經濟合作發展委員會等,並陸續徵集其他典藏單位之相關史料作成數位化檔案,如台灣區生產事業管理委員會、行政院外匯貿易審議委員會,典藏之豐富,國內外無出其右,彙整後配合檢索查尋系統,對推動台灣戰後經濟發展之研究將有莫大助益。

計畫參與人員

  • 中研院近史所:張力副所長、莊樹華主任、張凱達、林威妏
  • 中研院Metadata工作組:陳亞寧、陳淑君、沈漢聰、陳雅惠(需求規格書撰寫者)

需求欄位總表與代碼表

本需求欄位總表主要是把主題計畫提出的的需求經系統化、架構化,並列成表單供系統開發人員建置資料庫時設定欄位所用,同時也供程式設計人員在撰寫程式時參考使用。需求欄位總表之各項說明如下:

v 項目名稱:主題計畫專家所需著錄項目之中文名稱。

v 英文名稱:項目名稱對應之英文名稱。

v 資料型態:著錄資料之資料型態。包括:

n Int存放純數字型態的資料。

n Varchar、Text存放純文字型態的資料。

v 大小:欄位所需之空間,以byte為單位。一個英文字元或一個阿拉伯數字需用一個byte表示,而一個中文字元則需兩個byte表示。

v 必填:標示「*」者表示為必填欄位,建檔時需填寫該欄位之值,不能空白。

v 多值:標示「◎」者表示為多值欄位,該組欄位資料可重複著錄。

v 屬性:標示該欄位的屬性,包括:

n 「唯一」表示欄位的值在資料庫中是唯一存在的。

n 「不開放」表示該欄位只供管理者使用,不對外開放。

n 「下拉式選單」表示著錄方式為下拉式的選單。

n 「關聯下拉式選單」表示此欄位的下拉式選項與其他欄位產生關聯,其選單代碼會隨關聯欄位之值改變而變動。

n 「單一選擇選單」表示著錄時只能選擇一項選項,以radio buttom建置。

n 「預設值」表示由系統先預設一個值,著錄人員在著錄時可變更此值。

n 「固定值」表示由系統產生一個固定值,且著錄人員無法變更此值。

n 「系統自動產生」表示該欄位的值是由系統自動產生,非由著錄人員著錄。

v 提供者:記錄這筆資料是由系統自動產生或由填表人所填入。

近史所檔案館外交檔案數位典藏計畫依實務上處理檔案的方式,可分為四個層次,分別為:全宗、系列、冊、件四大層次。各層次之需求欄位總表茲分述如下: 3.1 全宗層次 【全宗】需求欄位總表:

6124-3.1 全宗層次.jpg

在需求欄位總表之屬性欄位有標示選單屬性者,其對應之選單內容如下:

【全宗】代碼表:

6124-3.1【全宗】代碼表.jpg

註一:全宗名欄位之資料值係由系統所自動產生的,當著錄人員著錄全宗號資訊並按下確定鍵之後,系統即依據著錄人員所著錄的資訊,到下列的「全宗號與全宗名對照表」取得對應的全宗名資料,並把該全宗名存放到全宗名欄位去。


全宗號與全宗名對照表:

6124-3.1全宗號與全宗名對照表.jpg

3.2 系列∕副系列層次 【系列】需求欄位總表:

6124-3.2 系列∕副系列層次.jpg

在需求欄位總表之屬性欄位有標示選單屬性者,其對應之選單內容如下:

【系列】代碼表:

6124-3.2 【系列】代碼表.jpg

註二:檔案層級之系列名欄位之資料值係由系統所自動產生的,當著錄人員著錄全宗號、系列號資訊並按下確定鍵之後,系統即依據著錄人員所著錄的資訊,到下列的「系列號與系列名對照表」取得對應的系列名資料,並把該系列名存放到系列名欄位去。

6124-3.2系列號與系列名對照表1.jpg
6124-3.2系列號與系列名對照表2.jpg
6124-3.2系列號與系列名對照表3.jpg
6124-3.2系列號與系列名對照表4.jpg
6124-3.2系列號與系列名對照表5.jpg

3.3 冊層次

6124-3.3 冊層次.jpg

在需求欄位總表之屬性欄位有標示選單屬性者,其對應之選單內容如下:

【冊】代碼表:

6124-3.3 【冊】代碼表.jpg

註三:館藏號欄位係由系統自動產生的。當著錄人員填寫完成冊層級的資料按下確定鍵時,系統需將全宗號、系列號、宗號、冊號以「全宗號—系列號—宗號—冊號」的方式組合起來存放到館藏號欄位。因此,此欄位在著錄時可不顯示,而在查詢時方提供此欄位供使用者查詢。

註四:時間起與迄月之月份,因為著錄資料中有閏月型式,故希望在著錄介面上,月欄位前有一個可勾選的checkbox,勾選者表示該月份資料是閏月型態,系統內可以「1」表示;而不勾選者則表示該月份非閏月型態,系統可以「0」表示。


3.4 件層次 【件】需求欄位總表:

6124-3.4 件層次1.jpg
6124-3.4 件層次2.jpg

註五:館藏號欄位係由系統自動產生的。當著錄人員填寫完成件層級的資料按下確定鍵時,系統需將全宗號、系列號、宗號、冊號與文號以「全宗號—系列號—宗號—冊號—文號」的方式組合起來存放到館藏號欄位。因此,此欄位在著錄時可不顯示,而在查詢時方提供此欄位供使用者查詢。


在需求欄位總表之屬性欄位有標示選單屬性者,其對應之選單內容如下:

6124-3.4 需求欄位總表.jpg

著錄範例

4.1 全宗層次

6124-4.1 全宗層次1.jpg
6124-4.1 全宗層次2.jpg

4.2 系列∕副系列層次

6124-4.2 系列∕副系列層次.jpg

4.3 冊層次

6124-4.3 冊層次.jpg

4.4 件層次

6124-4.4 件層次.jpg

Metadata 標準對照表

Metadata Standard 的對照是作為近史所檔案Metadata元素和國際Metadata Standard的接軌,以及與國際間其他主題計畫作XML資料交換的關鍵機制。以下分別是近史所檔案Metadata元素與 Encoded Archival Description (EAD)及Dublin Core兩種Metadata Standard之對照表。

5.1 EAD Mapping 歷經多次Metadata會議的討論與多次分析與映對,決議近史所外交檔案數位典藏計畫採用EAD做為Metadata standard。近史所外交檔案數位典藏系統所需之Metadata元素和EAD、MARC 21對照結果如下:

【全宗】Metadata標準對照表:

6124-5.1【全宗】Metadata標準對照表.jpg

【系列】Metadata標準對照表:

6124-5.1【系列】Metadata標準對照表.jpg

【冊】Metadata標準對照表:

6124-5.1【冊】Metadata標準對照表1.jpg
6124-5.1【冊】Metadata標準對照表2.jpg

【件】Metadata標準對照表:

6124-5.1【件】Metadata標準對照表1.jpg
6124-5.1【件】Metadata標準對照表2.gif
6124-5.1【件】Metadata標準對照表3.jpg

5.2 Dublin Core Mapping Dublin core 是另一套常用之Metadata標準,其最大之特性在於共通性,為了讓本計畫能跨學科交換資料,故附上本計畫元素與Dublin core 的映照:

說明:

1. 下表為主題計畫元素與DC及檔案核心元素之比對表;「檔案核心元素中」,粗體字型灰色網底者為必填元素。

2. 左側較深色網底下之欄,為元素比對之部分;右側淺色網底下之欄,則為中央研究院後設資料工作組建議主題計畫在聯合目錄上轉出的元素。由於主題計畫都是多個元素對應DC的同一元素(如下表最左方兩欄):

(1) 若全部元素都轉出,不符合聯合目錄方便查詢的特性,且無法精簡地呈現出藏品內容。

(2) 也需考量是否需轉出主題計畫內部的「管理性」的資料,及轉出的資訊是否適合開放讓一般民眾查詢。

下表中以「件」層級之元素進行主要的DC元素比對。因一件藏品即為一筆DC資料,故除了件以外的層級元素,大多會比對至DC的〔Description〕元素中。特此說明。

備註:原則上以一對一為主,有些元素需要兩個以上的元素才足夠呈現出物件的特性,可依不同主題計畫的需求來決定。

6124-5.2 Dublin Core Mapping11.jpg
6124-5.2 Dublin Core Mapping12.jpg
6124-5.2 Dublin Core Mapping13.jpg
6124-5.2 Dublin Core Mapping14.jpg

5.3 EAD SGML編碼 下面所列為近史所外交重要檔案每筆紀錄轉出之SGML碼。藍色字體部分為元素名稱,需帶入該元素著錄之資料值,黑色字體部分為每筆紀錄必須包含之資料內容。

<?xml version="2002"?>


<!DOCTYPE EAD PUBLIC "+//ISBN 1-931666-00-8//DTD ead.dtd (Encoded Archival Description (EAD) Version 2002)//EN">


<ead relatedencoding=“MARC21”>


<eadheader langencoding=“ISO 639-2b”>

<eadid></eadid>

<filedesc>

<titlestmt>

<titleproper>近代史檔案館藏外交重要檔案</titleproper>

</titlestmt>

<publicationstmt>

<publisher>中央研究院近代史研究所檔案館</publisher>

</publicationstmt>

</filedesc>

<profiledesc>

<langusage><language>中文繁體</language></langusage>

</profiledesc>

</eadheader>


<archdesc level=“fonds”>

<dsc>

<did>

<head>Description of Fonds</head>

<unitid label=“Fond Number:” encodinganalog=“099$a”>全宗號</unitid>

<unittitle label=“Fond:” encodinganalog=“245$a”>全宗名</unittitle>

<unitdate label="Dynasty" type="inclusive" encodinganalog="245$f">檔案描述-中年號(起)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中年(起)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中月(起)</unitdate>

<unitdate label="Dynasty" type="inclusive" encodinganalog="245$f">檔案描述-中年號(迄)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中年(迄)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中月(迄)</unitdate>

<physdesc label="Physical Description" encodinganalog=“300”>檔案描述-實體描述</physdesc>

<phyloc label="Repository:" encodinganalog="852$a">館藏地</phyloc>

</did>


<bioghist encodinganalog="545$a">

<head>行政/傳記歷史</head>

檔案內容-行政/歷史傳記

</bioghist>


<scopecontent encodinganalog="520$a">

<head>範圍與內容</head>

檔案內容-範圍與內容

</scopecontent>


<arrangement encodinganalog="351">

<head>檔案編排</head>

檔案內容-檔案編排

</arrangement>


<note>檔案內容-出版資訊</note>


<userestrict type=“Copy Right:” encodinganalog=“540$c >

<head>檔案使用與取得-版權</head>

檔案使用與取得-版權

</ userestrict >


<acqinfo label=“Origin:” encodinganalog=“541$a”>

<head>檔案使用與取得-來源</head>

檔案使用與取得-來源

</acqinfo>


<custohist encodinganalog=”541$a”>

<head>檔案使用與取得-典藏歷史</head>

檔案使用與取得-典藏歷史

</custohist>


<accessrestrict label=“Restriction:” encodinganalog=“506$a”>

<head>檔案使用與取得--檔案附加資訊</head>

檔案使用與取得--檔案附加資訊

</accessrestrict>


<note>備註</note>


<c01 level=“series”>

<did>

<head>Description of Series</head>

<unitid label=“Series Number:” encodinganalog=“099$a”>系列號</unitid>

<unittitle label=“Series:” encodinganalog=“245$a”>系列名</unittitle>

</did>

<did>

<unitdate label="Dynasty" type="inclusive" encodinganalog="245$f">檔案描述-中年號(起)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中年(起)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中月(起)</unitdate>

<unitdate label="Dynasty" type="inclusive" encodinganalog="245$f">檔案描述-中年號(迄)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中年(迄)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中月(迄)</unitdate>

<physdesc label="Physical Description" encodinganalog=“300”>檔案描述-實體描述</physdesc>

<physloc label=“Stack Area:“ encodinganalog="852$a">檔案使用與取得-典藏位置</physloc>

</did>


<altformavail encodinganalog="535">

<head>檔案描述-複本類型</head>

檔案描述-複本類型

</altformavail>


<scopecontent encodinganalog="520$a">

<head>檔案內容-範圍與內容</head>

檔案內容-範圍與內容

</scopecontent>


<note>備註</note>


<c02 level=”otherlevel” otherlevel=” zong”>

<did>

<head>Description of Subject</head>

<unitid label=“Zong Number:” encodinganalog=“099$a”>宗號</unitid>

<unittitle label=“Zong:” encodinganalog=“245$a”>宗名</unittitle>

</did>


<c03 level=“otherlevel” otherlevel=“folder”>

<did>

<head> Description of Folder</head>

<unitid label=“Folder Number:” encodinganalog=“099$a”>冊號</unitid>

<unittitle label=“Folder:” encodinganalog=“245$a”>冊名</unittitle>

<abstract label=“Description:” encodinganalog=“520$a”>檔案描述-描述</abstract>

</did>

<did>

<unitdate label="Dynasty" type="inclusive" encodinganalog="245$f">檔案描述-中年號(起)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中年(起)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中月(起)</unitdate>

<unitdate label="Dynasty" type="inclusive" encodinganalog="245$f">檔案描述-中年號(迄)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中年(迄)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中月(迄)</unitdate>

<phydesc>

<extent label=“Unit:” encodinganalog=“300$c”>檔案描述-實體描述</extent >

<extent label=“Page:” encodinganalog=“300$a”>檔案描述-實體描述</extent >

</phydesc>


</did>


<bibliography>

<head>相關參考資源-參考資源</head>

<bibref encodinganalog=“581$a”>

相關參考資源-參考資源

舊檔號,/p>

</bibref>

</bibliography>


<controlaccess>

<head>地名權威控制</head>

<geoname encodinganalog=“651$a”>地名權威控制</geoname>

</controlaccess>


<note lable=“Note:” encodinganalog=“500$a”>備註</note>


<c04 level=“item”>

<did>

<unitid label=“Call Number:” encodinganalog=“099$a”>館藏號</unitid>

<head> Description of Item</head>

<unitid label=“Item Number:” encodinganalog=“099$a”>件號</unitid>

<unittitle label=“Item Name:” encodinganalog=“245$a”>件名</unittitle>

<abstract label=“Description:” encodinganalog=“520$a”>檔案描述-描述</abstract>

<unitdate label="Dynasty" type="inclusive" encodinganalog="245$f">檔案描述-中年號(起)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中年(起)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中月(起)</unitdate>

<unitdate label="Dynasty" type="inclusive" encodinganalog="245$f">檔案描述-中年號(迄)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中年(迄)</unitdate>

<unitdate label=" Period " type="inclusive" encodinganalog="245$f">檔案描述-中月(迄)</unitdate>

<origination label=“Originator:” encodinganalog=“110$a”>檔案描述-產生者</origination>

<origination label=“Recipient:” encodinganalog=“110$a”>檔案描述-收文者</origination>

<langmaterial label="Language:" encodinganalog="041$a">語文為<language>語文</language></langmaterial>

<physdesc>

<generform encodinganalog="655$a">檔案描述-資料形式</generform>

<extent encodinganalog="300$f">檔案描述-頁數</extent>

</physdesc>

</did>


<note label=“version:” encodinganalog="250$a">檔案描述-版本</note>


<relatedmaterial encodinganalog="500$a">

<head>檔案描述-附件</head>

<p>檔案描述-附件

</relatedmaterial>


<bibliography>

<head>相關參考資源-參考資源</head>

<bibref encodinganalog=“581$a”>

舊檔號,/p> </bibref> </bibliography> <controlaccess> <head>權威控制</head> <occupation encodinganalog=“656$a”>權威控制-職銜權威</occupation> <persname encodinganalog=“600$a”>權威控制-人名權威</persname> </controlaccess> <daogrp> <daoloc show="embed" actuate="auto" entityref="影像檔" encodinganalog="856$u"> </daoloc> </daogrp> <note lable=“Note:” encodinganalog=“500$a”>備註</note> </c04> </c03> </c02> </c01> </dsc> </archdesc> </ead>

查詢功能需求

【全宗】查詢功能需求表:

6124-【全宗】查詢功能需求表.jpg

【系列/副系列】查詢功能需求表:

6124-【系列/副系列】查詢功能需求表.jpg

【卷】查詢功能需求表:

6124-【卷】查詢功能需求表.jpg

【件】查詢功能需求表:

6124-【件】查詢功能需求表.jpg

關鍵字查詢介面:

6124-關鍵字查詢介面.jpg

進階查詢介面:

6124-進階查詢介面.jpg

v 進階查詢介面之全宗代碼如下:

6124-進階查詢介面之全宗代碼如下.jpg

系統功能需求說明

7.1 【件】層級避免重複建檔檢查機制


7.2 處理資訊需求說明 處理資訊之著錄者欄位與著錄時間欄位,皆由系統自動產生:著錄人員建檔時,進入著錄介面之前需經過身份的確認,藉由著錄人員輸入的姓名與密碼,系統自動把著錄人員之姓名存放在著錄者欄位,同時也把建檔時間存放到著錄時間欄位去。登錄者欄位的資料不可更修或刪除。如若紀錄有發生修改,系統需把修改人的姓名與時間存放到著錄者欄位與著錄時間欄位,將原先的資料取代掉。

7.3 建檔資料確認需求說明   

7.4 館藏號之查詢說明 在 6.查詢功能需求 之進階查詢中,使用者除了可輸入完整的館藏號進行查詢之外,也可以輸入部份的館藏號,如使用者在館藏號欄位輸入「01-02」,系統應該找出01全宗、02系列下之全部卷、件資料。

需求規格書確認表單

6124-8. 需求規格書確認表單.jpg

參考資料

參與研發單位:中央研究院-計算中心-後設資料工作組、中央研究院-近史所

提供單位:中央研究院-計算中心-後設資料工作組

使用單位:中央研究院-近史所