檔案類:臺灣總督府檔案後設資料需求規格書(原 6-1-33 )
目錄
前言
技術研發分項計畫後設資料工作組把主題計畫提出之需求經系統化,架構化與國際標準化之後,呈現於本份「後設資料需求規格書version 1.1」中,主要係作為主題計畫與系統開發者之間的溝通橋樑,其中,我們建議主題計畫進行需求規格書確認工作時務必著重於以下的部份:
- 計畫簡介
- 系統說明
- 著錄欄位架構
- 後設資料標準比對表
- 功能需求說明
- 代碼表
- 需求規格書確認表單
而系統開發人員在系統實際建置時,可著重於以下之部份:
- 資料結構表
- 後設資料標準比對表
- 功能需求說明
- 代碼表
計畫簡介
- 2.1 計畫說明
國史館臺灣文獻館(以下簡稱本館)典藏日治時期臺灣總督府檔案(TaiwanSoutokufu Archives)為日前世界保存最完整的戰前日本殖民機構統治文書,紀錄了日本治臺五十年間,臺灣在政治、經濟、社會、文化等各方面的重要發展,其中,隨各式文書被保留至今的大尺寸圖檔,包括了臺灣各地的市區改正圖、建築圖、?區圖、學區圖……等等,是目前罕見的臺灣歷史空間資料,對還原臺灣近百年發展脈落,有相當大的助益。
本子計畫為「典藏日據時期與光復初期檔案數位化計畫」中之一環,主要執行工作即希望透過計畫進行,將原本已逾五十年至百年以上紙本資料數位化處理,並建立符合國際通用標準規格之國家數位典藏系統,開放於網際網路供大眾使用,以同時達成保存原始檔案及促進檔案內容應用的兩大效益。
- 2.2 計畫目標
(一) 達成臺灣總督府檔案的保存及開放應用。
- 完成基本資料庫之後設欄位建檔格式。
- 後設資料分析填寫。
- 建立臺灣總督府檔案及大尺寸圖檔檢索查詢系統。
(二)建立檔案數位化過程及管理標準規範,作為日後本館其他檔案數位化參考。
(三)人才培育,培育本館檔案數位化之人才,希望在計畫結束後,所培育之人才能繼續從事其他珍貴檔案數位化工作,並具有管理數位化系統運作能力。
- 2.3 計畫參與人員
v 國史館臺灣文獻館:蕭主任秘書富隆、鄒組長擅銘、洪編纂瑞豐、張專員清輝、張谷源、張家榮、何岳峰、范子文
v 數位典藏國家型科技計畫後設資料工作組:陳亞寧、陳淑君、陳雅惠、沈漢聰 (需求規格書撰寫者)
系統說明
- 3.1 系統目標
(一) 史料保存方面:
提供典藏機構管理檔案原件及影像之使用管理機制,以作為數位化檔案開放、重複運用之基礎。
(二) 建立檔案數位化過程及管理標準規範,作為日後本館其他檔案數位化參考。
提供網際網路線上檢索及線上調閱(全文瀏覽),使檔案之利用向更廣大的使用者開放。
- 3.2 系統範圍
(一) 系統範圍
本計畫希望能賡續過去與中央研究院五年學術合作計畫之成果,提供完整檔案與圖檔之檢索,並希望未來結合GIS 系統、權威檔、索引典……等,以期使用上更臻完美,另外,也提升本館未來在檔案與影像管理上的資訊基礎。
(二) 使用對象
本計畫預期之使用對象包括下列:
- 管理層級:即本館人員,作為檔案管理上的輔助工具,例外,也隨時更新、修正資料庫系統,以提供完善對外服務。
- 史學研究:研究者主要以總督府檔案A3 以下文書為研究對象,並輔予大尺寸圖檔部分參考,如國內外歷史學者與檔案學者。
- 空間研究:研究者主要以總督府檔案大尺寸圖檔為研究對象,並輔予A3以下文書部分參考,如地理、建築、土木相關領域研究者。
- 教育者與一般使用者:提供學校教學可能使用教材,鄉土相關資訊,呈現檔案應用的多元可能。
著錄欄位架構
- 4.1 著錄架構
著錄架構之主要目的在於讓主題計畫參與同仁確認建檔時所需著錄之後設資料欄位與欄位的先後排序。
- 4.2 著錄範例
依上述之著錄架構所填寫的著錄範例如下:
資料結構表
- 5.1 需求欄位建置表
本需求欄位建置表主要是把主題計畫所提出的需求欄位經系統化、架構化與後設資料標準化之後,並列成表單供系統開發人員建置資料庫時設定欄位所用,同時也供程式設計人員在撰寫程式時參考使用。需求欄位建置表之各項說明如下:
v 項目名稱:主題計畫所需著錄項目之中文名稱。
v 英文名稱:項目名稱對應之英文名稱。
v 資料型態:著錄資料之資料型態。包括:
n Int 存放有效數字型態的整數資料。
n Float 存放浮點數型態的資料。
n Varchar、Text 存放純文字型態的資料。
v 大小:欄位所需之空間,以byte 為單位。一個英文字元或一個阿拉伯數字需用一個byte 表示,而一個中文字元則需兩個byte 表示。
- 5.2 需求欄位屬性表
需求欄位屬性表主要是把主題計畫之需求欄位的屬性彙集整理,並列成表單供系統建置人員參考使用.需求欄位屬性表之各項說明如下:
v 項目名稱:主題計畫所需著錄項目之中文名稱。
v 必填:標示「*」者表示為必填欄位,建檔時需填寫該欄位之值,不能空白。
v 多值:標示「◎」者表示為多值欄位,該組欄位資料可重複著錄。
v 屬性:標示該欄位的屬性,包括:
n 「唯一」表示欄位的值在資料庫中是唯一存在的。
n 「下拉式選單」表示著錄方式為下拉式的選單。
n 「二維下拉式選單」表示著錄方式為二維的下拉式選單。
n 「下拉式選單與自行填寫」表示此欄位同時需下拉式選單與自行填寫兩種著錄格式。
n 「對應下拉式選單」表示兩欄位之下拉式選單代碼間有對應之關係,不管著錄人員選擇哪個欄位之代碼,另一欄位對應之代碼需同時被選取。
n 「關連下拉式選單」表示此欄位的下拉式選項與其他欄位產生關連,其選單代碼會隨關連欄位之值改變而變動。
n 「預設值」表示由系統先預設一個欄位值,著錄人員在著錄時可變更此值。
n 「固定值」表示由系統產生一個固定值,且著錄人員無法變更此值。
n 「系統自動產生」表示該欄位的值是由系統自動產生,非由著錄人員著錄。
n 「link」表示該欄位需連結外部資料庫。
v 提供者:記錄這筆資料是由系統自動產生或由填表人所填入。
後設資料標準比對表
後設資料標準的對照是作為本計畫後設資料欄位和國際後設資料標準的接軌,以及與國際間其他主題計畫作XML 資料交換的關鍵機制。以下分別是本計畫後設資料欄位與EAD、MARC21 及Dublin Core 兩種後設資料標準之比對表。
- 6.1 EAD、MACR21 Mapping
- 6.2 DC Mapping
- 6.3 EAD SGML 編碼
下面所列為「臺灣總督府專賣局檔案」中每筆紀錄轉出之SGML 碼。楷體粗體字體部分為元素名稱,需帶入該元素著錄之資料值,細明體網底字體部分為每筆紀錄必須包含之資料內容。
<!DOCTYPE EAD PUBLIC“-//Society of American Archivists//DTD
ead.dtd(Encoded Archival Description(EAD)Version 2002)//EN”>
<ead relatedencoding="MARC21">
<eadheader langencoding="iso639-2b">
<eadid></eadid>
<filedesc>
<titlestmt>
<titleproper>臺灣總督府檔案</titleproper>
</titlestmt>
<publicationstmt>
<publisher>國史館臺灣文獻館</publisher>
</publicationstmt>
</filedesc>
<profiledesc>
<langusage><language>中文繁體</language></langusage>
</profiledesc>
</eadheader>
<archdesc level="recordgrp">
<did>
<head>全宗描述</head>
<physdesc>
<genreform encodinganalog="655$a">類型</genreform>
</physdesc>
<repository>
<corpname encodinganalog="852$a">典藏機關</corpname>
<address><addressline>典藏地</addressline></address>
</repository>
<unitid repositorycode="機關代碼" label="Record Group Number:"
encodinganalog="852$j">全宗號</unitid>
<unittitle label="Record Group Name:" encodinganalog="245$a">全宗名</unittitle>
</did>
<dsc>
<c01 level="subgrp">
<did>
<head>副全宗描述</head>
<unittitle label="Subgroup Name:" encodinganalog="245$a">副全宗名</unittitle>
</did>
<c02 level="series">
<did>
<head>系列描述</head>
<unittitle label="Series Name:" encodinganalog="245$a">系列名</unittitle>
</did>
<c03 level="subseries">
<did>
<head>副系列描述</head>
<unittitle label="Subseries Name:" encodinganalog="245$a">副系列名</unittitle
</did>
<c04 level="otherlevel" otherlevel="sub-subseries">
<did>
<head>宗描述</head>
<unittitle label="Subject Name:" encodinganalog="245$a">宗名</unittitle>
</did>
<c05 level="file">
<did>
<head>件描述</head>
<unittitle label="Name:" encodinganalog="245$a">件名</unittitle>
<unittitle label="Number:" encodinganalog="852$j">件號</unittitle>
<unitid label="Collection Number:" encodinganalog="852$j">典藏號</unitid>
<abstract label="Content Description:" encodinganalog="520$a">內容描述
</abstract>
<origination label="Originative institution">
<corpname encodinganalog="110$a">立案者</corpname>
</origination>
<unitdate label="Date:" type="inclusive" encodinganalog="245$f">時間-西曆-起 -
時間-西曆-迄</unitdate>
<unitdate label="Date:" type="inclusive" encodinganalog="245$f">時間-中日紀元-
起-年號年月日 - 時間-中日紀元-迄-年號年月日</unitdate>
<langmaterial label="Language:" encodinganalog="041$a"><language langcode="語
文-語文代碼">語文</language></langmaterial>
<repository label="Copy Right:" encodinganalog="540$b" >版權</repository>
<physloc label="Location:" encodinganalog="852$b">典藏位置-原件-位置號,典
藏位置-原件-樓別架號</physloc>
<note label="Edition:" encodinganalog="250$a"><p>版本</p></note>
<note label="Originative Institution Number:" encodinganalog="500$a"><p>公文字
號</p></note>
<note label="Page Number:" encodinganalog="300$a"><p>頁碼-起 - 頁碼-迄
<note label="Page Number:" encodinganalog="300$a"><p>頁碼-起 - 頁碼-迄 </p></note>
</did>
<arrangement encodinganalog="351$b">
<head>裝訂冊</head>
<p><unittitle>裝訂冊-冊名</unittitle>
<num>裝訂冊-冊號-冊號舊</num>
<num>裝訂冊-冊號-新冊號</num></p>
<p>裝訂冊-保存年限</p>
</arrangement>
<controlaccess>
<head>標題資訊</head>
<controlaccess>
<head>關鍵詞</head>
<subject encodinganalog="650$a">關鍵詞</subject>
</controlaccess>
<controlaccess>
<head>人名</head>
<persname encodinganalog="600$a">內容資訊-人名</persname>
</controlaccess>
<controlaccess>
<head>機關</head>
<corpname encodinganalog="610$a">內容資訊-機關</corpname>
</controlaccess>
<controlaccess>
<head>地名</head>
<geogname encodinganalog="651$a">內容資訊-地名</geogname>
</controlaccess>
</controlaccess>
<altformavail>
<head>微縮片</head>
<p><num>微縮片-編號</num></p>
<p>微縮片-典藏位置-位置號,微縮片-典藏位置-樓別架號</p>
<p>微縮片-使用限制</p>
</altformavail>
<altformavail>
<head>影本</head>
<p>典藏位置-影本-位置號,典藏位置-影本-樓別架號</p>
</altformavail>
<dao>
<daodesc>
<head>影像資訊</head>
<p>掃描號:<num>影像資訊-掃描號-首頁次 - 影像資訊-掃描號-最後頁次
</num></p>
<p>儲存資訊:影像資訊-儲存資訊-儲存媒體, 影像資訊-儲存資訊-影像格式,
影像資訊-儲存資訊-媒體份數,<num>影像資訊-儲存資訊-媒體編號</num>,影像資訊-儲存資訊-典藏位置-位置號,影像資訊-儲存資訊-典藏位置-樓別架號,影像使用限制</p>
</daodesc>
</dao>
<acqinfo>
<head>入藏資訊</head>
<p>來源:<corpname encodinganalog="541$a">入藏資訊-來源</corpname>,<date
type="accession" encodinganalog="541$d">入藏資訊-入藏時間</date></p>
<p>入藏資訊-取得方式</p>
</acqinfo>
<processinfo encodinganalog="583$l">
<head>處理資訊</head>
<p>保存狀況</p>
<p>裱褙狀況</p>
</processinfo>
<userestrict encodinganalog="540$a">
<head>原件使用限制</head>
<p>原件使用限制</p>
</userestrict>
<note>
<p>
<persname role="cataloger" audience="internal" encodinganalog="040$a">編目資訊
-登錄者</persname>
<persname role="modifier" audience="internal" encodinganalog="040$d">編目資訊
-修改者</persname>
<date type="Cataloging" audience="internal" encodinganalog="008 /00-05">編目資
訊-建檔日期</date>
<date type="Modification" audience="internal" encodinganalog="005">編目資訊-
修改時間</date>
</p></note>
<note><p>備註-讀者事項備註</p></note>
<note><p>備註-管理事項備註</p></note>
<c06 level="item">
<did>
<head>附件描述</head>
<unittitle label="Name:" encodinganalog="245$a">附件名</unittitle>
<unitid label="Number:" encodinganalog="852$j">附件號</unitid>
<abstract label="Content Description:" encodinganalog="520$a">內容描
</abstract>
<physdesc>
<dimensions type="length" label="Size of Attachment-Length:"
encodinganalog="300$c">尺寸-高</dimensions>
<dimensions type="width" label="Size of Attachment-Width:"
encodinganalog="300$c ">尺寸-寬</dimensions>
<physfacet type="material" label="Material of Support:" encodinganalog="300$b">
紙張材質</physfacet>
<physfacet label="Method of Drawing/ Publication:" encodinganalog="500$a">筆法
或印刷法</physfacet>
</physdesc>
<materialspec label="Mathematical Data">
<materialspec label="Scale:" encodinganalog="255$a">比例尺-比例
</materialspec>
<materialspec label="Unit of Measurement:" encodinganalog="255$a">比例尺-尺寸
單位</materialspec>
<materialspec label="Point of View/ Method of Representation:"
encodinganalog="255$b">視角或投影法</materialspec>
<materialspec label="Spatial Domain of Drawing- West Bounding Coordinates:"
encodinganalog="255$c">空間資訊-繪製空間-西邊座標</materialspec>
<materialspec label="Spatial Domain of Drawing- East Bounding Coordinates:"
encodinganalog="255$c">空間資訊-繪製空間-東邊座標</materialspec>
<materialspec label="Spatial Domain of Drawing- North Bounding Coordinates:"
encodinganalog="255$c">空間資訊-繪製空間-北邊座標</materialspec>
<materialspec label="Spatial Domain of Drawing- South Bounding Coordinates:"
encodinganalog="255$c">空間資訊-繪製空間-南邊座標</materialspec>
<materialspec label="Height- Hightest:" encodinganalog="255$d">空間資訊-地表
高度-最高值</materialspec>
<materialspec label="Height- Hightest:" encodinganalog="255$d">空間資訊-地表
高度-最低值</materialspec>
</materialspec>
<origination label="Producer:">
<persname encodinganalog="110$a">生產資訊-生產者</persname>
</origination>
<unitdate label="Produce date- Chronology:" type="inclusive"
encodinganalog="245$f">生產資訊-生產時間-西曆</unitdate>
<unitdate label="Produce date- Japan Chronology " type="inclusive"
encodinganalog="245$f">生產資訊-生產時間-中日紀元(年號-年-月-日)</unitdate>
<origination label="Publisher:">
<persname encodinganalog="260$b">出版資訊-出版者</persname>
</origination>
<unitdate label=" Publication Date- Chronology:" type="inclusive"
encodinganalog="260$c">出版資訊-出版時間-西曆</unitdate>
<unitdate label="Publication Date- Japan Chronology:" type="inclusive"
encodinganalog="260$c">出版資訊-出版時間-中日紀元(年號-年-月-日)</unitdate>
<langmaterial label="Language:" encodinganalog="041$a"><language langcode="語
文-語文代碼">語文</language></langmaterial>
<note label="Edition:" encodinganalog="250$a"><p>版本</p></note>
<note label="Page number:" encodinganalog="300$a"><p>起始頁碼</p></note>
</did>
<controlaccess>
<head>標題資訊</head>
<controlaccess>
<head>關鍵詞</head>
<subject encodinganalog="650$a">關鍵詞</subject>
</controlaccess>
<controlaccess>
<head>附件分類層級</head>
<subject encodinganalog="650$a">第一層級</subject>
<subject encodinganalog="650$a">第二層級</subject>
<subject encodinganalog="650$a">第三層級</subject>
<subject encodinganalog="650$a">第四層級</subject>
</controlaccess>
<controlaccess>
<head>人名</head>
<persname encodinganalog="600$a">內容資訊-人名</persname>
</controlaccess>
<controlaccess>
<head>機關</head>
<corpname encodinganalog="610$a">內容資訊-機關</corpname>
</controlaccess>
<controlaccess>
<head>地名</head>
<geogname encodinganalog="651$a">內容資訊-地名</geogname>
</controlaccess>
<dao>
<daodesc>
<head>影像資訊</head>
<p>掃描號:<num>影像資訊-附件影像掃描號</num></p>
<p>儲存資訊:影像資訊-儲存資訊-儲存媒體, 影像資訊-儲存資訊-影像格式,
影像資訊-儲存資訊-媒體份數,<num>影像資訊-儲存資訊-媒體編號</num>,影像資訊-儲存資訊-典藏位置-位置號,影像資訊-儲存資訊-典藏位置-樓別架號,影像使用限制</p>
</daodesc>
</dao>
<processinfo encodinganalog="583$l">
<head>處理資訊</head>
<p>保存狀況</p>
<p>裱褙狀況</p>
</processinfo>
<userestrict encodinganalog="540$a">
<head>附件使用限制</head>
<p>附件使用限制</p>
</userestrict>
<note>
<p>
<persname role="cataloger" audience="internal" encodinganalog="040$a">編目資訊
-登錄者</persname>
<persname role="modifier" audience="internal" encodinganalog="040$d">編目資訊
-修改者</persname>
<date type="Cataloging" audience="internal" encodinganalog="008 /00-05">編目資
訊-建檔日期</date>
<date type="Modification" audience="internal" encodinganalog="005">編目資訊-
修改時間</date>
</p>
</note>
<note label="Notes For Readers:" encodinganalog="500$a"><p>備註-讀者事項備
註</p></note>
<note label="Notes For Manager:" encodinganalog="500$a"><p>備註-管理事項備
註</p></note>
</c06>
</c05>
</c04>
</c03>
</c02>
</c01>
</dsc>
</archdesc>
</ead>
功能需求說明
- 7.1 建檔功能說明
7.1.1 避免重複建檔檢查機制
本計畫之典藏號欄位具有唯一性,系統可以「典藏號」欄位作為主鍵欄位。另外,也能以「典藏號」欄位作為檢查紀錄是否重複建檔之檢驗欄位。當著錄人員填寫完畢系列層次的資料後,系統自動產生相對應的典藏號,並利用此典藏號檢查紀錄是否有重複建檔,如若發現在相同資料重複建檔的情況,系統應提醒著錄人員,並請求著錄人員再次確認所著錄的資料。
另外,在附件層次則以「附件號」作為避免重複建檔的檢查機制。
7.1.2 編目資訊需求說明
著錄人員要進行紀錄建檔時,進入著錄系統之前需經過身份的確認,著錄人員必須輸入自己的帳號與密碼,系統確認無誤之後,方可允許著錄人員登入系統進行建檔的工作,著錄人員登入系統之後,系統需記錄建檔人員的姓名與建檔時間。同樣的,當著錄人員需修改紀錄內容時,也需經過身份的確認才能登入系統,藉由確認的動作可知該筆紀錄是經由誰人所修改,系統亦需記錄修改人的姓名與修改時間。系統不需記錄每次修改的資訊,只需記錄最近一次的修改資訊即可。
7.1.3 建檔資料確認需求說明
建檔的著錄人員在填寫完資料按下確定鍵時,系統必須顯示一確認頁面供著錄人員確認剛所填寫的資料是否正確無誤,著錄人員確認過按下確定鍵後,系統才把資料存入資料庫。另外,一些由系統自動產生的欄位,如典藏號欄位,雖不由著錄人員所著錄,但在確認頁面中,需一併顯示供確認。
7.1.4 主鍵(典藏號)欄位之檢正
典藏號可作為系統之主鍵,系統需確保典藏號欄位值的正確性,故需對典藏號欄位的架構進行驗正,典藏號能架構格式如下:
組成結構:全宗號(三碼阿拉拍數字)+ 新冊號(五碼阿拉拍數字)+ 件號(三碼阿拉拍數字)
7.1.5 系列影像資訊掃描號欄位之驗正
為維護附件號欄位資料值之正確性,系統在著錄人員建檔時,需設置附件號欄位的驗正機制。當系統發現著錄人員輸入的附件號欄位資料值不符既定格式時,系統會提出警告訊息,要求著錄人員確認所輸入的資料值是否正確無誤。附件號欄位的架構格式如下所示:
a. 大於A3:
全宗號 + 新冊號 + 件號 + 尺寸碼 + 圖號 + M三碼數字 + 五碼數字 + 三碼數字 + 四碼數字 + 三碼數字 + M如:000021100069002001M大於A3 的附件號在呈現時,以「全宗號-新冊號-件號-尺寸碼-圖號M」的方式展示,如:000-02110-006-9002-001M
b. 小於等於A3:
全宗號 + 新冊號 + 件號 + 頁號 + M三碼數字 + 五碼數字 + 三碼數字 + 四碼數字 + M如:000021100060086M小於等於A3 的附件號在呈現時,以「全宗號-新冊號-件號-頁號M」的方式展示,如:000-02110-006-0086M
- 7.2 查詢功能說明
本計畫的查詢功能需求分為「簡易查詢」與「進階查詢」兩種;查詢結果的顯示亦有 「簡要顯示」與「詳細顯示」兩種。「簡易查詢」係指系統將對下列表單「簡易查詢」欄位中,所有標示「△」欄位作關鍵字查詢,檢索這些欄位的資料是否符合使用者提出的詞彙。若有符合檢索值之結果,則先依照 「簡要顯示款目」欄位(標示●者)顯示列表回應給使用者,使用者可點選其中的查詢結果作進一步的詳細瀏覽(詳細顯示款目標示☆者)。「進階查詢」則可對下列表單之 「進階查詢」欄位中,標示「▲」的各別欄位作獨立查詢。符合之結果也是先依照檢索「簡要顯示款目」欄位(標示●者)顯示列表回應給使用者。使用者也可進一步點選,系統將提供 「詳細顯示款目」(標示☆者),顯示列表供使用者瀏覽
- 7.3 系統功能說明
7.3.1. 系統需能支援日文:
由於本計畫進行之數位化典藏檔案有部份是日治時期之檔案,故在後設資料的建置上,系統必須能接受日文的輸入,同時在顯示時,系統也被要求能支援日文的輸出。
另外,在附件層次則以「附件號」作為避免重複建檔的檢查機制。
7.3.2. 舊系統資料轉移需求:
本數位典藏系統建置完成後,需將舊系統(臺灣總督府及所屬機構公文類纂目錄查詢系統)的資料匯入到本系統。
代碼表
上述5.2 需求欄位屬性表之屬性欄位有標示「下拉式選單者」,其對應之下拉式選單代碼內容如下所示:
規格書確認表單
附件一:副全宗名、系列名、副系列名、宗名欄位關連下拉式選單代碼表
附件二:附件分類層級關連下拉式選單代碼表
參考資料
參與研發單位:技術研發分項計畫-後設資料工作組、國史館臺灣文獻館
提供單位:技術研發分項計畫-後設資料工作組
使用單位:國史館臺灣文獻館