檔案類:國家歷史資料庫-戰後臺灣的初期發展(1945-1954)後設資料功能需求書(原 6-1-32 )

出自 TELDAP
前往: 導覽搜尋

前言

  • 1.1 後設資料功能需求書

本份「Metadata功能需求書」主要是作為主題計畫提出功能需求之彙整、後設資料工作組分析結果之發表與提供系統開發人員快速建置系統的相關資訊。

對主題計畫而言,本份需求書主要彙集了主題計畫提出的兩部份需求,一部份為metadata之需求,另一部份為系統之功能需求。在metadata需求的部份,主題計畫提出藏品單元之間層級與群組關係的連接需求、後設資料欄位架構著錄需求等;而在系統功能需求的部份,主題計畫則提出了需求欄位之必填性、多值欄、著錄形式等需求,此外,也提出了有關資料建檔、紀錄查詢與權限管控方面的系統需求。

對後設資料工作組而言,分析人員會依據主題計畫提出之藏品單位層級、群組關係與後設資料欄位需求遵循標準的作業流程來進行相關的內涵分析與標準比對,並與主題計畫往返確認分析結果,最後呈現在本份需求書上。

對系統建置人員來說,我們希望本份「Metadata功能需求書」能提供系統人員足夠的資訊,包括資料庫的建置欄位、欄位的大小與資料型態、欄位屬性等,讓系統建置人員能夠快速建設主題計畫所需之資料庫。此外,本書也收錄了主題計畫資料建檔的流程、著錄介面需求等,讓系統建置人員除了可快速建置資料庫之外,也能快速設計一套web-based的資料庫操作介面,在最短的時間內提供主題計畫最健全的系統雛形。需特別說明的是,本份「Metadata功能需求書」之8、系統說明至11,功能需求說明僅以工作表單的形式調查出主題計畫對系統的初步需求,後設資料工作組分析人員並不針對系統的需求作更進一步的分析。有關系統分析的工作留待系統建置人員建置系統期間與主題計畫確認清楚。


  • 1.2 後設資料內涵、系統分析流程
6134.1.2 後設資料內涵、系統分析流程.jpg
圖1:後設資料(Metadata)生命週期作業模式
  1. 需求訪談
    需求訪談的目的是為了解主題計畫典藏品的內容,及其著錄上的需求和呈現需求。為將主題計畫的需求更具體化和結構化方式表達,本組會請主題計畫填寫「後設資料工作表單」。為便於主題計畫明瞭所要填寫的內容,本組亦提供「後設資料工作表單填表說明」供主題計畫填寫參考。
  2. 工作表單說明與填寫
    本部分將以書畫、器物、拓片、魚類、明清檔案等六類主題計畫回填表單(皆為pdf檔)為例,說明後設資料工作表單填寫的方式與內容。其中並提供後設資料工作組和故宮書畫處的晤談表。
  3. 計畫需求與屬性分析
    在主題計畫填寫工作表單的同時,本組開始進行藏品內涵屬性分析、內涵結構分析以及關連分析。最後本組會提出欄位調整與建議給主題計畫參考。
  4. 計畫相關標準觀察與分
    在進行主題計畫藏品屬性分析的同時,本組也會觀察國際上通用的後設資料標準,並和主題計畫的後設資料進行分析比較。
  5. 回填工作表單的初步分
    後設資料分析人員在接獲主題計畫回傳之工作表單後,即進行初步的分析,包括工作表單填寫的正確性與完整性。
  6. 後設資料標準比對、評估、採用及調整、分析與建議
    接著,本組會將主題計畫的欄位與後設資料標準進行比對;對標準應用於計畫的適用性提出評估;最後提出分析與建議。
  7. Metadata功能需求書
    在與主題計畫完成相關的分析與建議確認後,本組分析人員即把分析的成果撰寫在「Metadata 功能需求書」。

主題計畫計畫簡介

  • 2.1 計畫說明與目標

當前正值數位革命的資訊時代,人類對於資料、資訊及知識的儲存、管理、應用、溝通、傳播等方式,均起了重大的變革,以電腦為基礎的資料庫(儲存量大)、網路(傳遞迅捷)已為人們廣泛使用,而且逐漸成為知識交流的主要媒介。為此,中央研究院資訊科學研究所與國史館擬以該館數位典藏成果為基礎,進一步整合學術界研究成果,建立包括:人物傳記、大事年表、重要史事、重要檔案以及相關研究書目等內容,並透過結合文字、影像、聲音的方式展現國家歷史之數位資料、資訊與知識平台,且將此知識性數位資料庫上載於全球資訊網絡,提供各界閱讀、查詢、資料檢索等,以利交流。

本計畫的主要目的是以數位儲存管理,與網路傳遞交流等方式,來整合以國史館史料典藏和學術界研究成果為主的各種國家歷史資源,並應用中央研究院資訊科學研究所所研發的科技,建構一個內容完整、多元,且可快速傳播的歷史知識和國家記憶-「國家歷史資料庫」。希望能讓歷史資料、資訊和知識的儲存、管理、應用及交流更具效益,進一步能整合研究資源,並建立文字、聲音及影像等不同媒體數位化結合的表現形式,以促進歷史文化產業升級與輔助教學。簡言之,「國家歷史資料庫」的建構,其目標有五:

(一)普及歷史知識,深化國家意識。

(二)輔助歷史教學。

(三)提供豐富的研究資訊,並進而形塑新的歷史研究方法。

(四)改變歷史的書寫與展現模式,並有助於國史修纂工作之推動。

(五)促進歷史文化產業升級。


  • 2.2 計畫參與人員

v 中研院資訊所:莊庭瑞副所長(計畫主持人)

v 國史館:簡笙簧處長、吳淑鳳、許瑞浩、曾品滄、張世瑛、林正慧、陳世婷、邱嬋娟、余佩真、郭婉玲、陳瑋全、李立敏、黃斌峰

v 數位典藏國家型科技計畫後設資料工作組:陳亞寧、陳淑君、王智豐、陳雅惠、沈漢聰(功能書撰寫者))

藏品單元層級關係圖與說明

6134.3. 藏品單元層級關係圖與說明.jpg


藏品單元群組關係圖與說明

6134.4. 藏品單元群組關係圖與說明.jpg


後設資料欄位需求架構與著錄規範

此份後設資料需求架構是主題計畫蔣經國總統文物-檔案系列特性之內涵需求,其目的在於讓主題計畫參與同仁確認建檔時之資訊,包含:後設資料的項目名稱欄位、欄位定義與著錄規範,並供日後系統設計人員參考之用。

(一) & EAD Header(EAD標目)及Front Matter(前面事項)

6134.5. 後設資料欄位需求架構與著錄規範.jpg
(二)<archdesc>Archival Description
6134.5. 後設資料欄位需求架構與著錄規範2.gif
6134.5. 後設資料欄位需求架構與著錄規範3.gif
6134.5. 後設資料欄位需求架構與著錄規範4.gif
6134.5. 後設資料欄位需求架構與著錄規範5.gif
6134.5. 後設資料欄位需求架構與著錄規範6.gif
6134.5. 後設資料欄位需求架構與著錄規範7.gif

著錄範例

依上述之後設資料需求架構所填寫之著錄範例如下所示:

  • 6.1 著錄範例(一)撰述全文:名詞解釋經安會
6134.6.1 著錄範例.gif
6134.6.1 著錄範例2.gif
6134.6.1 著錄範例3.gif
  • 6.2 著錄範例(二)影音:照片
6134.6.2 著錄範例.gif
6134.6.2 著錄範例2.gif
6134.6.2 著錄範例3.gif
6134.6.2 著錄範例4.gif
6134.6.2 著錄範例5.gif
6134.6.2 著錄範例6.gif
6134.6.2 著錄範例7.gif
  • 6.3.2 檔案全文
6134.6.3.2 檔案全文.gif
6134.6.3.2 檔案全文2.gif
6134.6.3.2 檔案全文3.gif

後設資料國際標準之應用

為數位典藏國家型科技計畫之主題計畫後設資料與國際後設資料標準接軌之重要依據,作為主題計畫與國際間或國內其他主題計畫進行XML資料交換時,彼此互通之基礎。「6.後設資料國際標準之應用」共包含三部份:

7.1 建議採用之標準

7.2 實際應用情形

7.3 國際標準對照表

7.3.1 EAD Mapping

7.3.2 DC Mapping


  • 7.1 建議採用之標準

在資料結構的描述標準上,本工作組建議採用EAD (Encoded Archival Description),主要原因為(1) EAD是針對檔案資料結構描述而發展的標準,具階層性的架構;同時,(2) EAD獲多項國外大型圖書館及檔案計畫採用;另外,(3) 國史館為我國國家檔案典藏機構,此計畫為檔案類型資料。在適用性的考量及評估下,建議採用此標準。

EAD是由由美國檔案 學會的檔案描述編碼格式工作小組負責更新及編輯,主要的目標描述檔案的內容、典藏狀況、組織及層級結構等。EAD官方網站URL: http://www.loc.gov/ead/

  • 7.2 EAD標準實際應用情形

為協助主題計畫了解其後設資料應用國際標準(EAD)之情形,後設資料工作組研製完成此份分析比對表,提供主題計畫參考。EAD Tag Library的元素依字母順排列,共計146個,各元素中又有其適用的各種屬性。EAD元素與屬性的結構方式是依使用者的需求而訂,各元素與屬性的使用與層級並沒有一定的限制,除了極少數EAD DTD中指定必備者,EAD並未設定核心元素,或對元素與屬性進行其他類似的權重評價。

以下共有兩份比對表格,第一份「EAD-國家歷史資料庫—戰後臺灣的初期發展(1945-1954)」為以EAD架構為主,將EAD後設資料元素置於左方,以方便看出各層級使用狀況;第二份比對表「國家歷史資料庫—戰後臺灣的初期發展(1945-1954)-EAD SGML編碼」為以國家歷史資料庫—戰後臺灣的初期發展(1945-1954)為主,將國家歷史資料庫—戰後臺灣的初期發展(1945-1954)之元素置於左方,以方便看出所使用的EAD元素及SGML編碼,並方便未來進行資料交換及轉出。

  • 7.2.1 EAD-國家歷史資料庫—戰後臺灣的初期發展(1945-1954)

比對說明

  1. 下表EAD之架構,為本工作組根據EAD Tag Library 中各元素之定義及說明所整理出來,非EAD官方發佈之架構。
  2. 粗體標示者為RLG(Research Libraries Group,美國研究圖書館組織)建議最少量使用元素。
  3. 「※」標示者,表該元素為EAD建議必備元素。
6134.7.2.1 EAD-國家歷史資料庫.jpg
6134.7.2.1 EAD-國家歷史資料庫2.jpg
6134.7.2.1 EAD-國家歷史資料庫3.jpg
6134.7.2.1 EAD-國家歷史資料庫4.jpg
6134.7.2.1 EAD-國家歷史資料庫5.jpg
6134.7.2.1 EAD-國家歷史資料庫6.jpg
  • 7.2.2 國家歷史資料庫—戰後臺灣的初期發展(1945-1954)-EAD SGML 編碼

1. <eadheader> & <frontmatter> EAD Header(EAD標目)及Front Matter(前面事項)

6134.7.2.2 國家歷史資料庫1.jpg
6134.7.2.2 國家歷史資料庫2.jpg
6134.7.2.2 國家歷史資料庫3.jpg
6134.7.2.2 國家歷史資料庫4.jpg
6134.7.2.2 國家歷史資料庫5.jpg
6134.7.2.2 國家歷史資料庫6.jpg
  • 7.3 國際標準對照表

DC是由The Dublin Core Metadata Initiative(DCMI)所研發,為一組具簡單性、普遍性、延展性、國際性的後設資料元素,用以描述廣泛的網路資源,作為跨學科領域資源分享的交換格式。透過DC與EAD之應用及比對,不同典藏機構可以達到彼此交換、共享典藏品資訊之目標;也是數位典藏國家型科技計畫聯合目錄(http://catalog.ndap.org.tw/System/) 所採用之互通依據。

目前檔案主題小組所建置中的「檔案聯合檢索」平台,所使用的互通依據則為「檔案核心元素」(92/8/8檔案主題小組第二次討論會中公佈,目前為v1.2版)作為互通之依據;未來則會透過檔案核心元素轉出聯合目錄所需之資料。因此下列比對表中,亦加入檔案核心元素的比對,以順利進行各方面的接軌。

註:「檔案核心元素」中,灰色網底為必填元素

6134.7.3 國際標準對照表.jpg
6134.7.3 國際標準對照表2.jpg

系統說明

  • 8.1 系統目標

系統主要功能有二,一為提供後端詮釋資料輸入及系統管理之相關功能,一為於前端網站上提供民眾瀏覽查詢功能。前端網站上瀏覽查詢功能包含:使用者可依作品類別、人物與團體、時代、地區、及資料庫等分類作關鍵字邏輯運算查詢,查詢結果採圖文式排列,依名稱或年代加以排序顯示。


  • 8.2 系統範圍

(一) 資料庫建置:包含資料庫架構分析與建置、數位化典藏品後設資料(Metadata)的分析與建置。此資料庫預估將涵蓋約1000萬字量的各式文字檔案和約1000件的各式圖像檔案。

(二) 整體資訊管理:包含資訊檢索系統、維護管理系統,以及後續資料在新增、修改和刪除的線上與批次作業的管理者介面。

(三) 一般使用介面:供一般使用者瀏覽使用的內容網站之規劃。


資料結構表

  • 9.1 需求欄位建置表

本需求欄位建置表主要是把主題計畫所提出的需求欄位經系統化、架構化與後設資料標準化之後,並列成單表供系統開發人員建置資料庫時設定欄位所用,同時也供程式設計人員在撰寫程式時參考使用。需求欄位建置表之各項說明如下:

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 英文名稱:項目名稱對應的英文名稱。

v 資料型態:著錄資料之資料型態。包括:

u Int 存放純數字型態的資料。

u Float存放浮點數型態的資料。

u Varchar、Text 存放純文字型態的資料。

v 大小:欄位所需之空間,以byte為單位。一個英文字元或一個阿拉伯數字需用一個byte表示,而一個中文字元則需兩個byte表示。

6134.9.1 需求欄位建置表.jpg
6134.9.1 需求欄位建置表2.gif
  • 9.2 需求欄位屬性表

需求欄位屬性表主要是把主題計畫之需求欄位的屬性彙集整理,並列成表單供系統建置人員參考使用.需求欄位屬性表之各項說明如下:

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 必填:標示「*」者表示為必填欄位,建檔時需填寫該欄位之值,不能空白。

v 多值:標示「◎」者表示為多值欄位,該組欄位資料可重複著錄。

v 屬性:標示該欄位的屬性,包括:

n 「唯一」表示欄位的值在資料庫中是唯一存在的。

n 「下拉式選單」表示著錄方式為下拉式的選單。

n 「關聯下拉式選單」表示該欄位與某他欄位形成二維下拉式選單,其選單代碼會因關聯欄位值之改變而變化。

n 「下拉式選單與自行填寫」表示此欄位同時需下拉式選單與自行填寫兩種著錄格式。

n 「單選選項選單」表示以點選radio button的方式進行資料著錄。

n 「單選選項選單與自行填寫」表示此欄位同時需建置radio button與自行填寫兩種著錄格式。

n 「複選項選單與自行填寫」表示此欄位同時需建置check box與自行填寫兩種著錄格式。

n 「固定值」表示由系統產生一個固定值,且著錄人員無法變更此值。

n 「預設值」表示由系統產生一個預設值,著錄人員可以變更此值。

n 「系統自動產生」表示該欄位的值是由系統自動產生,非由著錄人員著錄。

n 「link」表示該欄位需連結外部資料庫。

v 提供者:記錄這筆資料是由系統自動產生或由填表人所填入。

6134.9.2 需求欄位屬性表.jpg
6134.9.2 需求欄位屬性表2.gif


代碼表

6134.10. 代碼表.jpg


功能需求說明

  • 11.1 系統功能說明

系統可將「典藏號」作為主鍵元素,其架構格式如下:

全宗號+副全宗號+系列號+宗號+卷號+件號

三碼阿拉伯數字+二碼阿拉伯數字+二碼阿拉伯數字+三碼阿拉伯數字+三碼阿拉伯數字+三碼阿拉伯數字

如:9010101001014017


  • 11.2 建檔功能說明

著錄人員要進行紀錄建檔時,進入著錄介面之前需經過身份的確認,著錄人員必須輸入自己的姓名與密碼,方可登入Metadata系統進行建檔,系統需記錄建檔人姓名與建檔時間。同樣的,當著錄人員需修改紀錄內容時,也需經過身份的確認,藉由確認的動作可知該筆記錄是經由誰人所修改,系統亦需記錄修改人姓名與修改時間。系統不需記錄每次的修改資訊,只需記錄最近一次的修改資訊即可。


  • 11.3 查詢功能說明

關鍵字查詢係指系統會對下列表單「關鍵字查詢欄位」中所有標示「○」欄位作查詢,檢索所有欄位資料是否符合使用者提出的關鍵字。而進階查詢則可以對下列表單「進階查詢欄位」中標示「●」的個別欄位作獨立查詢。在關鍵字查詢方面,使用者可以對下列表單「關鍵字查詢欄位」中有「○」者作出關鍵字查詢,若有符合之結果,則依照「簡要顯示款目欄位」中有「△」者顯示列表回應給使用者。在進階查詢方面,使用者也可以對下列表單「進階查詢欄位」中有「●」者作出進階查詢查詢,符合之結果也是先依照「簡要顯示款目欄位」中有「△」者顯示列表回應給使用者,使用者也可進一步點選作詳細款目的查詢,系統依「詳細顯示款目欄位」中有「▲」者顯示列表供使用者瀏覽。

經由「關鍵字查詢」或「進階查詢」得到之「簡要顯示款目」結果,可提供使用者依「檢索結果排序欄位」進行所需要的排序。

  • 1. 使用者檢索
6134.11.3 查詢功能說明.jpg
6134.11.3 查詢功能說明2.jpg
  • 2. 使用者檢索
6134.11.3 2. 使用者檢索.jpg
6134.11.3 2. 使用者檢索2.jpg
6134.11.4 系統使用群組與其使用功能表單.jpg


國家歷史資料庫查詢系統

12.1 首頁

6134.12.1 首頁.jpg

12.2 進階查詢介面

6134.12.2 進階查詢介面.jpg

12.3 檔案及專書全文著錄介面

6134.12.3 檔案及專書全文著錄介面.jpg


工作進度紀錄檔

6134.13. 工作進度紀錄檔.gif


參考資料

參與研發單位:技術研發分項計畫-後設資料工作組、中央研究院-資訊所、國史館

提供單位:國史館

使用單位:國史館