人名權威檔:國史館人名權威檔後設資料需求規格書(原 6-1-45 )

出自 TELDAP
前往: 導覽搜尋

計畫簡介與說明

國史館檔案數位化「人名權威控制系統」計畫的建置是因應國史館參加數位典藏國家型計畫的國民政府檔案、蔣中正總統檔案及照片等,檔案中所涉及的多數為民國時期人物,為周延建置民國時期人物的人名權威控制,以此期望能便利讀者檢索民國時期人物權威參考資料。


計畫參與人員

v 國史館:朱文原、廖運尚、葉美珠、徐素瑾

v 數位典藏國家型科技計畫後設資料工作組:陳亞寧、陳淑君、張怡婷、沈漢聰(需求規格書撰寫者)


後設資料需求規格書範圍與進度限制

本份需求規格書係依據國史館於91年7月11日回傳之國史館檔案數位化「人名權威控制系統」計畫-人名權威檔後設資料需求規格書version 0.2確認結果,修改完成此份正式版。


需求欄位總表

本需求欄位總表主要是把主題計畫專家的需求經系統化,並列成單表供系統開發人員建置資料庫時設定欄位所用,同時也供程式設計人員在撰寫程式時參考使用。需求欄位總表之各項說明如下:

v 項目名稱:主題計畫專家所需著錄項目之中文名稱。

v 英文名稱:項目名稱對應之英文名稱。

v 資料型態:著錄資料之資料型態。包括:

n Int 存放純數字型態的資料。

n Varchar 、Text 存放純文字型態的資料。

v 大小:欄位所需之空間,以byte 為單位。一個英文字元或一個阿拉伯數字需用一個byte 表示,而一個中文字元則需兩個byte 表示。

v 必填:標示「*」者表示為必填欄位,建檔時需填寫該欄位之值,不能空白。

v 多值:標示「◎」 者表示為多值欄位,該組欄位資料可重複著錄。

v 屬性:標示該欄位的屬性,包括:

n 「唯一」表示欄位的值在資料庫中是唯一存在的。

n 「不開放」表示該欄位只供管理者使用,不對外開放。

n 「下拉式選單」表示著錄方式為下拉式的選單。

n 「系統自動產生」表示該欄位的值由系統自動產生,非由著錄人員著錄。

v 提供者:記錄這筆資料是由系統自動產生或由填表人所填入。

6148.4. 需求欄位總表.jpg
6148.4. 需求欄位總表2.jpg


代碼表

6148.5. 代碼表.jpg

註1:出處之書目欄位,著錄時選擇書目名稱,在資料存放到資料庫之前,系統須先依所選擇之書目名稱轉換成Chicago 的書目格式,才存放到資料庫去。以下是書目名稱與Chicago 書目格式的轉換列表,其中粗體字部份是填入欄位資料:

6148.5. 代碼表2.gif

後設資料標準對照表

經過多次之考核與評估,國史館檔案數位化「人名權威控制系統」計畫之後設資料標準決定採用MARC standard。以下之列表為系統所需之欄位與MARC Standard 的mapping 結果:

6148.6. 後設資料標準對照表.jpg
6148.6. 後設資料標準對照表2.jpg


查詢功能需求

在權威控制方面,當輸入了欲檢索之姓名後,系統會按照使用者輸入之字串比對資料庫中的姓名欄位和異名姓名欄位,若有符合之結果,則把該結果回應給使用者。但對使用者與管理者而言,單單姓名之查核未盡嚴謹也未能完全滿足需求,因此以下表說明相關之查詢功能。功能註記說明:

I:查詢檢索的進入點與款目。

可作出查詢之欄位。

L:查詢結果的限制條件。

當出現多筆紀錄符合查詢之條件時,可利用L 欄位進一步之限制查詢,可與主查詢欄位組合成不設欄位的檢索。

A:提供權威查核。

資料著錄到資料庫前,先檢查A 欄位是否有重覆著錄該筆資料。

H:與其他系統資料庫結合應用

日後需連接到其他的資料庫,相關資訊已標示在需求欄位總表之屬性欄位。

D:紀錄顯示

符合查詢條件之結果,顯示D 欄位供使用者瀏覽。

S:標示與統計

需對S 欄位作出統計。

6148.7. 查詢功能需求.jpg
6148.7. 查詢功能需求2.jpg

註2:surname 與other names 合併新產生一個authority access table。

註3:出處之書目,在未來希望可以連結書目資料庫,直接提供讀者詳細之書目瀏覽。


Entities-Relationship Model

6148.8. Entities-Relationship Model.jpg
附:(書目資料為由書目代碼連結另一參考資料對照表推論而來的虛擬欄位,僅在瀏覽端藉由連結來呈現)
6148.8. Entities-Relationship Model2.jpg

E-R model 之說明:

  1. 本系統是由多筆『人物』這個實體的資料紀錄所組成的。『人物』這個實體的單值屬性(single-value entity)包含有「 紀錄編號」、「主要資料來源」、「姓名」、「統治者國別」、「生卒年」、「籍貫(出生地)」、「學歷」、「專長」和「一致性資源識別號」。其中,屬性「紀錄編號」是唯一且由系統利用遞增的方式所產生的。「姓名」可分為「姓」與「名」二個小屬性。而「生卒年」這個屬性是可以分為「西曆」一個較小的屬性。「籍貫」可分為「原名」、「今名」二個小屬性;「學歷」則可分為「年號」、「學歷」、「備註」三個小屬性。
  2. 除了上述所提到的單值屬性之外,『人物』也包含了一些多值屬性(multi-valued entity)如:、「異名」、「傳略」、「經歷」、「作品」和「關係人」。其中,「異名」可分為「名稱」、「出處」和「類別」三個較小的屬性;「傳略」也可分為「引文」和「出處」兩個小屬性;而「經歷」這個屬性是可以分為「經歷」、「任期」和「出處」;「作品」則能分為「作品」和「版本」這兩個小屬性;最後,「關係人」也可以分為「姓名」和「關係」兩個較小的屬性。
  3. 「出處」為「異名」、「傳略」、「職銜」的屬性之一,又可分為「書目代碼」、「卷冊號」、「頁次」三個小屬性及一個推論之虛擬屬性–「書目資料」,其推論方式是由書目代碼連結另一參考資料對照表推論而來的虛擬欄位,僅在瀏覽端藉由連結來呈現。
  4. 『籍貫(出生地)』原為『人物』的屬性之一,但因『籍貫』這個屬性必須連接到GIS 資料庫,故把此屬性獨立出來,把它視為一個實體,方便系統開發人員更加了解實體與實體間的關係(relationship of entities)。『籍貫』這個實體包含了兩個單值屬性,分別為「原名」與「今名」,其中「今名」可作為連接GIS 資料庫之索引值。
  5. 『影音資料館藏位置』原為『人物』的屬性之一,但因其不同之欄位性質,並為了可超連結系統中或網路上之個人影音資料,故把它視為一個實體。『影音資料館藏位置』為多值屬性,包含了「位置」、「檔名」、「副檔名」三個小屬性。『影音資料館藏位置』與『人物』的關係是多(N)對一(1)。
  6. 『歷史管理紀錄』因屬於管理端的資訊,因此獨立成為一個實體,方便系統開發人員了解其用處。『歷史管理紀錄』包含了三個單值屬性–「代碼」(primary key)、「建檔者」、「建檔時間」及二個多值屬性–「更新者」、「更新時間」。此實體之所有屬性資料皆由系統在執行中自動產生紀錄,「代碼」為主key,用來與同一「代碼」之『人物』實體做dependent of;「建檔者」為新增該筆之建檔人員名稱,由系統至「工作人員基本資料檔」摘錄資料;「建檔時間」則由系統自動記錄新增時之時間;「更新者」則記錄每一次更新的更新者名稱,亦由系統至「工作人員基本資料檔」摘錄資料;「更新時間」則由系統自動記錄每一次之更新時間。


實體間之關係型態

此系統包含了四個實體,分別為『人物』、『籍貫』、『影音資料』和『歷史管理紀錄』。實體與實體之間的關係型態茲分述如下:

  1. 『人物』與『籍貫』之間是1:1 的關係型態。這表示說一個人只有一份對應之籍貫資料;一份籍貫資料只屬於一個人。
  2. 『人物』與『影音資料』之間是1:N 的關係型態,這表示說一個人有多份影音資料;有多份影音資料同屬一人。
  3. 『人物』與『歷史管理紀錄』之間是1:1 的關係型態。 這表示說一個人物的資料只有一份歷史管理紀錄。


系統功能需求說明

1. 歷史管理紀錄需求

1.1 建檔需求:

需求欄位總表中歷史管理紀錄之建檔者欄位與建檔日期欄位皆由系統自動產生:著錄人員進入著錄介面之前需經過身份的確認,藉由著錄人員輸入的姓名與密碼,系統自動把著錄人員之姓名存放到建檔者欄位,同時也把系統日期存放到建檔日期欄位。建檔者欄位與建檔日期欄位的資料是不可更修或刪除。

1.2 更新需求:

著錄人員具有對紀錄之新增、刪除、更新、查詢、列印與瀏覽之權限。當著錄人員需更新紀錄時,也須經過身份的確認。當 紀錄資料被更新,系統須自動把著錄人員之姓名存放到更新者欄位,同時把系統日期及時間存放到更新日期及時間欄位。每次的更新歷史紀錄都必須記錄起來,因此更新者欄位與更新日期及時間欄位為多值欄位。更新者欄位與更新日期及時間欄位的資料是不可更修的,但可整批刪除。

2. 工作人員基本資料檔

本計畫需建置一工作人員基本資料檔,用於管理所有工作人員之基本資料與系統使用權限。包含「工作人員名稱」、「工作人員系統代號」、「工作人員權限」、「工作人員所屬群組」、「工作人員所屬子群」、「工作人員密碼」、「密碼提示」與「備註」欄位。其中工作人員權限之權限層級分為「系統管理者」、「著錄者」與「瀏覽者」三種,各人之權限茲分述如下:

v 系統管理者:包含一切系統功能。

v 著錄者:包含對人物的新增、刪除、維護、查詢、列印、瀏覽

v 瀏覽者:僅能查詢與瀏覽。

3. 系統自動產生紀錄編號

紀錄編號係由系統所自動產生,其格式為:

6148.10. 系統功能需求說明.jpg

其中,「國史館代碼」共為4 碼,固定值為0230;「編目流水號」為不限定位元數,由系統自動產生。系統自1 開始依編目的流水號編碼。「主要資料來源代碼」共為4 碼,由「主要資料來源」欄位之值決定,下列為主要資料來源與其代碼之對照:

v 總統府侍從室檔案及總統府移轉之檔案,其代碼為“ 1 ” 。

v 國史館個人檔案,其代碼為“ 0 ” 。

v 國史館史籍全文資料庫、國史館現藏民國人物傳記史料彙編,其代碼為“ c ” 。

v 民國人物大辭典,其代碼為“ d ” 。

例如:

紀錄編號:0230-56-0 表示此筆紀錄是第56 筆建檔的紀錄,且其主要資料來源來自國史館個人檔案。

4. 下拉式選單代碼維護

主題計畫可自行新增、修改或刪除下拉式選單之代碼內容。

5. 統計與報表列印需求

主題計畫需對歷史管理紀錄部份的建檔者、建檔日期、更新者與更新日期及時間欄位作統計與報表列印需求,在進行統計或報表列印時,出現下列選項畫面供使用者選擇:

6148.10. 系統功能需求說明2.jpg

則表示要統計的量為劉大明這位著錄人員在2001 年10 月份所更新的筆數。

另外,系統必須提供主題計畫列印目前已建檔的紀錄功能。主題計畫著錄想要列印的紀錄編號範圍後,系統即可列印出該範圍的全部建檔紀錄供主題計畫人員進行校對確認。


後設資料需求規格書確認表單

6148.11. 後設資料需求規格書確認表單.jpg


參考資料

參與研發單位:技術研發分項計畫-後設資料工作組、國史館

提供單位:技術研發分項計畫-後設資料工作組

使用單位:國史館