檔案類:楊雲萍文書後設資料功能需求書(原 6-1-37 )

出自 TELDAP
前往: 導覽搜尋

前言

  • 1.1 後設資料功能需求書

本份「Metadata功能需求書」主要是作為主題計畫提出功能需求之彙整、後設資料工作組分析結果之發表與提供系統開發人員快速建置系統的相關資訊。

對主題計畫而言,本份需求書主要彙集了主題計畫提出的兩部份需求,一部份為metadata之需求,另一部份為系統之功能需求。在metadata需求的部份,主題計畫提出藏品單元之間層級與群組關係的連接需求、後設資料欄位架構著錄需求等;而在系統功能需求的部份,主題計畫則提出了需求欄位之必填性、多值欄、著錄形式等需求,此外,也提出了有關資料建檔、紀錄查詢與權限管控方面的系統需求。

對後設資料工作組而言,分析人員會依據主題計畫提出之藏品單位層級、群組關位與後設資料欄位需求遵循標準的作業流程來進行相關的內涵分析與標準比對,並與主題計畫往返確認分析結果,最後呈現在本份需求書上。

對系統建置人員來說,我們希望本份「Metadata功能需求書」能提供系統人員足夠的資訊,包括資料庫的建置欄位、欄位的大小與資料型態、欄位層性等,讓系統建置人員能夠快速建設主題計畫所需之資料庫。此外,本書也收錄了主題計畫資料建檔的流程、著錄介面需求等,讓系統建置人員除了可快速建置資料庫之外,也能快速設計一套web-based的資料庫操作介面,在最短的時間內提供主題計畫最健全的系統雛形。需特別說明的是,本份「Metadata功能需求書」之 8.系統說明 之11.功能需求說明僅以工作表單的形式調查出主題計畫對系統的初步需求,後設資料工作組分析人員並不針對系統的需求作更進一步的分析。有關系統分析的工作留待系統建置人員建置系統期間與主題計畫確認清楚。


  • 1.2 後設資料內涵、系統分析流程
6140.1.2 後設資料內涵、系統分析流程.jpg
圖1:後設資料(Metadata)生命週期作業模式

(一)需求訪談

需求訪談的目的是為了解主題計畫典藏品的內容,及其著錄上的需求和呈現需求。為將主題計畫的需求更具體化和結構化方式表達,本組會請主題計畫填寫「後設資料工作表單」。為便於主題計畫明瞭所要填寫的內容,本組亦提供「後設資料工作表單填表說明」供主題計畫填寫參考。

(二)工作表單說明與填寫

本部分將以書畫、器物、拓片、魚類、明清檔案等六類主題計畫回填表單(皆為pdf檔)為例,說明後設資料工作表單填寫的方式與內容。其中並提供後設資料工作組和故宮書畫處的晤談表。

(三)計畫需求與屬性分析

在主題計畫填寫工作表單的同時,本組開始進行藏品內涵屬性分析、內涵結構分析以及關連分析。最後本組會提出欄位調整與建議給主題計畫參考。

(四)計畫相關標準觀察與分析

在進行主題計畫藏品屬性分析的同時,本組也會觀察國際上通用的後設資料標準,並和主題計畫的後設資料進行分析比較。

(五)回填工作表單的初步分析

後設資料分析人員在接獲主題計畫回傳之工作表單後,即進行初步的分析,包括工作表單填寫的正確性與完整性。

(六)後設資料標準比對、評估、採用及調整分析與建議

接著,本組會將主題計畫的欄位與後設資料標準進行比對;對標準應用於計畫的適用性提出評估;最後提出分析與建議。

(七)Metadata功能需求書

在與主題計畫完成相關的分析與建議確認後,本組分析人員即把分析的成果撰寫在「Metadata 功能需求書」。

主題計畫計畫簡介

  • 2.1 計畫說明與目標

楊雲萍先生本名楊友濂,因以「士林雲萍生」一名於臺灣民報發表文章,自此遂以「雲萍」之名著於世,因而本藏以「雲萍文書」為名。

雲萍先生為日據時期臺灣文學舉足輕重之名家,開臺灣白話文學之先河,其後更跨足於史學研究,為文史雙棲之哲人。

本藏數量約1000多件,主要為雲萍先生往來信件,藏品年代約始於昭和4年,直到民國70年左右。所藏之往來信件尤以日據時期,與文友西川滿、金關丈夫、立石鐵臣和林獻堂等私人信函,甚為珍貴,得以窺見日據背景之下文學家結社之實況;此外,與臺灣時報、奉公會、總督府等信函,更提供了當時文人之處境與時代背景等資訊。因此,本藏對於臺灣文學史或日據時期臺灣史,是十分重要之一手資料。

本計畫將所藏之書信數位化,建置資料庫,並期與雲萍先生年表結合,希望能將文書典藏與時代歷史相結合。


  • 2.2 計畫參與人員

v 楊雲萍文書:許雪姬研究員、崔燕惠編審、馬千惠、顏頌文

v 數位典藏國家型科技計畫後設資料工作組:陳亞寧、陳淑君、王智豐、鍾豐謙

藏品單元層級關係圖與說明

6140.3. 藏品單元層級關係圖與說明.gif

說明:

  1. 全宗下共劃分為六個系列,除「雲萍個人收藏」系列有「副系列」層級之外,其他系列的下一層級皆為「卷」。
  2. 每一系列下有多個「卷」,每卷下有多個「件」。
  3. 每一「件」中又包含多組「篇章」欄位。

藏品單元群組關係圖與說明

6140.4. 藏品單元群組關係圖與說明.gif

說明:

如圖示,「件」+「篇章」為一整體。如信件類資料包含親筆信一張、照片一張;則親筆信及照片皆視為「篇章」。

以林獻堂所寄信函及相關文件為例─

6140.4. 藏品單元群組關係圖與說明2.gif


後設資料欄位需求架構與著錄規範

此份後設資料需求架構是主題計畫印章藏品特性之內涵需求,其目的在於讓主題計畫參與同仁確認建檔時之資訊,包含:後設資料中英文欄位、欄位定義、著錄規範,並供日後系統設計人員參考之用。

6140.5. 後設資料欄位需求架構與著錄規範.jpg
6140.5. 後設資料欄位需求架構與著錄規範2.jpg
6140.5. 後設資料欄位需求架構與著錄規範3.jpg
6140.5. 後設資料欄位需求架構與著錄規範4.jpg
6140.5. 後設資料欄位需求架構與著錄規範5.jpg
6140.5. 後設資料欄位需求架構與著錄規範6.jpg
6140.5. 後設資料欄位需求架構與著錄規範7.jpg

著錄範例

依上述之後設資料需求架構所填寫之著錄範例,共有兩則。其中全宗為共用,僅需著錄一次。範例如下—

6140.6. 著錄範例.jpg
  • 6.1 範例一:林獻堂邀楊雲萍至高義閣相談之信函(昭和4年10月18日)
6140.6.1 範例一.jpg
6140.6.1 範例一2.jpg
6140.6.1 範例一3.jpg
6140.6.1 範例一4.jpg
6140.6.1 範例一5.jpg
6140.6.1 範例一6.jpg
6140.6.1 範例一7.jpg
6140.6.1 範例一8.jpg
  • 6.2 範例二:臺灣時報編輯部邀稿明信片(昭和15年12月6日)
6140.6.2 範例二.jpg
6140.6.2 範例二2.jpg
6140.6.2 範例二3.jpg
6140.6.2 範例二4.jpg
6140.6.2 範例二5.jpg
6140.6.2 範例二6.jpg

後設資料國際標準之應用

為數位典藏國家型科技計畫之主題計畫後設資料與國際後設資料標準接軌之重要依據,作為主題計畫與國際間或國內其他主題計畫進行XML資料交換時,彼此互通之基礎。「7、後設資料國際標準之應用」共包含三部份:

7.1 建議採用之標準

7.2 實際應用情形

7.3 國際標準對照表

(1) EAD Mapping

(2) DC Mapping

  • 7.1 建議採用之標準

在資料結構的描述標準上,本工作組建議採用EAD(Encoded Archival Description),主要原因為(1)EAD是針對檔案資料結構描述而發展的標準,具階層性的架構;同時,(2)EAD獲多項國外大型圖書館及檔案計畫採用;另外,(3)目前國內許多的檔案館相關機構,如國史館、國史館臺灣文獻館、中研院近代史研究所等,皆採用此標準。由適用性及資料交換的考量及評估下,建議採用此標準。另外,本工作組也以ISAD(G) (General International Standard Archival Description)、MAD (Manual of Archival Description)作為檔案描述中資料內容的描述的參照標準。

EAD是由由美國檔案學會的檔案描述編碼格式工作小組負責更新及編輯,主要的目標描述檔案的內容、典藏狀況、組織及層級結構等。EAD官方網站URL: http://www.loc.gov/ead/。


  • 7.2 EAD標準實際應用情形

為協助主題計畫了解其後設資料應用國際標準(EAD)之情形,後設資料工作組研製完成此份分析比對表,提供主題計畫參考。EAD Tag Library的元素依字母順排列,共計146個,各元素中又有其適用的各種屬性。EAD元素與屬性的結構方式是依使用者的需求而訂,各元素與屬性的使用與層級並沒有一定的限制,除了極少數EAD DTD中指定必備者,EAD並未設定核心元素,或對元素與屬性進行其他類似的權重評價。

此份比對表將EAD後設資料元素置於左方,主題計畫所採用的元素,依層級列於右方,以方便看出各層及使用狀況。「臺灣省諮議會及中研院臺史所史料典藏數位化計畫:楊雲萍文書」共採用41個EAD元素。

比對說明:

  1. 下表EAD之架構,為本工作組根據EAD Tag Library 中各元素之定義及說明所整理出來,非EAD官方發佈之架構。
  2. 粗體標示者為RLG(Research Libraries Group,美國研究圖書館組織)建議最少量使用元素。
  3. 「※」標示者,表該元素為EAD建議必備元素。

4. 比對表中,主題計畫元素中,以括弧「( )」標示者,如p29頁之(參考/引用文獻),表示此為主題計畫需求元素表中之描述元素區段名稱;雖非實際使用之元素,但在EAD中需用來作為某元素支元素值,以作為該描述元素區段資料的標題。

6140.7.2 EAD.jpg
6140.7.2 EAD2.jpg
6140.7.2 EAD3.jpg
6140.7.2 EAD4.jpg
6140.7.2 EAD5.jpg
6140.7.2 EAD6.jpg
6140.7.2 EAD7.jpg
6140.7.2 EAD8.jpg
  • 7.3 Dublin Core比對表

DC是由The Dublin Core Metadata Initiative(DCMI)所研發,為一組具簡單性、普遍性、延展性、國際性的後設資料元素,用以描述廣泛的網路資源,作為跨學科領域資源分享的交換格式。透過DC與EAD之應用及比對,不同典藏機構可以達到彼此交換、共享典藏品資訊之目標;也是數位典藏國家型科技計畫聯合目錄(http://catalog.ndap.org.tw/System/) 所採用之互通依據。

目前檔案主題小組所建置中的「檔案聯合檢索」平臺,所使用的互通依據則為「檔案核心元素」(92/8/8檔案主題小組第二次討論會中公佈,目前為v1.2版)作為互通之依據;未來則會透過檔案核心元素轉出聯合目錄所需之資料。因此下列比對表中,亦加入檔案核心元素的比對,以順利進行各方面的接軌。

註:「檔案核心元素」中,灰色網底為必填元素

6140.7.3 Dublin.jpg
6140.7.3 Dublin2.jpg
6140.7.3 Dublin3.jpg
6140.7.3 Dublin4.jpg
6140.7.3 Dublin5.jpg

系統說明

  • 8.1 系統目標
  1. 著錄系統需具有新增、查詢、修改、刪除、複製等維護功能。
  2. 需與人名權威、機關團體權威連結。


  • 8.2 系統範圍
  1. 就計畫執行人員而言,此系統需具有資料的著錄建置、維護等基本功能,針對使用者,滿足其檢索、調閱影像全文的需要。
  2. 「雲萍文書數位典藏系統」與各權威檔所提供的資訊,互相連結、補充。
  3. 年表查詢系統建置,將雲萍個人年表與資料庫資料串結,提供欄位檢索之外的查詢機制。

資料結構表

  • 9.1 需求欄位建置表

本需求欄位建置表主要是把主題計畫所提出的需求欄位經系統化、架構化與後設資料標準化之後,並列成單表供系統開發人員建置資料庫時設定欄位所用,同時也供程式設計人員在撰寫程式時參考使用。需求欄位建置表之各項說明如下:

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 資料型態:著錄資料之資料型態。包括:

n Int 存放純數字型態的資料。

n Float存放浮點數型態的資料。

n Varchar、Text 存放純文字型態的資料。

v 大小:欄位所需之空間,以byte為單位。一個英文字元或一個阿拉伯數字需用一個byte表示,而一個中文字元則需兩個byte表示。

6140.9.1 需求欄位建置表.jpg
6140.9.1 需求欄位建置表2.jpg
6140.9.1 需求欄位建置表3.jpg
6140.9.1 需求欄位建置表4.jpg
6140.9.1 需求欄位建置表5.jpg
6140.9.1 需求欄位建置表6.jpg
  • 9.2 需求欄位屬性表

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 必填:標示「*」者表示為必填欄位,建檔時需填寫該欄位之值,不能空白。

v 多值:標示「◎」者表示為多值欄位,該組欄位資料可重複著錄。

v 屬性:標示該欄位的屬性,包括:

n 唯「一」表示欄位的值在資料庫中是唯一存在的。

n 「下拉式選單」表示著錄方式為下拉式的選單。

n 「關聯下拉式選單」表示該欄位與某他欄位形成二維下拉式選單,其選單代碼會因關聯欄位值之改變而變化。

n 「下拉式選單與自行填寫」表示此欄位同時需下拉式選單與自行填寫兩種著錄格式。

n 「單選選項選單」表示以點選radio button的方式進行資料著錄。

n 「單選選項選單與自行填寫」表示此欄位同時需建置radio button與自行填寫兩種著錄格式。

n 「複選項選單與自行填寫」表示此欄位同時需建置check box與自行填寫兩種著錄格式。

n 「固定值」表示由系統產生一個固定值,且著錄人員無法變更此值。

n 「預設值」表示由系統產生一個預設值,著錄人員可以變更此值。

n 「系統自動產生」表示該欄位的值是由系統自動產生,非由著錄人員著錄。

n 「link」表示該欄位需連結外部資料庫。

v 提供者:記錄這筆資料是由系統自動產生或由填表人所填入

6140.9.2 需求欄位屬性表.jpg
6140.9.2 需求欄位屬性表2.jpg
6140.9.2 需求欄位屬性表3.jpg
6140.9.2 需求欄位屬性表4.jpg
6140.9.2 需求欄位屬性表5.jpg
6140.9.2 需求欄位屬性表6.jpg

代碼表

6140.10. 代碼表.jpg

功能需求說明

  • 11.1 系統功能說明

系統使用群組與其使用功能表單

6140.11.1 系統功能說明0.jpg

系統主鍵元素

1. 可將各層次之識別號(全宗號、系列號、副系列號、卷號、件號)作為系統主鍵元素

其架構如下:

6140.11.1 系統功能說明.jpg

2. 建檔時若出現相同的識別號時,系統須提示建檔者有重複的著錄值,請建檔者再作確認,但不可拒絕建檔。


  • 11.2 建檔功能說明
  1. 著錄人員要進行紀錄建檔時,進入著錄介面之前需經過身分的確認,著錄人員必須輸入自己的姓名與密碼,方可登入Metadata系統進行建檔,系統需記錄建檔人姓名與建檔時間。
  2. 當記錄建檔畢時,需由不同人員進行核對,核對人員必須輸入自己的姓名與密碼,方可登入Metadata系統進行核對,系統需記錄核對人姓名與建檔時間。
  3. 當著錄人員需修改紀錄內容時,也需經過身分的確認,藉由確認的動作可知該筆記錄是經由誰人所修改,系統亦需記錄修改人姓名與修改時間。系統不需記錄每次的修改資訊,只需記錄最近一次的修改資訊即可。


  • 11.3 查詢功能說明

關鍵字查詢係指系統會對下列表單「關鍵字查詢欄位」中所有標示「○」欄位作查詢,檢索所有欄位資料是否符合使用者提出的關鍵字。而進階查詢則可以對下列表單「進階查詢欄位」中標示「●」的個別欄位作獨立查詢。在關鍵字查詢方面,使用者可以對下列表單「關鍵字查詢欄位」中有「○」者作出關鍵字查詢,若有符合之結果,則依照「簡要顯示款目欄位」中有「△」者顯示列表回應給使用者。在進階查詢方面,使用者也可以對下列表單「進階查詢欄位」中有「●」者作出進階查詢查詢,符合之結果也是先依照「簡要顯示款目欄位」中有「△」者顯示列表回應給使用者,於下表中標示「□」者可以對欄位進行排序。使用者也可進一步點選作詳細款目的查詢,系統依「詳細顯示款目欄位」中有「▲」者顯示列表供使用者瀏覽。

6140.11.3 查詢功能說明.jpg
6140.11.3 查詢功能說明2.jpg
6140.11.3 查詢功能說明3.jpg
6140.11.3 查詢功能說明4.jpg
6140.11.3 查詢功能說明5.jpg
6140.11.3 查詢功能說明6.jpg

工作進度記錄檔

6140.12. 工作進度記錄檔.gif
6140.12. 工作進度記錄檔2.gif

附件一:雲萍文書層級劃分調整

一、層級調整一覽

6140.附件一.jpg

註:07/26 MAAT於內涵分析報告中提出檔案類型資料慣用之層級名稱;主題計畫於07/27回傳之元素調整建議中確認採用。

二、層級資料劃分建議

原為07/26提出「楊雲萍文書內涵分析與結構建議報告」之附件一。

6140.附件一2.jpg
6140.附件一3.jpg

註1:「其他個人函件」及「其他機構函件」會依年代再區分為2~3個,如「其他機構(昭和16年至昭和20年)」與「其他機構(昭和16年至昭和20年)」與「其他機構(民國35年至民國74年)」。

附件二:元素調整過程

■ 元素調整建議建議一覽表

6140.附件二.jpg

說明:

  1. 07/26 MAAT與臺史所進行第一次討論所提出之「元素調整建議中07/23」中,建議新增全宗層級。並於原來的各層級名稱後以括號「()」標示檔案慣用之層級名稱。臺史所於07/27回傳之元素調整建議中更改為檔案慣用之層級名稱。
  2. 07/26討論會議中,MAAT並針對原層級劃分方式提出建議,亦獲臺史所採用。
  3. 已刪除元素或元素位置調整之空欄位,以灰色網底標識。
6140.附件二2.jpg

■ 系列 (原使用名稱為[集叢])

6140.附件二3.jpg

■ 副系列 (原使用名稱為[附屬集叢]

6140.附件二4.jpg
6140.附件二5.jpg
6140.附件二6.jpg

註:07/23建議之欄位建議,原建議將「頁」層級欄位刪除;但主題計畫仍有此需求,故08/04回傳之欄位調整建議中,原將「頁」描述欄位併於此層級中。後仍決定另外列表。故此處為節省版面空間,不將此次原列於「件」層級之頁描述欄位列出,而仍列於下表「篇章」描述欄位中。


■ 篇章(原使用名稱為[頁次])

說明:

  1. MAAT於07/26提出之欄位調整建議中,原建議將「頁」層級刪除;主題計畫於08/04回傳之欄位確認中,因仍有頁層次描述需求,故建議將「頁」的描述欄位整合於「件」層級中。為節省版面篇幅,並方便閱覽欄位調整及變遷,仍將8/4之欄位列於「篇章」層級(原「頁」層級)表格中。
  2. MAAT於08/12提出之「頁層級欄位建議」報告中,針對此層級提出建議,並將原使用名稱-「頁次」,更名為「篇章資訊」。
  3. 此層級為「件」之附屬描述層級,而非獨立之描述層級,故無管理資訊欄位。
6140.附件二7.jpg
6140.附件二8.jpg

參考資料

參與研發單位:中央研究院-計算中心-後設資料工作組、中央研究院-臺史所

提供單位:中央研究院-計算中心-後設資料工作組

使用單位:中央研究院-臺史所