人類學:台灣民族誌數位影音典藏計畫後設資料功能需求書(新增)

出自 TELDAP
前往: 導覽搜尋

前言

  • 1.1 後設資料功能需求書

本份「Metadata功能需求書」主要是作為主題計畫提出功能需求之彙整、後設資料工作組分析結果之發表與提供系統開發人員快速建置系統的相關資訊。

對主題計畫而言,本份需求書主要彙集了主題計畫提出的兩部份需求,一部份為metadata之需求,另一部份為系統之功能需求。在metadata需求的部份,主題計畫提出藏品單元之間層級與群組關係的連接需求、後設資料欄位架構著錄需求等;而在系統功能需求的部份,主題計畫則提出了需求欄位之必填性、多值欄、著錄形式等需求,此外,也提出了有關資料建檔、紀錄查詢與權限管控方面的系統需求。

對後設資料工作組而言,分析人員會依據主題計畫提出之藏品單位層級、群組關位與後設資料欄位需求遵循標準的作業流程來進行相關的內涵分析與標準比對,並與主題計畫往返確認分析結果,最後呈現在本份需求書上。

對系統建置人員來說,我們希望本份「Metadata功能需求書」能提供系統人員足夠的資訊,包括資料庫的建置欄位、欄位的大小與資料型態、欄位層性等,讓系統建置人員能夠快速建設主題計畫所需之資料庫。此外,本書也收錄了主題計畫資料建檔的流程、著錄介面需求等,讓系統建置人員除了可快速建置資料庫之外,也能快速設計一套web-based的資料庫操作介面,在最短的時間內提供主題計畫最健全的系統雛形。需特別說明的是,本份「Metadata功能需求書」之「8、系統說明」至「11、功能需求說明」僅以工作表單的形式調查出主題計畫對系統的初步需求,後設資料工作組分析人員並不針對系統的需求作更進一步的分析。有關系統分析的工作留待系統建置人員建置系統期間與主題計畫確認清楚。


  • 1.2 後設資料內涵、系統分析流程
6123.1.2 後設資料內涵、系統分析流程.jpg
圖1 後設資料(Metadata)生命週期作業模式

(一)需求訪談:

需求訪談的目的是為瞭解主題計畫典藏品的內容,及其著錄上的需求和呈現需求。為將主題計畫的需求更具體化和結構化方式表達,本組會請主題計畫填寫「後設資料工作表單」。為便於主題計畫明瞭所要填寫的內容,本組亦提供「後設資料工作表單填表說明」供主題計畫填寫參考。

(二)工作表單說明與填寫:

以表單填寫的方式有系統的引導主題計畫提出後設資料的各項需求,主要包括內涵與系統兩個層面的需求。除了提供填寫範例供主題計畫作為填寫參考之外,本工作組亦提供電話與電子郵件的填寫諮詢服務,以協助主題計畫順利提供需求。而完成後的工作表單定稿也是本工作組展開分析工作的重要依據。

(三)計畫需求與屬性分析:

在主題計畫填寫工作表單的同時,本組開始進行藏品內涵屬性分析、內涵結構分析以及關連分析。最後本組會提出欄位調整與建議給主題計畫參考。

(四)計畫相關標準觀察與分析:

在進行主題計畫藏品屬性分析的同時,本組也會觀察國際上通用的後設資料標準,並和主題計畫的後設資料進行分析比較。

(五)回填工作表單的初步分析:

後設資料分析人員在接獲主題計畫回傳之工作表單後,即進行初步的分析,包括工作表單填寫的正確性與完整性。

(六)後設資料標準比對、評估、採用及調整 分析與建議:

接著,本組會將主題計畫的欄位與後設資料標準進行比對;對標準應用於計畫的適用性提出評估;最後提出分析與建議。

(七)Metadata功能需求書

在與主題計畫完成相關的分析與建議確認後,本組分析人員即把分析的成果撰寫在「Metadata 功能需求書」。

主題計畫計畫簡介

  • 2.1 計畫說明與目標

《台灣民族誌數位影音典藏計畫》之數位化目標為中央研究院民族學研究所博物館收藏的一批極具特色的民族誌影音資料。這批資料主要是民族學研究所研究員胡台麗從1984年開始,長達二十餘年主持的各類研究計畫所採集的影音資料,包括不同規格之錄影帶和電影片約2000卷、錄音帶約300卷以及幻燈片約15000張,應是台灣人類學界迄今採集為數最多的一批珍貴民族誌影音資料。

這批由研究者於田野進行參與觀察及知識實踐期間所採集的一手影音資料涵蓋了台灣的各族群,有南島語系的原住民以及漢語系的閩南、客家和外省榮民之影音紀錄,充分呈現台灣文化的多樣性與豐富內涵,可據以研究和瞭解台灣各族群的傳統文化與現代變遷。

本計畫以錄影、電影和錄音帶資料的數位化為優先,依照研究暨展演計畫之性質分為「台灣土著祭儀歌舞」、「排灣族祭儀與傳說」、「賽夏族祭儀之變遷」、「排灣族鼻笛與口笛」、「原舞者採集與展演」、「民族誌紀錄片攝製」、「卑南族巫師與祭儀」、「阿美族祖屋之重建」、「台灣閩南與客家村」和「外省榮民口述歷史」等項目,在「數位典藏國家型科技計畫」支持下,從民國96年起逐年完成數位化之工作。民國97年預計進行下述第二項「排灣族祭儀與傳說研究計畫」影音資料之數位化。

本計畫是以影片(資料片,剪輯帶,紀錄片)為主角,第一步先進行影片類,其他藏品(照片類,文字類,錄音帶)所需的欄位現階段尚未明確,與計畫討論後,計畫表示希望能有一份表單可以著錄所有六類藏品(資料片、剪輯帶、紀錄片、照片類、文字類、錄音帶)。因此,中央研究院後設資料工作組織支援本計畫metadata是以「影片類」需求為支援範圍,盡量也考慮到照片類、文字類、錄音帶等藏品的需求一起設計,希望未來系統可以相容此六類藏品:資料片、剪輯帶、紀錄片、照片類、文字類、錄音帶。


  • 2.2 計畫參與人員
  1. 台灣民族誌數位影音典藏計畫:
    胡台麗老師、余盈君
  2. 數位典藏國家型科技計畫後設資料工作組:
    陳亞寧、陳淑君、城菁汝、鍾豐謙(功能需求書撰寫者)

藏品單元層級關係圖與說明

  • 「中央研究院 後設資料工作組」分析說明:
  1. 本系統有六種藏品類型,分別為資料片,剪輯帶,紀錄片,照片類,文字類,錄音帶。每類藏品之數位檔皆區分為「瀏覽級」與「典藏級」兩種,只有「文字類」藏品只有「瀏覽級」一種數位檔。
6123.3. 藏品單元層級關係圖與說明.jpg

藏品單元群組關係圖與說明

  • 「中央研究院 後設資料工作組」分析:[此表單呈現藏品metadata著錄之精細度(graluarity)]
  1. 著錄單位:以「長方形 」代表。
  2. 本系統有六種藏品類型,分別為資料片,剪輯帶,紀錄片,錄音帶,照片類,文字類。資料片,剪輯帶,紀錄片,錄音帶以「卷」為單位著錄metadata,照片類以「批」為單位著錄metadata,文字類以「份」為單位著錄metadata。
  3. 上述六種藏品皆為計畫的成果,本系統以錄影、電影和錄音帶資料的數位化為優先著錄,依照研究暨展演計畫之性質依序著錄「台灣土著祭儀歌舞」、「排灣族祭儀與傳說」、「賽夏族祭儀之變遷」、「排灣族鼻笛與口笛」、「原舞者採集與展演」、「民族誌紀錄片攝製」、「卑南族巫師與祭儀」、「阿美族祖屋之重建」、「台灣閩南與客家村」和「外省榮民口述歷史」等計畫藏品。
6123.4. 藏品單元群組關係圖與說明.jpg

後設資料欄位需求架構與著錄規範

此份後設資料需求架構是主題計畫編織藏品特性之內涵需求,其目的在於讓主題計畫參與同仁確認建檔時之資訊,包含:後設資料中文欄位、欄位定義、著錄規範,並供日後系統設計人員參考之用。

註1:凡「著錄規範」中標明「見10、代碼表」表示此欄位著錄時有代碼表可供選擇。

6123.5. 後設資料欄位需求架構與著錄規範.jpg
6123.5. 後設資料欄位需求架構與著錄規範2.jpg
6123.5. 後設資料欄位需求架構與著錄規範3.jpg

著錄範例

依上述之後設資料需求架構所填寫之著錄範例:

  • 範例1:資料片
6123.6. 著錄範例.jpg
6123.6. 著錄範例2.jpg
  • 範例2紀錄片
6123.6. 著錄範例3.jpg
6123.6. 著錄範例4.jpg

後設資料國際標準之應用

為數位典藏國家型科技計畫之主題計畫後設資料與國際後設資料標準接軌之重要依據,作為主題計畫與國際間或國內其他主題計畫進行XML資料交換時,彼此互通之基礎。「八、國際後設資料標準之應用」共包含兩部份:7.1、建議採用之標準,7.2、建議轉入「數位典藏聯合目錄」之欄位。

  • 7.1 建議採用之標準

本計畫是以影片為主角,第一步先進行影片,其他藏品所需的欄位現階段尚未明確,與計畫討論後,計畫表示希望能有一份表單可以著錄所有六類藏品(資料片、剪輯帶、紀錄片、照片類、文字類、錄音帶),故中央研究院後設資料工作組織支援本計畫metadata是以「影片類」需求為支援範圍,儘可能也考慮到照片/錄音帶/計畫書等藏品的需求一起設計。

在國際標準方面,考慮(1)不同類型的藏品(影片、照片、文字)都需使用同一份meatadata (2)計畫人力與時間,希望能用簡單清楚的方式紀錄藏品資訊。因此建議主題計畫採用都柏林核心集(Dubline Core)國際標準。

Dublin core後設資料標準,是一組簡單卻有效的核心元素集。源起於1995年OCLC (Online Computer Library Center)與NCSA (National Center for Supercomputing Application)聯合召開的第一屆Metadata Workshop,為了加速網路電子資源的整理與組織,並加強網路資源的找尋與檢索的精確性,集合了圖書館界、資訊科學等各領域專家,制定一套專為描述網路電子資源的後設資料格式。因此其制定初始,既設定了簡單易產生或維護、通用易瞭解的語意、全球通用、彈性高等四項原則。因DC元素(共15項)具有核心(core)和通用(universal)的特性,觀察近來的應用趨勢,一方面應用於描述機構內部典藏或產生的資源,以支援入口網站(portal)的服務或內部的知識管理;另一方面作為各式Metadata 的交換格式,以達到開放的資訊環境中,跨學科領域的資源互通。


  • 7.2 建議轉入「數位典藏聯合目錄之欄位」

說明:因為本計畫現階段只整理出影片類資料,故此份轉入聯合目錄的建議是以「影片類」為主角進行,若後續有其他類藏品轉入聯合目錄,建議重新比對確認。

6123.7.2 建議轉入.jpg
6123.7.2 建議轉入2.jpg

系統說明

  • 8.1 系統目標
  1. 系統需具有新增、查詢、修改、刪減詞彙等的維護功能。
  2. 此系統包含影像、文字、錄音及靜態影像(照片、幻燈片等)檔案,需協助使用者進行瀏覽查詢及相關檔案檢索。
  3. 使用者可於線上觀賞影音片段及填寫資料影帶使用申請。
  4. 部份作品例如民族誌紀錄片可作商業加值應用。


  • 8.2 系統範圍
  1. 此計畫完成之數位影音資料庫涵蓋台灣各族群之動態影音資料,可達呈現台灣文化多樣性的目標。
  2. 此數位典藏資料庫因係人類學者深入各族群採集的一手影音資料,相當之珍貴,有極高的研究、保存與應用價值,可補充目前國家數位典藏內容之不足。
  3. 此《台灣民族誌數位影音典藏計畫》將闢「影音暨文字作品」欄目,將呈現運用此資料庫中影音母帶完成的作品(例如民族誌紀錄片、錄音帶、書籍、研究報告書、文章、舞台演出錄影紀錄等),可發揮此影音資料庫深入淺出的實用功效,部份作品例如民族誌紀錄片可作商業加值應用。

資料結構表

  • 9.1 需求欄位建置表

本需求欄位建置表主要是把主題計畫所提出的需求欄位經系統化、架構化與後設資料標準化之後,並列成單表供系統開發人員建置資料庫時設定欄位所用,同時也供程式設計人員在撰寫程式時參考使用。需求欄位建置表之各項說明如下:

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 英文名稱:項目名稱對應的英文名稱。

v 資料型態:著錄資料之資料型態。包括:

n Int 存放純數字型態的資料。

n Float存放浮點數型態的資料。

n Varchar、Text 存放純文字型態的資料。

v 大小:欄位所需之空間,以byte為單位。一個英文字元或一個阿拉伯數字需用一個byte表示,而一個中文字元則需兩個byte表示。

6123.9.1 需求欄位建置表.gif
6123.9.1 需求欄位建置表2.gif
  • 9.2 需求欄位屬性表

需求欄位屬性表主要是把主題計畫之需求欄位的屬性彙集整理,並列成表單供系統建置人員參考使用.需求欄位屬性表之各項說明如下:

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 必填:標示“*”者表示為必填欄位,建檔時需填寫該欄位之值,不能空白。

v 多值:標示“◎”者表示為多值欄位,該組欄位資料可重覆著錄。

v 屬性:標示該欄位的屬性,包括:

n 「唯一」表示欄位的值在資料庫中是唯一存在的。

n 「下拉式選單」表示著錄方式為下拉式的選單。

n 「關聯下拉式選單」表示該欄位與某他欄位形成二維下拉式選單,其選單代碼會因關聯欄位值之改變而變化。

n 「下拉式選單與自行填寫」表示此欄位同時需下拉式選單與自行填寫兩種著錄格式。

n 「單選選項選單」表示以點選radio button的方式進行資料著錄。

n 「單選選項選單與自行填寫」表示此欄位同時需建置radio button與自行填寫兩種著錄格式。

n 「複選項選單與自行填寫」表示此欄位同時需建置check box與自行填寫兩種著錄格式。

n 「固定值」表示由系統產生一個固定值,且著錄人員無法變更此值。

n 「預設值」表示由系統產生一個預設值,著錄人員可以變更此值。

n 「系統自動產生」表示該欄位的值是由系統自動產生,非由著錄人員著錄。

n 「link」表示該欄位需連結外部資料庫。

v 提供者:記錄這筆資料是由系統自動產生或由填表者所填入。

6123.9.2 需求欄位屬性表.jpg
6123.9.2 需求欄位屬性表2.jpg

代碼表

6123.10. 代碼表.jpg

功能需求說明

  • 11.1 系統功能說明
  1. 避免重複建檔檢查機制
    本計畫之典藏號欄位具有唯一性,系統可以「館藏編號」欄位作為主鍵欄位。另外,也能以「館藏編號」欄位作為檢查紀錄是否重複建檔之檢驗欄位。
  2. 館藏編號欄位驗證機制
    進行紀錄建檔時,系統需有驗正及管控館藏編號欄位的機制。典藏號格式如下:

xxxxxx-096-ioe-ipa001【xxxxxx為館藏編號,含英文字母共5-8碼。ip為第一期計畫代碼,a為族群縮寫,數字欄位為排序值】

【】內容詳細說明:館藏編號有5-8碼;計畫年度共3碼(以民國年度為主,如096);機構代碼共三碼;流水號:共6碼(唯一值)。

v 以上四段皆為必備,各段間以“-”作為分隔符號。

v 識別碼名稱一律使用半形英文小寫字母及數字構成,不可使用中文。

v 流水號共六碼,前三碼為「第一期計畫代碼(2碼)+族群碼(1碼)」,例如ipa:阿美族,ipr:魯凱族,ips:賽夏族,ipu:卑南族,ipp排灣族,ipb:布農族,ipt:鄒族。

3.數位檔案連結機制

建檔時,於「格式」- 「數位檔案連結」- 「瀏覽級」與「典藏級」兩欄位中儲存數位檔案之連結網址(由系統產生)。日後於檢索時,可依權限開啟瀏覽級與典藏級之數位檔案。


  • 11.2 建檔功能說明
  1. 系統建檔流程說明

著錄人員要進行紀錄建檔時,進入著錄介面之前需經過身份的確認,著錄人員必須輸入自己的姓名與密碼,方可登入Metadata系統進行建檔,系統需記錄建檔人姓名與建檔時間。同樣的,當著錄人員需修改紀錄內容時,也需經過身份的確認,藉由確認的動作可知該筆記錄是經由誰人所修改,系統亦需記錄修改人姓名與修改時間。系統不需記錄每次的修改資訊,只需記錄最近一次的修改資訊即可。

紀錄建檔後,由研究人員及研究助理擔任核對人進行資料的核對。


  • 11.3 查詢功能說明

關鍵字查詢係指系統會對下列表單「關鍵字查詢欄位」中所有標示“○”欄位作查詢,檢索所有欄位資料是否符合使用者提出的關鍵字。而進階查詢則可以對下列表單「進階查詢欄位」中標示“●”的個別欄位作獨立查詢。在關鍵字查詢方面,使用者可以對下列表單「關鍵字查詢欄位」中有“○”者作出關鍵字查詢,若有符合之結果,則依照「簡要顯示款目欄位」中有“△”者顯示列表回應給使用者。在進階查詢方面,使用者也可以對下列表單「進階查詢欄位」中有“●”者作出進階查詢查詢,符合之結果也是先依照「簡要顯示款目欄位」中有“△”者顯示列表回應給使用者,使用者可進一步對下列表單「檢索結果排序」中有“◇”者進行檢索結果之排序。簡要顯示後,使用者也可進一步點選作詳細款目的查詢,系統依「詳細顯示款目欄位」中有“▲”者顯示列表供使用者瀏覽。最後,下列表單中「申請後授權使用」有“◆”者,可經過申請後授權使用。

查詢功能分為對外與對內,分列如下:

6123.11.3 查詢功能說明.jpg
6123.11.3 查詢功能說明2.jpg
6123.11.3 查詢功能說明3.jpg
6123.11.3 查詢功能說明4.jpg
  • 11.4 權限控管功能說明
6123.11.4 權限控管功能說明.jpg

工作進度記錄檔

6123.12. 工作進度記錄檔.jpg
6123.12. 工作進度記錄檔2.jpg


附件一:欄位調整建議說明

6123.附件一:欄位調整建議說明.jpg
6123.附件一:欄位調整建議說明2.jpg

「台灣民族誌數位影音典藏計畫」欄位調整建議說明 v2.0

2007/09/05

  1. [主題]相關問題,請見「04表單」說明。

04 Metadata藏品元素需求表單

資料片

6123.04 Metadata藏品元素需求表單1.jpg
6123.04 Metadata藏品元素需求表單2.jpg

2. [識別符]修改建議與問題:

6123.2. 識別符修改建議與問題.jpg

建議[定義]可修改為:

1.編碼原則為:

館藏編號-計畫年度-機構代碼-流水號

如:xxxxxxxx-096-ioe-ipa

說明:

(1)以上四段皆為必備,各段間以“-”作為分隔符號。

(2)識別符名稱一律使用半形英文小寫字母及數字構成,不可使用中文。

  1. 館藏編號有5-8碼,計畫年度有3碼,機構代碼有3碼,流水號有??碼。
  2. …….(請說明流水號的編碼方式,如:[ip0001]與[ipa0002]的差別)


「台灣民族誌數位影音典藏計畫」欄位調整建議說明 V0.3

2007/09/13寄出

2007/0917 回覆

  1. 建議新增「族群」欄位
6123.1. 建議新增「族群」欄位.jpg
  1. 閱讀「台灣民族志數位影音典藏計畫網頁構想」以及「02藏品單元層級關係圖」,

計畫藏品著錄關係如下表所示。在系統設計上,要使數位檔能顯示或撥放,每一個「數位檔」都要有一個欄位存放其位置,如:剪輯帶有「全卷」與「片段」兩種數位檔,就需要有欄位吋放這兩種數位檔。目前(2007/09/11)的後設資料設計,並無存放數位檔實際連結的欄位,建議新增「數位檔連結」此欄位,並再細分為「公開」與「典藏」兩類。

6123.2. 閱讀「台灣民族志數位影音典藏計畫網頁構想」.jpg

建議修改,於「格式」下新增「數位檔連結」,並將:

1.「片段」與「低解析」都視為「公開」。

2. 將「全卷」與「高解析」都視為「典藏」。

6123.2. 將「全卷」與「高解析」都視為「典藏」。.jpg
6123.02a.gif
6123.02b.jpg
6123.02c.jpg
6123.02d.jpg

03. 藏品單元群組關係圖

6123.03. 藏品單元群組關係圖.jpg
台灣民族誌數位影音計畫 欄位調整建議v0.4
2007/09/21

問題詢問:

  1. 依據計畫需求重新繪製,請確認「03 藏品單元層級關係圖」Metadata最小著錄單位是否正確,特別是照片類以「幅」為單位著錄metadata?目前metadata設計是以主題計畫之前所提出的需求以「幅」為單位紀錄。
    A:經胡老師確認後,照片類改以「批」為單位,請見「0203表單1002.doc」
  2. 依據計畫需求重新繪製,請確認「02 藏品單元層級關係圖」是否每種藏品類型都會區分為「瀏覽級」「典藏級」兩類,特別是「文字類」是否也會區分為「瀏覽級」與「典藏級」?
    A:「文字類」無「瀏覽級」與「典藏級」之分。
  3. 「08表單-必填」請確認以下欄位是否在「資料片,剪輯帶,紀錄片,錄音帶,照片類,文字類」六類藏品,每筆藏品都有資料可填入:「著作者」「主題-關鍵字」「描述-摘要/大綱」「日期」「格式-數位檔案連結」「識別-原始編碼」「典藏單位-原件入藏時間」「典藏單位-數位檔案典藏時間」?(請見「0809表單0921」紅色字體標示處,尚未修改)
    A:將「識別-原始編碼」改為非必填欄位,因為文字類和照片類檔案無原始編碼。
  4. 「08表單-多值欄位」建議將(1)「著作者」「關聯」改為一組多值 (2)「格式-數位檔案連結-瀏覽級」改為多值,可以存放多個瀏覽級的資料,如:文字類藏品類型。(請見「0809表單0921」紅色字體標示處,已修改)
    A:OK。
  5. 「08表單-功能連結」建議將「著作者-角色」設為代碼表,已與「代碼表單」一致。(請見「0809表單0921」紅色字體標示處,已修改)
    A:OK。
  6. 「08表單-唯一值欄位」請問「識別-原始編號」設為「唯一值欄位」是否有其他特殊考量,因為計畫是以數位檔為重點,「原始編號」非系統的重點,建議不用將其設為「唯一值欄位」。(請見「0809表單0921」紅色字體標示處,尚未修改)
    A:「識別-原始編號」亦為唯一館藏編號,為免工讀生輸入錯誤,故將其設為唯一值欄位。
  7. 04表單(「metadata資料片版」)中「日期」的「定義」,建議考慮「資料片,剪輯帶,紀錄片,錄音帶,照片類,文字類」六類藏品情形,作更為精確的定義。(請見「資料片版20070917」紅色字體標示處,尚未修改)
    A:在「日期」說明中,已「描述影片拍攝時間,採ISO8601格式著錄:
    YYYY-MM-DD(西元紀元,允許只著錄YYYY)」,括號中即為文字類及照片類適用。
  8. 04表單(「metadata資料片版」)中「典藏單位-數位檔案典藏時間」的「定義」,建議考慮「資料片,剪輯帶,紀錄片,錄音帶,照片類,文字類」六類藏品情形,以及計畫狀況,作更為精確的定義。(請見「資料片版20070917」紅色字體標示處,尚未修改)
    A:若月日不詳者可僅著錄至西元年

參考資料

參與研發單位:中央研究院-計算中心-後設資料工作小組

提供單位:中央研究院-計算中心-後設資料工作小組

使用單位:中央研究院-民族學研究所