老照片:臺灣視覺記憶計畫後設資料需求規格書(原6-1-95 )

出自 TELDAP
於 2013年5月15日 (三) 06:40 由 Cxcdx (對話 | 貢獻) 所做的修訂 (21個修訂: 分類:技術彙編)

(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)
前往: 導覽搜尋

前言

中研院後設資料工作組把主題計畫提出之需求經系統化,架構化與國際標準化之後,呈現於本份「後設資料需求規格書(version 1.0)」中,主要係作為主題計畫與系統開發者之間的溝通橋樑,其中,我們建議主題計畫進行需求規格書確認工作時務必著重於以下的部份:

  1. 計畫簡介
  2. 系統說明
  3. 著錄欄位架構
  4. 後設資料標準比對表
  5. 功能需求說明
  6. 代碼表
  7. 使用者協調

而系統開發人員在系統實際建置時,可著重於以下之部份:

  1. 資料結構表
  2. 後設資料標準比對表
  3. 功能需求說明
  4. 代碼表


計畫簡介

  • 2.1 計畫說明

本計畫以臺北藝術大學與中央研究院合作之「臺灣老照片數位博物館」(http://www.sinica.edu.tw/photo/) 為基礎,以深化典藏與擴大藏品為目標,結合中央研究院臺灣史研究所籌備處藏有的臺灣老照片、明信片等圖像資料,共同擘畫「臺灣視覺記憶數位典藏 (Exploration of Taiwan Visual Image)」。1996 年,文建會委託臺北藝大傳統藝術研究中心進行「臺灣地區老照片資料蒐研計畫案」。三年期間,傳研中心工作人員奔走臺灣各地,蒐羅近三萬張1960年代前的圖像資料,並與提供單位與個人簽訂徵集合約,取得使用權,為建立國家永久性文化資產作準備。

適逢國科會在1999 年徵求「數位博物館計畫」,臺北藝大的傳統藝術研究中心、科技藝術研究中心,與中研院的計算中心、資訊科學研究所攜手,以前述圖像資料為基礎,提出「臺灣老照片數位博物館」計畫,並連續獲得兩年補助。除持續進行後設資料(Metadata)的輸入與校正,其欄位的研擬與修改外,並策劃「臺灣影像誌」、「臺灣走透透」、「資料庫檢索」、「互動式學習」等單元,嘗試以生動活潑的手法,讓使用者深入 了解臺灣人的生活情態。

為了挽留在口耳相傳中不斷流逝的歷史記憶,將這些資料作更深入的解讀,並擴大典藏的數量,確有必要。因此臺北藝大決定與中央研究院臺灣史研究所籌備處合作,希望兩者能互補有無,發揮最大的效益。

中研院臺史所古文書室所藏之圖像資料以研究者採集、收購或捐贈等方式而來,目前典藏之圖像資料共7032 張,其中老照片4857 張、明信片2175 張,包含日治初期至戰後臺灣政治、經濟、社會文化等面向資料,在臺灣史研究、鄉土教育、博物館展示上均有一定的價值。特別是該項資料中,大部分是目前坊間出版的圖像資料中所未見的,更顯得彌足珍貴。

九十年底,適逢「數位典藏國家型科技計畫」徵求「內容發展分項計畫」,臺北藝大與中研院臺史所籌備處共同提出「臺灣視覺記憶典藏」計畫,除納入該處「古文書室」日治到戰後初期八千餘張的珍貴的照片、明信片外,最重要的還是想藉著不同專業的交流,讓歷史圖像在數位世界裡能得到更佳的詮釋。透過此次合作,臺史所與國立臺北藝術大學傳研中心可以各自發揮專長,在欄位設計、圖像資料分類、內容分析上交流,以建立一套可以被後繼研究者使用的圖像數位典藏管理系統。


  • 2.2 計畫目標
  1. 人物、時間與空間的Metadata 分析與建置:
    將Metadata 的範圍由原本的物 品擴展至時間、空間與人物等方面,使得老照片知識內涵更為多樣化與增強豐富度。
  2. 協助主題館與互動學習課程的製作:
    透過Metadata 的分析與建置,完成知識內涵基礎建設,可以達成知識探索,以最快的方式找出同質或相關主題的老照片影像,協助主題館展示與網路互動學習課程的製作。


  • 2.3 計畫參與人員

v 臺北藝術大學傳統藝術研究中心:江韶瑩、簡秀珍、林蔚嘉、邱莞慧、郭詩茵

v 中研院臺史所籌備處:詹素娟、林玉茹、陳中禹

v 中研院後設資料小組:陳亞寧、陳淑君、龔家珍、傅怡婷、城菁汝、沈漢聰(需求規格書撰寫者)

系統說明

  • 3.1 系統目標
  1. 加強GIS 與Metadata 的結合應用,達成以圖形機制方式呈現老照片的查詢與展現。
  2. 結合GIS 與全文資料庫間的雙向互動檢索與呈現。
  3. 分析與設計人物、事件Metadata,進而融入GIS 的互動應用。
  4. 建立時、空與知識內涵結構的三大主軸,進而達成最佳化知識探索。
  5. 以既有GIS 與Metadata 為基礎,達成不同主題展示館的呈現,以及製作不同的網路化互動學習課程。


  • 3.2 系統範圍
  1. 蒐集保存:鼓勵民眾利用相片剪貼簿的功能,張貼、儲存、甚至願意捐贈以充實館藏。
  2. 展示:注重情境展現,顯現交織的文化脈絡。
  3. 研究:開放共同討論區,藉由閱聽者的回傳,使老照片相關歷史考據、資料更形完整。
  4. 教育推廣:藉由不同的主題展示館,製作網路化互動學習課程。


Metadata 標準採用說明

綜觀主題計畫之條件與需求,可以得知主題計畫除了企圖藉由視覺媒體來呈現知識內容主題、提供學者廣闊的研究題材,並建置一個全民的視覺記憶展示場之外;同時也希望能建立一個良好的圖像管理機制協助主題計畫管理類型繁多之視覺藏品,因此,經過MAAT 小組之研析,決定採用VRA 以及IFLA model 來強調突顯作品之主題,以及建立管理機制。

VRA3.0 是依據Dublin Core 發展而成的一套專為描述視覺藝術藏品中藝術作品(Work)的替代影像(Image)的核心欄位,保留了Dublin Cores 的1:1 原則,亦即一筆metadata 僅描述一個物件或是資源。而在3.0 版中,其加入了Record Type 元素組,將影像(Image)原附屬在作品(work)之下的地位,提昇至平行的層次。也讓同一個作品不同的影像紀錄都擁有單獨的管理資訊與紀錄,此項特點與本主題計畫視覺記憶主題呈現以及管理機制建立之雙重需求互相呼應;另外,VRA3.0 為依循DublinCore 之延伸,而在老照片計畫當中,MAAT 小組已採用Dublin Core 來作為設計欄位的標準,因此若主題計畫能夠採用VRA 3.0,在往後與舊系統進行資料轉換時,較不易產生問題。

另外,強調視覺主題內容部分也是本計畫的重點,因此MAAT 小組導入IFLAModel,來突顯主題內容與實體之間的層次關係。然而,原IFLA model 四層的區分(work, expression, manifestation, item )對於主題計畫來說,似乎過於細緻,對於記錄者來說,可能會出現許多相同資料重複著錄的情況,而FRBR Model 之層次過多,也易造成使用者的概念混淆,因此本組建議依本主題計畫之特性,以影像內容資訊(包含作品與表達層次)、以及影像實體資訊(包含呈現與物件層次),來扁平化其原來過於繁瑣之架構(其概念如下頁圖一所示)。此種方式主要是將影像內容資訊抽出,可供學者大眾研究使用,另一方面,單純的影像實體資訊,也提供管理端一較單純化的管理機制平臺。另外,影像內容資訊以及影像實體資訊進行串聯時(圖二為資料之間串聯方式以及資料著錄流程示意圖),其影像內涵以及影像實體之間的關係,例如,一張名信片有多少種實體複製品?有幾件?等等……,其中關係都能在此架構中清楚的呈現。

6198.4. Metadata 標準採用說明.jpg
6198.4. Metadata 標準採用說明2.jpg


著錄欄位架構

  • 5.1 著錄介面

著錄架構之主要目的在於讓主題計畫參與同仁確認建檔時所需著錄之後設資料欄位與欄位的先後排序,並供日後系統設計人員參考之用。本計畫之系統在著錄上分成兩大層次架構,分別為影像內容層次與影像實體層次,茲分述如下:

6198.5.1 著錄介面.jpg
6198.5.1 著錄介面2.jpg
6198.5.1 著錄介面3.jpg
  • 5.2 著錄範例

依上述之著錄架構所填寫的著錄範例如下:

6198.5.2 著錄範例.jpg
6198.5.2 著錄範例2.jpg
6198.5.2 著錄範例3.jpg
6198.5.2 著錄範例4.jpg

資料結構表

  • 6.1 需求欄位建置表

本需求欄位建置表主要是把主題計畫所提出的需求欄位經系統化、架構化與後設資料標準化之後,並列成單表供系統開發人員建置資料庫時設定欄位所用,同時也供程式設計人員在撰寫程式時參考使用。需求欄位建置表之各項說明如下:

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 英文名稱:項目名稱對應之英文名稱。

v 資料型態:著錄資料之資料型態。包括:

n Int 存放純數字型態的資料。

n Float 存放浮點數型態的資料。

n Varchar、Text 存放純文字型態的資料。

v 大小:欄位所需之空間,以byte 為單位。一個英文字元或一個阿拉伯數字需用一個byte 表示,而一個中文字元則需兩個byte 表示。

6198.6.1 需求欄位建置表.jpg
6198.6.1 需求欄位建置表2.jpg
6198.6.1 需求欄位建置表3.jpg
6198.6.1 需求欄位建置表4.jpg

6.2 需求欄位屬性表

需求欄位屬性表主要是把主題計畫之需求欄位的屬性彙集整理,並列成表單供系統建置人員參考使用.需求欄位屬性表之各項說明如下:

v 項目名稱:主題計畫所需著錄項目之中文名稱。

v 必填:標示「*」者表示為必填欄位,建檔時需填寫該欄位之值,不能空白。

v 多值:標示「◎」者表示為多值欄位,該組欄位資料可重複著錄。

v 屬性:標示該欄位的屬性,包括:

n 「唯一」表示欄位的值在資料庫中是唯一存在的。

n 「流水號」表示該欄位是系統以流水號的方式自動產生。

n 「下拉式選單」表示著錄方式為下拉式的選單。

n 「二維下拉式選單與自行填寫」表示此欄位是以二維下拉式的著錄格式建置,並同時提供下拉式選項代碼選擇與自行填寫兩種著錄方式。

n 「固定值」表示由系統產生一個固定值,且著錄人員無法變更此值。

n 「系統自動產生」表示該欄位的值是由系統自動產生,非由著錄人員著錄。

n 「link」表示該欄位需連結外部資料庫。

v 提供者:記錄這筆資料是由系統自動產生或由填表人所填入。

6198.6.2 需求欄位屬性表.jpg
6198.6.2 需求欄位屬性表2.jpg
6198.6.2 需求欄位屬性表3.jpg

註1: 影像實體層次之影像檔案名稱視其格式欄位選項與著錄人員之單位而由系統自動產生,其規則如下:

v 當北藝大著錄人員選定影像格式為JPG(150dpi)選項時,其檔案名稱為TA+原始典藏號(拿掉破折號)+d.jpeg,如:TATW02081500d.jpeg

v 當北藝大著錄人員選定影像格式為JPG(72dpi)選項時,其檔案名稱為TA+原始典藏號(拿掉破折號)+p.jpeg,如:TATW02081500p.jpeg

v 當北藝大著錄人員選定影像格式為GIF選項時,其檔案名稱為TA+原始典藏號(拿掉破折號)+b.gif,如:TATW02081500b.gif

v 當北藝大著錄人員選定影像格式為TIF 選項時,其檔案名稱為TA+原始典藏號(拿掉破折號)+u.tif,如:TATW02081500u.tif

v 當臺史所著錄人員選定影像格式為JPG(150dpi)選項時,其檔案名稱為TH+原始典藏號(拿掉破折號)+d.jpeg,如:TH86003840d.jpeg

v 當臺史所著錄人員選定影像格式為JPG(72dpi)選項時,其檔案名稱為TH+原始典藏號(拿掉破折號)+p.jpeg,如:TH86003840p.jpeg

v 當臺史所著錄人員選定影像格式為GIF 選項時,其檔案名稱為TH+原始典藏號(拿掉破折號)+b.gif,如:TH86003840b.gif

v 當臺史所著錄人員選定影像格式為TIF 選項時,其檔案名稱為TH+原始典藏號(拿掉破折號)+u.tif,如:TH86003840u.tif

後設資料標準比對表

後設資料標準的對照是作為臺灣視覺記憶數位典藏計畫後設資料欄位和國際後設資料標準的接軌,以及與國際間其他主題計畫作XML 資料交換的關鍵機制。以下分別是臺灣視覺記憶數位典藏計畫後設資料欄位與Dublin Core 及Visual Resources Association Core Categories, version 3.0(VRA 3.0)兩種後設資料標準之比對表。

  • 7.1 DC Mapping
6198.7.1 DC Mapping.jpg
6198.7.1 DC Mapping2.jpg
6198.7.1 DC Mapping3.jpg
  • 7.2 VRA 3.0 Mapping
6198.7.2 VRA 3.0 Mapping.jpg
6198.7.2 VRA 3.0 Mapping2.jpg
6198.7.2 VRA 3.0 Mapping3.jpg

功能需求說明

  • 8.1 系統功能說明
  1. 日文與臺語字彙輸入與顯示需求:

系統需能接受日文的輸入與支援日文的顯示,同時,對於臺語字彙的造字系統也需能顯示無誤。


  • 8.2 建檔功能說明
  1. 原始典藏號之驗正方式:

系統需依據下列不同機構單位的命名規則檢查著錄人員在著錄原始典藏號欄位值是否有誤:

6198.8. 功能需求說明.jpg
  • 8.3 查詢功能說明

關鍵字查詢係指系統會對下表單之關鍵字查詢欄位中所有標示「○」欄位作查詢,檢索所有欄位資料是否符合使用者提出的關鍵字。而進階查詢則可以對下表單之進階查詢欄位中標示 「△」的各別欄位作獨立查詢。在關鍵字查詢方面,使用者可以對下表單中之關鍵字查詢欄位(有○者)作出關鍵字查詢,若有符合之結果,則依照檢索簡要顯示款目欄位(有●者)顯示列表回應給使用者。在進階查詢方面,院內使用者也可以對下表單中之進階查詢欄位(有△者)作出進階查詢查詢,符合之結果也是先依照檢索簡要顯示款目欄位(有●者)顯示列表回應給使用者,使用者也可進一步點選作詳細款目的查詢,系統依詳細顯示款目欄位(有▲者)顯示列表供使用者瀏覽。

6198.8.3 查詢功能說明.jpg
6198.8.3 查詢功能說明2.jpg
6198.8.3 查詢功能說明3.jpg
  1. 查詢結果顯示需求說明:
    臺灣視覺記憶數位典藏計畫之Metadata 欄位,在查詢結果顯示的層面上,分為基礎欄位與非基礎欄位,以下列出基礎欄位:
    影像內容層次:
    作品標題、作品主題、藏品原始型態、時代、發生地點。
    影像實體層次:
    版權所有
    在查詢結果的顯示上,若欄位是屬於基礎欄位者,則不管該欄位是否有內容,都必須顯示該欄位。如果欄位不是屬於基礎欄位,而其欄位又不具備內容者,在查詢結果的顯示上,就不必顯示該欄位。
  2. 時代欄位顯示需求說明:
    時代欄位在顯示的時候以較簡潔的方式顯示,如下所示:
    著錄介面:
6198.8.3 查詢功能說明4.jpg
  • 顯示方式:日治時期大正元年至14 年間


8.4 權限控管功能說明

  1. 編目紀錄需求:

需求欄位建置表中之編目紀錄係皆由系統自動產生:著錄人員進入著錄介面之前需經過身份的確認,藉由著錄人員輸入的姓名與密碼,系統自動把著錄人員之姓名存放到登錄者欄位,同時也把建檔時間存放到登錄日期欄位。Metadata紀錄建檔後,由專任助理或相關專長老師進行紀錄的核對事宜,當紀錄累積到100 筆時,系統需提醒核對者進行核對工作,並把未經核對的紀錄列出供核對者逐一查核,當完成紀錄的核對工作時,系統需把核對者的身份存放到核對者欄位。在紀錄資料的修改方面,更新者要修改、更新資料時,也需經過身份的確認才能登入管理系統,更新者只能更新由其所新增的紀錄,而無法更新其他登錄者所新增的紀錄。除了更新者能修改本身所建檔的紀錄外,核對者亦有權限修改所有登錄者所建檔的紀錄。另外,系統不需記錄每次的修改資訊,只需記錄最近一次的修改者與修改時間即可。

代碼表

上述6.2 需求欄位屬性表之屬性欄位有標示「下拉式選單者」,其對應之下拉式選單代碼內容如下所示:

6198.9. 代碼表.gif
6198.9. 代碼表2.gif
6198.9. 代碼表3.jpg

規格書確認表單

6198.10. 規格書確認表單.jpg

附件:影像實體層次欄位著錄規範

由於原件、替代品與電子檔本質上的差異,以致於在欄位描述上也會略有所不同,如「像素」為電子檔特有的屬性;而「品質狀況」的紀錄對於原件、替代品來說較有意義。

但是由下表可知,大致上來說其需著錄屬性大部分都是相同的,若因少數幾項特殊的屬性而獨立設計兩個不同的表單來進行著錄,對於系統及使用者來說,都是一項額外的負擔。

因此在折衷的結果下,還是將所有實體放在同一張表單來進行著錄,但特作此表格提醒主題計畫,某些特定欄位屬於原件/替代品(或是電子檔)所有,在著錄時僅要挑選該實體既有的屬性即可。

6198.附件:影像實體層次欄位著錄規範.jpg

參考資料

參與研發單位:中央研究院-計算中心-後設資料工作組、中央研究院-臺史所、臺北藝術大學

提供單位:中央研究院-計算中心-後設資料工作組

使用單位:中央研究院-臺史所、臺北藝術大學