資料交流平台
目錄
前言
「臺灣原住民數位典藏計畫」(Digital Archives of Formosan Aborigines,簡稱DAFA)為「數位典藏國家型計畫」之「中央研究院機構計畫」項下成果之一。第一期計畫的主要目的在於以中央研究院民族學研究所博物館、圖書館以及研究人員所典藏有關臺灣原住民之文物、文獻與影音資料為基礎,進行各類型資料的數位化與典藏管理,並建置資料庫及其搜尋機制,以提供研究人員、教育人員以及社會大眾在研究、教學以及相關資訊交流方面的便利,希望藉此能促進族群之間的相互了解與尊重,以及不同文化間的交流與保存。一期計畫進行到第五年,即將在2006年底結束,步入二期計畫的嶄新階段,在此承先啟後的過渡時期,正是為了整個計畫得以永續經營做更全面性思考的時候,而打開民間參與的大門,這是臺灣原住民數位典藏計畫能否永續經營的關鍵環節。
其實,在計畫規劃的初期,就已經存在如何推動民間參與的元素,在規劃網站會員機制時,就已規劃了「提供者」這個會員身分,其指的就是原住民文史工作者、原住民文物收藏加以及原住民文化傳承者本身,願意提供素材將之數位化上傳臺灣原住民數位典藏計畫資料庫的一群會員。只是民間參與不只是一個書面上的響亮口號,實際執行的歷程從資源整合、系統建置、教育訓練到專案規劃,每一步都需要穩紮穩打,才能有足夠的網路空間存放民間徵集的數位物件、有適宜的後設資料(metadata)欄位讓提供者著錄,更需要充足的資訊基本訓練與企畫輔導,讓民間參與者有經費跟技術參與數位典藏領域,希望透過民間參與的力量,將珍貴的原住民知識從民間收藏變成全民共享的文化數位內容。臺灣原住民數位典藏國家型科技計畫設計的資料交流平台,整合計畫執行以來的八個重要資料庫,規劃簡化版後設資料著錄欄位,讓原住民文史工作者、文化傳承者能夠將珍貴收藏上傳到網站,讓全民共享。
本篇論文將從臺灣原住民數位典藏計畫開拓民間參與的各面向中,集中焦點在臺灣原住民數位典藏計畫資料交流平台的規劃設計,以及此規劃設計跟整體網站的關係,還有因應資料交流平台所舉辦的推廣計畫及教育訓練活動。
關於臺灣原住民數位典藏計畫資料庫建置
「臺灣原住民數位典藏計畫」為了永續典藏中央研究院民族學研究所典藏之原住民研究資料,提供教育界、學術界以及社會大眾參考之目標(文上瑜、潘英海,2005;Pan,2005),建置初期,就深切思考了作為一個原住民研究的完整資料庫,無論考慮到研究價值還是社會教育需求,必須將原住民知識素材,做有意義的分類與有結構的規劃,同時考量收藏品的保存材質與資料形式,共建置文物、契約、表格、研究地圖、影像、影音、音樂、聲音紀錄、人口、聚落、書目、研究人才資料庫、多媒體出版品、故宮原住民檔案等14種類型的資料庫,並建立簡要查詢、進階查詢、縮小範圍查詢、跨資料庫查詢、關鍵詞串連等功能介面,方便研究人員、教育工作者與一般大眾取用資料。為因應深化典藏成果與加值應用需求,開設了展覽館與原住民文化地圖兩個應用介面,使資料庫典藏內容更具脈絡化與可讀性,使成為有深度的臺灣原住民文化知識教材。
臺灣原住民數位典藏計畫建置了跟臺灣原住民研究相關的14個資料庫,其中除了「故宮原住民檔案資料」為靜態文字檔案呈現,以及「研究人才資料庫」是為權威控制所建置的資料庫之外,基礎資料庫的建置一共包含了12種資料類型,表面上各資料庫有不同的資料屬性與獨立的後設資料欄位規劃,檢索查詢系統和報表網頁亦各自獨立,各資料庫之間的關係其實是彼此緊密相關、環環相扣,共同組成原住民數位典藏的整體架構。並透過跨資料庫查詢、展覽館與文化地圖等機制,從查詢到展示,都可以因為展示主題與空間資訊而聯繫在一起。
數位化的重要目的,在於永續保存珍貴的文化資產,作為未來研究、展示、教育與內部管理的基礎資料,一個完整的後設資料規劃,除了能夠涵蓋典藏品的標題、類型、相關人員、空間資訊、時間資訊、內涵描述等不同類目,同時還須包括管理資訊、典藏資訊、數位物件資訊與權限範圍等訊息,更重要的是提供資訊交換與資源共享的功能,它係以結構化的方式處理資料,需要一個完整的規劃方能涵蓋數位典藏全方位的目的。原住民數位典藏資料庫的資料庫類型廣泛,其中例如表格、聚落、研究地圖等特殊類型的資料庫,並無直接的國際標準可供參照,同時為考量使用者查詢與利用的一致性觀感,以及計畫內部跨資料庫查詢的需求,因此在後設資料的欄位規劃上,研發符合計畫需求的後設資料規格,以增加資料庫使用與管理的便利。(文上瑜、潘英海,2005;Pan,2005)
本計畫後設資料(metadata)的建置規劃是先從人、事、時、地、物五個角度出發,來思考後設資料應包含那些著錄項目,同時透過管理(administration)、取用(access)、保存(preservation)、應用(use of collections)等四個層面去思考建立後設資料的用途與使用者之需求,以使後設資料的分析儘可能包含各層面的需要。
在查詢機制方面,資料庫檢索功能則提供使用者「簡要查詢」、「進階查詢」及「跨資料庫查詢」的功能介面,使用者可依需求選擇查詢介面。一般而言,在單一資料庫檢索時,初學者或是不嚴格要求檢索結果者適用「簡要查詢」的方式,以便在開放的條件下,查詢到最多的相關資料;而熟悉資料庫性質或是希望檢索結果較精確者,可以選擇「進階查詢」,每個限定範圍的類別內都有完整的查詢功能,可以方便使用者篩選多餘的資料。而當使用者的檢索條件是希望能夠查詢計畫內所有或部份資料庫時,便需要多個資料庫的整合查詢,亦即「跨資料庫查詢」。並且在每一種資料庫的查詢結果列表中,常駐「縮小範圍查詢」功能,即是以前一次查詢結果為基礎,再利用關鍵詞彙做第二次查詢,如此便能夠得出較第一次查詢更精確的資料。
原住民數位典藏計畫資料交流平台的規劃建置
在臺灣原住民數位典藏計畫執行之初,計畫主持人就有了資料提供者的概念,希望建立一個結合行政資源與系統上傳架構的機制,讓民間原住民文化工作者,能夠將個人收藏貢獻給社會,成為全民共享的社會資產。
網站計畫目標提到:希望本計畫能達成拋磚引玉之效,吸引民間團體與博物館、教學與研究單位以及地方文史工作室共襄盛舉,利用本網站提供的分享交流機制,上網交流有關臺灣原住民各方面的資訊與意見,或是,上傳分享有關臺灣原住民文物、文獻與影音等各類型之文化資產,讓本網站得以永續經營。
這個民間參與的永續經營願景,並非喊口號就能達到,而是需要從系統規劃、權限保障、資源整合、教育訓練等各方面著手,每個環節都處理得當,才能與原住民文化工作者共同經營出良好的合作模式與成功案例。以下就系統規劃層面,從權限保障、系統需求規劃到後設資料修正等議題,做進一步討論。
資料貢獻者的概念與權限
臺灣原住民數位典藏計畫建置網站初期,會員權限的規劃是其中一個考量重點,初期規劃的四層會員身分中,有一個身分稱做「提供者」,按照字面含意不難理解,提供者指的是一群將個人收藏提供給本計畫做數位典藏的人。他們可能是原住民文史工作者、原住民文物收藏家、原住民地區教育單位、部落內部的博物館等等,他們長期持有這些珍貴的原住民文化素材,並且有第一手的在地詮釋知識內容,是臺灣原住民數位典藏計畫在永續經營上非常重視的原住民文化數位內容專家。提供者會員的設計,是讓他們可以是用自己的帳號進入資料庫中,做資料的新增與修改。其初期權限設計為:
- 可以自行決定資料是否開放給一般會員與進階會員使用。但提供者的帳號,可以看到自己提供的所有資料,無論開放與否。
- 不同的資料提供者之間的資料不互通,提供者A並不能看到提供者B的資料。
- 資料提供者查詢自己的資料時,可以看到「所有的欄位」與「數位物件」。
這個權限設計首先要保障提供者的網路智財權,並非提供者使用計畫的網站資源,就一定要在短期內開放所有資料。然而,畢竟是使用國家資源,不能無限期的讓資料處於不開放狀態,所以必須在一個可預見的時期內,將資料開放與全民共享。
到了會員系統完成之後,提供者會員更名為「資料貢獻者」,其權限也做了更動:「為了增加資料庫的資料,並推動資料共享之理念,我們歡迎有志者共襄盛舉,將相關資料數位化後上傳至本網站指定網址,或是提供原始資料給本網站數位化。
這類的資料貢獻者,經過申請審核通過後,我們給予特殊權限,包括:進階會員所有權益、本網站提供個人專屬資料庫以儲存數位檔案、資料貢獻者可決定資料開放與否之權限與資料開放期限。」資料開放與否的權限仍然存在,更新增了專屬資料庫所代表的「資料貢獻者資料庫著錄介面」、網路空間與頻寬資源、資料貢獻者查詢與管理功能等。
這樣的權限設計,讓資料貢獻者不只是將資料上傳到計畫資料庫,而是需要一個適合於資料貢獻者使用的資料庫平台,於是本計畫有了「臺灣原住民數位典藏計畫資料交流平台」的規劃與建置。
資料交流平台系統的需求規劃
「臺灣原住民數位典藏計畫資料交流平台」(Data Exchange and Sharing Platform for Digital Archives of Formosan Aborigines,DESP),建立在二代網際網路(Web 2.0)概念下所建置的(註1),是一種貢獻者輸入系統(Donor Input System,DIS)(註2)。其主要的目的希望臺灣原住民數位典藏資料庫能藉由民間文史工作者的參與,以期豐富資料庫的蒐集與典藏,並期能配合日後引導數位內容產業的發展。
要之,本平台的建置是以原住民數位典藏經驗為基礎,建置供民間單位、文史工作者、原住民文化關懷者、原住民文化傳承者,參與原住民數位典藏的公共平台。從資源運用的角度來看,是提供資料貢獻者一個存放原住民收藏及研究成果的大型數位空間與頻寬資源。從網際網路便利性的角度來看,則是給資料貢獻者隨時取用與查詢典藏成果的方便工具。因為要滿足這些需求,系統規劃方面不只要符合資料貢獻者在數位典藏資料庫上的需求,還要讓資料貢獻者有研究成果發表空間,有可以跟其他資料貢獻者意見交流的園地。除了典藏資料庫之外,結合數位展示系統與討論區(或者部落格)機制,也是這個平台的重要需求。
如前所述,目前平台規劃部份已經完成了典藏著錄系統,從計畫14個資料庫中選出具有民間參與特色的其中9個資料庫包括:文物、契約、影像、影音、音樂、聲音紀錄、聚落、書目、多媒體出版品等,因應資料貢獻者的需求,將資料庫的後設資料進行簡化,並因為資料提供者在遠端執行著錄工作,特別就數位檔案較小的資料庫提供上傳功能,所以在影像資料庫、文物資料庫、契約資料庫、音樂資料庫都有圖檔上傳機制,而影音資料庫跟聲音紀錄資料庫則因為檔案過大,需要另外從FTP協定上傳,所以著錄介面僅提供原始檔名標示欄位,作為檔案相互連結的指引。另外,聚落資料庫由於性質特殊,除了需要著錄聚落描述之外,還搭配聚落照片來具體呈現聚落面貌,但是在聚落資料庫中照片若需要書寫過多資訊,必造成該資料庫後設資料欄位不當的膨脹,於是規劃聚落照片在影像資料庫著錄(影像資料庫的後設資料欄位專門設計處理平面影像如照片、繪畫之用),然後在聚落資料庫透過連結影像資料庫,挑出該聚落的聚落照片。如此前臺呈現時不但可以呈現聚落照片的數位檔案,更可以連回影像資料庫閱讀該照片細節性的後設資料。
臺灣原住民數位典藏計畫資料交流平台目前已經進入推廣階段,平台所提供的著錄介面與功能還算親切,對於民間參與者來說算是容易上手的介面,有些細節控管功能經過解釋與反覆操作之後,就能夠習慣其著錄流程。期望透過資料交流平台的數位化工作與後設資料建置,擴大數位典藏經驗在原住民領域的推廣,讓數位典藏技術與理念直接傳遞到原住民文化工作者身上。
交流平台後設資料(metadata)的修正
在數位典藏著手民間參與的工作過程中,站在民間參與者的角度思考,可能可以算是原住民研究領域的一項專長的運用。臺灣原住民數位典藏計畫主持人潘英海教授從田野經驗的在地觀點做思考,反問工作團隊,若作為一個忙碌的文史工作者,而非正職的領薪的數位典藏工作者,是否能夠為每一筆資料承受繁瑣的後設資料填寫程序?這答案對於大部份民間參與者來說當然是否定的(對於少數極有熱誠的人則可能是肯定的)。所以要貼近民間參與者的現實面,才有可能在教育訓練與推廣過程中,讓民間參與者加入計畫,而成為資料貢獻者。這個必要的面對民間參與者的方法,就是有結構的簡化後設資料的著錄欄位。
經過內部工作會議反覆討論,以及與資訊工程師在資料庫會議上的協調,以下就以聚落資料庫簡化版metadata規劃表為例,作簡化上的說明:
從兩個同屬聚落資料庫的metadata規劃表來看,簡化版的資料庫明顯減少欄位,並且將較為困難的數位物件資訊與地理專門知識欄位整個移除,登入者與修改者控管欄位也刪去。整體來看,簡化版的後設資料欄位剩下三類資訊:
- 人事時地物等基本資訊:跟一筆聚落資料相關的基本欄位,如標題、聚落描述、空間資訊、時間資訊、提供者、聚落相互關係等。
- 查詢資訊:關鍵字、主題、族社等欄位。
- 權限資訊:著作財產權人、著作權狀態、開放與否,都屬於這筆資料在智財權上的權益宣告。
這三類資訊恰好可以跟都後設資料最核心的架構柏林核心集(DC,Dublin Core )相對應。而DC也是數位典藏國家型科技計畫聯合目錄系統的基本參考架構,DIS系統簡化版的後設資料規劃,一方面裁剪過於艱深的資訊,一方面又需要合於後設資料規劃的最基本需求(DC),這樣才不會為了過度強調簡化而失去後設資料的意義與功能。
民間參與及交流平台的推廣
臺灣原住民數位典藏資料交流平台的建置,很明顯的不只是把民間參與歷程中資料貢獻者的個人收藏裝入資料庫,變成典藏內容而已。回歸到整體資料庫設計的應用加值機制,在規劃上資料貢獻者可以透過展覽館線上展示系統,將自己的研究成果與個人收藏,經過脈絡化之後變成數位展覽的展品,更可以挑選在主資料庫中的數位物件,增加個人展覽的展品數量,有時候甚至可以補足關鍵性的缺憾,發展成屬於資料貢獻者的論述,具體呈現多年的研究成果。
另外,聚落資料庫在資料貢獻者地一手在地資料的挹注下,更可以支援原住民文化地圖,使其內容更加豐富。原住民文化地圖更可以藉著更翔實的更精確的地理空間描述,規劃除了聚落人口、神話起源、研究田野地之外,更貼近社會大眾的主題,例如部落生態、部落遷徙史、部落地圖等等。
民間參與在資源層面的考量
數位典藏國家型科技計畫的推動已到第五個年頭,藉由國家計畫的推廣(訓練推廣分項計畫、公開徵選計畫等),逐漸開始受到地方重視,有越來越多的單位投入。但是回到民間參與的角度,臺灣原住民數位典藏計畫鼓勵民間參與的對象,卻是一群有龐大數位落差的個人或團體,他們通常是文史工作者、部落學校的教師、關懷原住民文化的NPO組織、原住民文化傳承者等。他們有豐富的原住民文化知識與收藏,但是卻大比例的不使用資訊設備管理這些收藏成果。
雖然這些個人與單位都不乏寫企畫書承接政府標案的經驗,有的單位甚至是承接地方社區營造案、文史調查案的常客。但是數位典藏領域相對於過去的社區營造與地方文史工作來說,卻是一個需要耗費龐大資源的工作。計畫初期,需要添購數位化設備,需要的人力資源進行數位化工作。這些投入數位化的工作者還需要相當程度的數位化技術訓練,才能掌握標準數位化流程。
數位化之後,就面臨需要龐大網路空間與頻寬需求,來存放大量的數位物件。以數位化標準規格來衡量,1小時影音檔(WMV/視訊-320*240;傳輸率-150kbps;聲音取樣率-22kHz。)約需要60MG的儲存空間、1小時聲音檔(WMA/150kbps)需要60MG的儲存空間,而1張影像檔( 600DPI/2900×2000像素 )則需要17MG的儲存空間。以民間單位開放最大的免費影音儲存空間為例目前只有1000MB的方案,只能存放約影音資料17小時。而中華電信的網路空間200MG,一年就要價85000元,網路空間對於數位典藏來說可以說是一個必要又個昂貴的資源。解決了數位化與網路儲存空間問題之後,結下來又要面臨更艱鉅的後設資料欄位設計、資料庫系統建置、網站建置等問題,每項問題都需要專業的數位典藏工作者投入。
所以將數位典藏推廣到民間參與層面,不只是要引發民間資料貢獻者的動機,還要解決對民間參與者來說,要面臨的專業知識、數位化能力、人力資源、經費等問題。臺灣原住民數位典藏計畫資料交流的建置,正式考量到民間參與者在資源上的缺乏,於是從提供足夠的網路空間、設計適用資料庫與後設資料著錄介面做通盤考量,為有志投入數位典藏領域的原住民文化工作者,在初期投入階段無須煩惱網路儲存空間問題、無須擔憂資料庫設計與後設資料規劃的困難,先享受數位典藏對於個人研究上帶來的便利,再思考要為了個人收藏做主題是或特色化的典藏規劃時,需要面臨的系統客製化問題,與需要進一步進行龐大數位化工作時,人力短缺與經費不足的問題。面臨這些進階的困難,臺灣原住民數位典藏計畫很樂意扮演諮詢與協助企畫的角色,為民間教育單位、民間博物館與文史工作者,尋求向相關單位申請補助案的機會。
推廣層面的實踐:臺灣原住民數位典藏人才培育研習營
上文提到,臺灣原住民數位典藏計畫的民間合作對象,通常是一群擁有豐富專業原住民文化知識與收藏,但是大部份不使用資訊設備管理收藏成果的單位或個人。礙於經費所限,有的文史工作者累積幾十年的錄音帶面臨發霉危機、錄影帶面臨沒有適當機器播放的窘境。但是數位化技術對於他們來說是陌生的領域,雖然這幾年來曾經接觸過並了解其重要性,但是缺乏實際經驗與足夠時間練習。所以面對這樣的民間參與對象,計畫必須設計足夠時間的訓練計畫,而非只是概念推廣和網站介紹。經過會議討論,本計畫認為超過一天的研習營隊在這個面向上,是一個理想的推廣模式。
從2006年3月到6月其間,數位典藏國家型科技計畫 內容發展分項計畫、數位典藏國家型科技計畫 內容發展分項計畫人類學主題小組、臺灣原住民數位典藏計畫、國立臺灣博物館等單位共同舉辦「臺灣原住民數位典藏與網路百科推廣研習營」臺北、花蓮、臺中、高雄共四場次,2006年7月至9月間,臺灣原住民數位典藏人才培育計畫、數位典藏國家型科技計畫 內容發展分項計畫與臺灣原住民數位典藏計畫等單位,共同舉辦臺灣原住民數位典藏人才培育研習營基礎班、進階班、高階班共5個場次。研習內容從理念推廣、技術層面、數位化操作實務、資料庫後設資料著錄、數位典藏計畫專案管理到企畫撰寫各層面,經過各階段密集的訓練,為民間參與臺灣原住民數位典藏計畫、共享原住民數位文化的願景,打下堅實的人才基礎。有關這部份的實際情形請參考本次會議中主持人潘英海教授的報告。
結語
「臺灣原住民數位典藏計畫」為「數位典藏國家型科技計畫」之「中央研究院機構計畫」項下的其中一個子計畫,第一期的五年計畫已經進行到第五年,如何打開民間參與大門可以說是本計畫能否永續經營的關鍵環節。然而民間參與數位典藏計畫面臨了資源整合、經費申請、教育訓練、計畫專案管理、內容企畫等各層面的多重困難。臺灣原住民數位典藏計畫面對這些複雜難題,從最基礎的資料庫層面著手,建立一個可以提供龐大的數位儲存空間、足夠的網路頻寬資源、合宜的後設資料欄位規劃等面向的資料交流平台,讓民間參與者在投入數位典藏領域時,先不用煩惱數位典藏背後龐大資源整合的難題,而先享有網際網路管理與取用個人收藏的便利。建立在這個平台上,設計教育訓練課程與舉辦多達9場的數位典藏教育訓練(臺灣原住民數位典藏人才培育研習營),從系統規劃到實務推廣,為打開數位典藏民間參與,做好紮根工作。也盼望臺灣原住民數位典藏計畫推動民間參與的經驗,能夠帶給其他領域數位典藏計畫在推動民間參與上實質的幫助。
參考文獻
文上瑜、潘英海
2005《臺灣原住民數位典藏資料庫規劃與建置》。發表於「第三屆兩岸三院信息技術與應用交流研討會」。中國:海拉爾。2005年6月20-23日。
MARTIN, M.Marlene & Douglas A.BLACK (Human Relations Area Files)
2005 HRAF's Culture Conservancy Initiative。Paper presented at International Conference on The Use of Information Technology in the Research and Education in Social Sciences”, The Institute for Cross-Cultural Studies, Seoul National University。Nov. 21st & 22nd,2005。
O'Reilly, Tim
2005 What Is Web 2.0? Design Patterns and Business Models for the Next Generation of Software。 http://www.oreillynet.com 。 資料擷取日期:2006年7月13日。
Pan, Inghai
2005c Formaosan Aborigines Digital Archives: A Brief Introduction. Paper presented at International Conference on The Use of Information Technology in the Research and Education in Social Sciences”, The Institute for Cross-Cultural Studies, Seoul National University。Nov. 21st & 22nd,2005。
註釋
註1:Web 2.0是目前網際網路發展的新趨勢,主要講求系統平台與使用者之間的互動,有關Web 2.0的概念以及其與Web 1.0的差異,請參閱Tim O'Reilly(2005)。
註2:Donor Input System 是M.Marlene MARTIN & Douglas A.BLACK (Human Relations Area Files)於〈HRAF's Culture Conservancy Initiative〉一文中的用詞。該文發表於2005年11月21~22日於韓國首爾大學舉辦的《The Use of Information Technologyin the Research and Education in Social Sciences》學術研討會。
參考資料
參與研發單位:中央研究院-民族所
提供單位:中央研究院-民族所
使用單位:中央研究院-民族所