Metadata,中文譯名“元數據”,是描述一個資源屬性的數據,目前,元數據是網絡資源組織發展的熱點,它與XML的發展密不可分。基於XML的元數據格式將走向標準化,為網絡環境下資源的高效組織和利用提供必要的手段,元數據和XML的結合將在不斷發展的網絡信息資源共享和組織中發揮有效的、強大的作用。
①基於XML的都伯林核心(DC),是1995年國際組織擬定的用於標識電子信息資源的一種簡要目錄模式,它有簡練、易於理解、可擴充及能與其它元數據形式進行連接等優點,目前它由15個數據單元組成。
②基於XML的RDF,(即資源描述框架)是由W3C組織開發的另一種元數據格式。RDF幾乎能夠描述所有用統一資源標識(URI)命名的資源。RDF通過抽象的數據模型為定義和使用元數據建立一個框架,元數據元素可看成其描述的資源的屬性。進一步地,RDF定義了標準Schema,規定了聲明資源類型、聲明相關屬性及其語義的機製,以及定義屬性與其它資源間關係的方法。另外,RDF還規定了利用XML Namespace方法調用已有定義規範的機製。
③基於XML的元數據還有PICS即“Internet內容挑選平台”,由W3C組織開發,PICS的特點是它的內容分類定級機製,不同的人可以根據其各自的目的和觀點標記網頁內容,從而進行控製,而不必對信息提供者進行控製。PICS2.0版已移至XML環境下。
Web Collections即“Web收集”,是一個較早的基於XML的元數據規範,基於XML的Web Collections的元數據能深入地描述網絡資源,給用戶提供方便。
CDF(即頻道定義格式)是由Microsoft公司提出的基於XML的元數據規範,MCF(即元內容框架)是由Netscape公司於1997年6月提出的一個基於XML的元數據方案。MCF使用XML—MCF標記,它與CDF形成頻道轉換技術的兩在標準,促進了信息推送技術的發展。
基於XML的元數據管理係統可以用來建立數字圖書館等其它主題資料數據庫。它具有利用SCHEMA(或DTD)建立數據庫、編輯元數據、建立索引點、查詢、轉入及轉出XML記錄等功能。
元數據技術是數字圖書館係統的核心,而XML良好的結構和強大的標記功能使得它可以描述許多不同領域的元數據,此外,一個機構的資源類型可能有多種,也可能會采用多種元數據格式,建立一種基於XML的通用元數據管理係統來管理各種元數據格式是目前數字化的方向,一旦此類係統在不僅僅是數字圖書館的各種行業大範圍應用,那麼由於XML的“世界語”
的特性,易擴展性和互操作性,跨係統的信息資源檢索平台的建立將成為可能,從而更好地為人們共享知識、交流思想服務。
四、元數據與MARC的關係和比較
那麼,有些人會問,這幾年來,我們正在推廣文獻的MARC著錄,為什麼又出現元數據這種新的文獻著錄格式呢?由於書籍是淵源流傳的文獻知識的主要流通形式,自然成為圖書館最主要的收藏,為了能有效管理館藏書籍和提供高效率的服務,製作目錄一直是圖書館技術服務的核心工作,也是圖書館讀者服務的主要基礎。為了要使用計算機來處理書目數據,使用了記載格式為機讀編目格式(MARC),從1966年到現在,計算機逐漸取代卡片目錄成為主要的處理工具。
但是,由於MARC編目的複雜性,使得書目資料的製作成本很高,其使用和流通成本卻極低,無疑是阻礙了它的繼續發展的步伐。隨著互聯網絡的日益普及,網絡資源的整理和檢索也日益重要,MARC在此方麵也顯得力不從心。就設計結構不合理而言,MARC以前給非圖書館專業人士的第一印象是複雜且深奧難懂,至於對計算機科技有較深了解的人,則會驚訝的看到機讀編目格式中有很多資料重複的現象。綜上所述,我們可以發現MARC的局限性主要表現為以下幾個方麵:
①對文獻和信息描述手段往往隻適合用於圖書館;②MARC需要在專門的軟件係統中使用;
③修訂程序複雜、緩慢;
④適用於完整的、靜止的信息內容的處理,不易處理動態的多媒體信息;⑤編製一條機讀記錄不僅需要經過嚴格的專業訓練,而且需要花一定的時間。