Dublin Core:讀網筆記

冼行健 澳門圖書館暨資訊管理協會秘書

Dublin Core簡介



  Dublin Core1是一個元數據(metadata)的標準建議。元數據就是描述數據的數據。其實,我們熟悉的書目數據就是元數據的一種。該建議在網際網路及圖書館界備受關注。它是在Oclc總部俄亥俄的Dublin市的工作會議上提出的,故有此名。2

  Dublin Core的主要目的是爲協助電子資源的發現。最初是爲編寫網頁的作者描述網頁之用。其作用與目錄相似。最初建議以metatag的形式加在網頁之中,RDF(Resource Description Framework)3制訂後,Dublin Core立即成爲RDF 的最早用途之一。

  用圖書館學常用的語言來說,Dublin Core相當於機讀格式MARC。它定出了在電子資源的題名(Title),主題(Subject),責任者(Creator)等如何以電子的形式記錄。

  發展Dub1in Core的原意有點像CIP4。它旨在讓網頁的制作者或發行者可以自行在網頁中加入該網頁的目錄資料。Dublin Core定出了網頁目錄的最核心項目,以及在網頁中加入這些項目的語法。

Dublin Core的項目



  Dublin Core的項目包括title,creator,subject,description,publisher,contributor,date,type,format,identifier,source,language,relation,coverage,及rights。這些項目設計成爲對網頁編目的最小核心,編目者可以自行加入其它的項目,名字中的core即由此而來。Dublin Core的設計以描述電子資源爲目標,但其應用不限於此。圖書館界中亦佷關注Dublin Core的發展和它與編目的關係。

  Dublin Core本身僅定出各個項目及其定義和說明,並未有類似編目規則的設立。Dublin Core中各項目的詳細內容爲:
  Title:資源的題名。
  Creator:對資源的建立負有主要責任的人或個體。
  Subject:資源內容主題的描述。Subject中可以是關鍵詞、短語、分類號碼等。Dublin Core建議採用控制的詞彙或正規的分類號表。
  Description:資源的內容描述。Description中可以包括摘要、目次、對主題圖示的引用或文字說明。
  Publisher:對資源的發行負有主要責任的人或個體。
  Contributor:對資源有貢獻的人或個體。
  Date:資源生命週期中事件的日期。一般Date包括資源最初產生或發行的日期,建設採用iso 8601中所規定者或yyyy-mm-dd格式。
  Type:內容的形式。建議採用5中所列的詞。該詞表包括:collection;dataset;event;image;interactiveresource;model;party;physical object;place;service;software;sound;text.Type中描述內容的本質對資源格式使用format。
  Format:資源所採用的格式。建議採用Internet Media Types6。常用的有:text/html;text/plain;application/msword;application/pdf;application/zip;image/gif;image/jpeg等:
  Identifier:資源的唯一標識。目前網上仍未就標識有共識。建議採用uri,doi,issn,isbn等作爲標識7
  Source:目前資源的來源。如果這個資源是其它資源的衍生,建議採用一個標識指引資源的來源。
  Language:建議採用rfc17668的代碼。Rfc1766的格式是iso639中規定的兩位語代碼。後面可以——接iso3166的國家代碼來作更細的區分。常用的代碼有:zh;zh-cn;zh-hk;zh-tw;pt;pt-br;en-us;等。
  Relation:指向相關資源的標識。
  Coverage:資源內容的範圍。Coverage一般可包括地名、時間、行政轄區等。建議採用控制的詞匯或標準代碼。
  Rights:對資源使用的授權說明。包括版權說明等。
  

利用Dublin Core的例子:



  假設這一篇文,用Dublin Core來描述時,會有以下的項目。
  這篇文章的題名是Dublin Core:讀網筆記,著者是行健,出版者是圖書館協會。因此,這篇文章的Dublin Core記錄應該有:
  Creator:冼行健
  Title:Dublin Core:讀網筆記
  Publisher:澳門圖書館暨資訊管理協會等。
  如果在網頁中用meta標註Dublin Core的方法9是在html的head中加入。例如:
  <html> <head>
  <link rel="schema.DC"
  href="http://purl.org/DC/elements/1.1">
  <meta name="DC.Creator" content="冼行健">
  <meta name="DC.Title" content="Dublin Core:讀網筆記">
  <meta name="DC.Subject" content="Dublin Core, Metadata, Cataloging">
  <meta name="DC.Publisher" content="澳門圖書館暨資訊管理協會">
  <meta name="DC.Language" content="zh">
  <meta name="DC.Date" content="1999-12-27">
  <meta name="DC.Format" content="application/msword">
  <title>Dublin Core:讀網筆記</title>
  </head> <body>......
  除了放在html中,還可以利用RDF10編制dublin Core。如我們用Dublin Core用RDF的框架,編制"一九九九澳門市民資訊需求調查"這一網頁的目錄。該網頁的題名和著者等資料爲:
  題名:一九九九澳門市民資訊需求調查。責任者:冼行健、譚祥金。網址:http://purl.oclc.org/NET/macauinfosurvey1999等。
  利用rdf寫出的目錄爲:
  <?xml version="1.0"?>
  <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:dc="http://purl.org/dc/elements/1.1/">
  <rdf:Description rdf:4about="http://purl.oclc.org/NET/ macauinfosurvey1999">
  <dc:creator></dc:creator><dc:creator></dc:creator>
  <dc:title></dc:title>
  <dc:date>1999-12-21</dc:date>
  <dc:language>zh</dc:language>
  <dc:format>text/html</dc:format>
  <dc:subject></dc:subject>
  </rdf:Description>
  </rdf:RDF>

對Dublin Core的限定



  Dublin Core對項目的定義比較簡單力因此其意義亦較含糊。如:creator的角色,date所指的日期與資源的關係,日期的格式。subject所採用的詞取自哪一套詞匯,或分類號是何分類法的號碼等力均難以表達。雖然這可令Dublin Core的制定較快和較易。但這些含糊會對Dublin Core的使用帶來很多不便。由此展開了許多討論。對Dublin Core的限定借用了xml的名域(Namespace)的槪念。相信很快這些限定就會形成,屆時會對Dublin Core的使用有較大的促進。

Dublin Core與MARC



  美國國會圖書館目前與MARC相關的項目很多,相當部份與爲網絡環境下爲MARC找一套新的架構相關。這些嘗試包括marcsgml11.ead12等(http://lcweb.loc.gov/marc/)。可以預見,MARC的轉變和消忘是一定的,問題是接任者是誰和何時發生。
  雖然1c並沒有將tei header和dublin core明確地作爲候選者(目前看來ead 較佔優)但它們是實在的競爭者。與其它候選者相比,Dublin Core的優點是比較簡單,且其來自草根階層,被接受的機會較高。

Dublin Core的前景



  將希望寄於作者自行編制Dublin Core是因爲網上的資源數量大,由人工進行的話,非如此不可。但作者自身並非編目員,對控制詞匯等工具的使用往往不能很佳。因此對此期望亦不可太大。目前使用Dublin Core的網頁制作者很少,故此將Dublin Core用於自行編目的應用似乎不是很行得通。加上對網頁維護制作時,制作人員往往對元數據不太重視,加之部份網頁乃由機器自動生成。因而DublinCore在這方面其作用應不大。

  另一方面,作爲網絡資源數據庫方面,採用Dublin Core可以方便其與其它機構交換數據,亦不需重新設計數據庫的內容。故此Dublin Core在這方面的應用會較佳。
  1 Dublin Core Metada Eleement Set,Vversion 1.1;Reference description [Recommendation]/Dublin Core Metadata Initiative.http://purl.org/dc/documents/rec-dces-19990702.htm(1999.12.26)
  2 Dublin Core Metadata Initiative: Question and answers/Dublin Core Metadata Initiative.http:// purl.org/dc/education/index.htm,(1999.12.26)
  3 RDF是元數據的文件格式框架,RDF定出利用XML語言編寫元數據的一個通用框架。RDF 的地位與機讀編目格式(MARC)中的iso2709相若。
  4 CatalogInPrint,在出版品中加入出版品的編目資料。
  5 List of resource types: 1999-08-05 / Dublin Core Metadata Initiative. 1998.08.05, http://purl.org/dc/documents/wd-typelist.htm (1999.12.26)
  6 Media types / IANA. http://www.isi.edu/in-nodes/iana/assignments/media-types/media-types (1999.12.26)
  7 標識是一個關鍵及難題。如對標識有興趣, Clifford Lynch的文章是十分値得閲讀的。
  8 Tags for the identification of languages, Internet RFC 1766. http://jwww.ietf.jjjrfc/rfc1766.txt (1999. 12.26)
  9 IETF RFC 2731 Encoding Dublin Core Metadata in HTML/IETF.http://www.ietf.org/rfc/rfc2731.txt
  10 Rdf是W3C制定的一個用於metadata的框架。該框架的相關資料可在http://www.w3.org/RDF/得到
  11 http://lcweb.loc.gov/marc/marcsgml.htel
  12 http: //lcweb.loc.gov/ead/
  參考文獻及網頁
  [CCDA1] Dublin Core and the cataloging rules: analysis project /Committee on Cataloging: Description and Access. http://www.libraries.psu.edu/iasweb/personal/jca/dublin/index.htm (1999.12.26)
  [CCDA2] Draft: Dublin Core, metadata and cataloging rules / [ALA]. Committee on Cataloging: Description and Access. http://www.lib.virginia.edu/ccda/about/draftl.html (1999.12.26)
  [CCDA3] Final report / [ALA] Committee on Cataloging: Description and Access.1998.08.21. http://www.ala.org/alcts/organization/ccs/ccda/tf-tei2.html (1999.12.26)
  [DCI1] Dublin Core Initiative : http://purl.org/dc/.
  [DCI2] Dublin Core Metadata Element Set, Version 1.1: Reference description [Recommendation] / Dublin Core Metadata Initiative. http://purl.org/dc/documents/rec-dces-19990702.htm (1999.12.26)
  [DCI3] Dublin Core Metadata Initiative: Question and answers / Dublin Core Metadata Initiative. http://purl.org/dc/education/index.htm, (1999.12.26)
  [DCI4] Dublin Core Metadata Element Set, Version 1.1: Reference description [Recommendation] / Dublin Core Metadata Initiative. http://purl.org/dc/documents/rec-dces-19990702.htm (1999.12.26)
  [DCI5] Dublin Core Metadata Initiative: Question and answers / Dublin Core Metadata Initiative. http://purl.org/dc/education/index.htm, (1999.12.26)
  [DCI6] Guidance on expressing the Dublin Core within the Resource Description Framework (RDF) / Dublin Core Metadata Initiative. http://www.ukoln.ac.uk/metadata/resources/dc/datamodel/WD-dc-rdf/. (1999.12.26)
  [IETF1] IETF RFC 2731 Encoding Dublin Core Metadata in HTML / IETF. http://www.ietf.org/rfc/rfc2731.txt
  [IETF2] IETF RFC 2731 Encoding Dublin Core Metadata in HTML / IETF. http://www.ietf.org/rfc/rfc2731.txt
  [LC1] MARC standards. http://lcweb.loc.gov/marc/
  [LC2] Dublin Core - Marc - Gils crosswalk / [Library of Congress] Networ development and MARC standards office. 1999.10.14. http://www.loc.gov/marc/dccross.html (1999.12.26)
  [LC3] Encoded Archival Description (EAD): Official web site / Library of Congress. http://lcweb.loc.gov/ead
  [Lynchl] Identifiers and Their Role in Networded Informaion Applications / Clifford Lynch. http://www.arl.org/newsltr/194/identifier.html (1999.12.25)
  [Lynch2] The Dublin Core descriptive metadata program: strategic implications for libraries and networked information access / Clifford Lynch. http://www.arl.org/newsltr/196/dublin.htm (1999.12.26)