专 业 推 荐
精 品 文 档
↓
MARC21与MARCXML关系的实践研究
李 刚
(国家图书馆图书采选编目部,北京 100081)
【摘要】为了MARC机读目录Web数据库能在互联网上充分发挥其功能。简要介绍了MARC21与MARCXML的关系及相互转换和美国的工具软件《MarcEdit 4.5》。【关键词】MARC21;MARCXML;Internet
随着网络时代的来临,网络技术正在日新月异地发展。其中,Web数据库以及XML(eXtensible Markup Language)技术是一个重要领域。网络上的信息格式也发布的XML Schema、1999年1月发布的XML Namespaces、1999年11月发布的用于处理XML转换的XSLT和用于在XML文档中定位的XPath,以及2001年6月发布的XLink和XML 媒体NewsML、化学CML、数学MathML、电子书籍Open eBook等)开发与自己的特定领域有关的标记语言,这样使得该领域中的人们可以交换笔记、数据和信息,而不随着网络技术的发展而发展。以前,只用HTML(Hypertext Markup Language)语言来编写网页,但随着Internet和Web的日益发达,网络上的数据量不断增加,数据结构也越来越复杂,HTML也就逐渐暴露出它的不足。在这种情况下,XML技术应运而生,XML最主要的特点是保持用户的使用界面与结构化的数据相互独立,XML标记只描述文档的结构和语义,并不描述页面上元素的格式。HTML数据不合语义,而XML数据则带有语义,它是一种半结构化数据,稍加处理,就能成为格式化数据,进而与数据库技术综合应用。其中,MARCXML是MARC目录Web数据库在互联网上充分发挥功能的关键之一。
自从Web诞生以来,Web的每一步发展、技术成熟和应用领域的拓展,都离不开成立于1994年10月的W3C(World Wide Web Consortium,万维网联盟)的努力。W3C是专门致力于创建Web相关技术标准并促进Web向更深、更广发展的国际组织。
Web标准不是某一个标准,而是一系列标准的集合。网页主要由三部分组成:结构(Structure)、表现(Presentation)和行为(Behavior)。对应的标准也分三方面:结构化标准语言主要包括XHTML和XML,表现标准语言主要包括CSS(是Cascading Style Sheets层叠样式表的缩写)和XSL指扩展样式表语言(eXtensible Stylesheet Language),行为标准主要包括对象模型(如W3C DOM(Document Object Model))、ECMAScript等。
1998年2月发布的XML1.0是W3C最具影响的标准之一。XML作为下一代Web的第一块重要基石,为分布式的、异构的数据交换提供了强大的功能,并且将数据本身和数据的表现分离,就数据本身而言,数Base等。
HTML是由SGML的一个子集发展而来的,尽管HTML在Web上得到了广泛的应用,取得了良好的效果,但已经不能满足日益增长的需求。
与HTML相比,XML有以下这些主要优点:
(1)结构化。
HTML着重于数据的显示,它包含了格式标记、结构标记和语义标记。而XML则着重于数据结构的描述,XML标记只描述文档的结构和语义,而并不描述页面上元素的格式。XML最主要的功能是保持用户的使用界面与结构化的数据相互独立,例如,在HTML中,标记<B>表示将选定的内容显示为粗体,而在XML中,则使用样式表(XSL和CSS)来定义数据内容的显示格式。XML将数据的呈现和处理分开,一方面可以简化XML文档的复杂度,另一方面也可以扩大XML的应用范围,尤其在传输数据时。由于XML提供了一个结构化的数据结构,随着互联网上许多机构逐渐采用XML标记,用户可借此搜索和操作应用程序中的数据,同时可借助任何方式通过网络进行传递,并在浏览器或其他应用程序中做进一步的处理或检查。
(2)可扩展性。
XML是一种元标记语言,所谓的元标记就是用户可以根据自己的需要定义自己的标记。任何满足XML命名规则的名称都可以被定义为标记,这就为不同的应用程序打开了大门。而HTML则是一种特殊用途的标记语言,它将所有的标记都定义了特定的意义,对于用户自己定义的标记是无法识别的。因而当这些标记无法满足用户需要时,惟一的办法就是在应用程序中进行编程处理,因而HTML的灵活性比较差。
由于XML和SGML都是元语言,因此用用担心接收端的人是否有特定的软件来接收数据。XML的功能非常强大对于人类和计算机程序来说,都是很容易阅读和编写的,因而成为交换语言的首选。
(3)保值性
随着计算机的不断发展,计算机数据的保存成了需要重点解决的一个实质性问题。在过去几十年中,大多数计算机的数据都丢失了,这并不是因为自然损害和备份介质的磨损,而是因为没有人来写出如何读取数据和数据格式的文档。
从低层次来讲,XML在基本水平上使用的是非常简单的数据格式。它可以用100%的纯ASCII文本来书写,也可以用几种其他定义好的格式来书写。ASCII文本格式能够接纳一定的错误,去掉几个字节甚至是很大一串字节序列都不会破坏剩余的文本,这与其他很多格式是完全不同的。XML的数据格式有利于计算机数据的保存。在图书馆和信息科学方面,以XML格式表示MARC记录的MARCXML是由美国国会图书馆开发的一个XML Schema,它在各种MARC目录标准中是以MARC21为基础,通过它轻松共享和联网获取书目信息。
MARC记录是由三个要素:记录的结构,内容名称,记录的数据内容组成。记录的结构执行国际信息交流标准格式(The International Standard Format for Information Exchange)(ISO 2709)和美国的书目信息交换(Bibliographic Information Interchange)(ANSI/NISO Z39.2)。内容名称符合MARC机读目录格式。数据内容,包括国际标准书目著录(International Standard Bibliographic Description)(ISBD),英美编目规则(Anglo-American Cataloguing Rules),美国国会图书馆主题词表(Library of Congress Subject Headings)(LCSH),网络财富・Intemet fortune・Library Work
楚雄彝族自治州地方文献资源
整合开发利用研究
陈晓兰,张德云
(楚雄师范学院,云南 楚雄 675000)
【摘要】对楚雄州地方文献资源优势和文献涵盖的内容进行阐述,提出收集、开发、整合利用策略,以期为促进彝州经济、文化和社会发展服务。【关键词】楚雄地方文献;开发、整合利用
1.楚雄地方文献概况及开发的意义地方文献是指记录某一地区自然现象、社会现象、人文现象等知识和信息的一切载体。楚雄地方文献资源主要指楚雄州境内迄今以来所发生的一切文化现象,诸如民族、考古遗迹、历史人物、礼仪伦理、文学艺术、科技教育、饮食服饰、方言俗语……等等诸多内容的图书文献资料[2]。楚雄彝州历史文化和民族文化积淀十分丰厚、文献种类繁多,特别是改革开放以来,民族文化更加繁荣兴盛,其颇具影响的如《彝族文化研究丛书》、《彝族文化》年刊、《彝汉字典》、《彝文文献译丛》等等文献,为研究彝族历史、政治、原始宗教、哲学、地理、医学、民俗、文学艺术、语言文字等提供了珍贵的资料;知名学者刘尧汉先生所著的《文明中国的彝族十月历》和《中国文明源头新探——道家与彝族虎宇宙观》等,揭开了中国文明源头之迷;独具特色的“禄丰恐龙”、“腊马古猿”、“元谋猿人”、彝族十月太阳历、彝族风情等等,所有这些,图书馆很有必要通过多种形式对其进行收集,整理、加工,编制出《楚雄地方文献目录》,在此基础上,着力构建楚雄地方文献专题数据库,整合开发地方文献信息资源,更好的为地方经济建设提供有效的文献信息服务,这是一件意义深远,利在当代,功在千秋的大事。
2.楚雄地方文献涵盖的内容
楚雄地方文献概括起来把它分为三类:
2.1 地方史料
主要指地方性知识信息,具体而言,有以下几个方面:(1)史、志、谱。地方统,Macintosh和UNIX平台和支持MARC21的书目、规范、馆藏、分类和社会的信息格式。其它转换工具应用软件还有《MARC to XML/XML to MARC Conversion Utilities》。
史是针对楚雄某一地区或某一方面发展沿革的系统描述。例如《中国共产党楚雄地方史》、《楚雄州文史资料选辑》等等。地方志是以一定的体例记载楚雄地区自然和社会的各个方面或某个方面的历史与现状的著述。如《楚雄州志》、《楚雄州交通志》等等。谱通常是指家谱,一般是对某一姓氏家族延续情况的记录,如彝文古籍中主要人物父子连名谱的世系纪年;(2)地区概况。主要反映楚雄地区政治、经济、社会、文化等情况的文献类型的总称。如楚雄州年鉴、统计资料、概览、指南、地方风情录等等;(3)彝族文献。楚雄州是彝族的聚居地,彝族先民在漫长的历史长河中通过不断的积累,产生了大量的彝族文献和彝文古籍,这类文献既体现民族特征,也体现聚居地的地域特征,对研究本地区民族的发展具有较高的文献价成数据库系统中MARC21书目的HTML格式显示及《MarcEdit 4.5》(右侧)转换MARC21成MARCXML格式工具的界面。图2例子的转换后MARCXML格式显示建立MARC的Web数据库,MARCXML是MARC21的Web数据库的FRBR(书目记录的功能需求)在互联网的上得以实现的基础。
参考文献
图1
XML是描述内容的数据格式,在使用XML数据时,还需要XML数据的显示、打印、数据结构的变更等许多相关技术。MARCXML(见图2)可由专用程序从MARC21转换产生,例如《MarcEdit 4.5》(见图1),其功能包括:能够运行于任何个人电脑(486)使用Windows 9x/ME/NT/2000/XP系统。有转换MARC21成MARCXML,MARCXML成MARC21等多种功能。XML DTDs的所有的MARC 21格式也可以转换。该转换工具,可为DOS,Windows操作系统,Windows NT中,OS/2操作系
[1][EB/OL].http://en.wikipedia.org/wiki/MARCXML.[2][EB/OL].http://www.loc.gov/standards/marcxml/.[3]国家图书馆MARC21格式使用手册课题组.MARC21书目数据格式使用手册[M].北京:北京图书馆出版社,2005.9.
[4]李刚.FRBR和 MARC21、MARCXML的功能研究[J].经纪人:科学与教育探索,2008,5(5):59-60.
[5][EB/OL].http://www.loc.gov/marc/marctools.html.
作者简介:李刚(1960—),男,馆员,发表论文2
篇,专著1部。
图2
例子:作者:Rhys,Jean;作品:Wide Sargasso Sea
图1例子的16版Aleph500MARC书目集
网络财富 2009年5月 158
因篇幅问题不能全部显示,请点此查看更多更全内容