信息组织
第26卷第125期
中国图书馆学报
2000年1月VQI
26
NO
125
THE
JOURNAL
OFTHELIBRARYscIENcEINCHINA
Jan.2000
tor(其他发行者);(7)Data(日期)}(8)Resource者,这种文件格式是使一种跨平台的通用格式,无Type(资源类型);(9)Format(格式);(10)Re—
论是Windows平台还是UNIX平台都支持这种文source
Identifier(资源标识号);(11)Source(来
件格式。这两种格式标准对数字化图书馆来说都是源);(12)Language(语言);(13)Relation(关联);十分重要的数据格式,数字化图书馆应该同时支持f14)Coverage(包含的范围);(15)RightsManage这两种数据格式标准。
ment(授权管理)。由此可见,都柏林核心的基本元素较MARc而言,是极其简单易懂的。其次.这个4信息组织的基本内容
元数据体系是一种描述型的元数据体系,主要适合描述文献型的数字化信息.比较符合图书馆界对信数字化图书馆信息组织从形式上:看和传统图息组织的基本理念。都柏林核心虽然比较简单,但书馆投有太大的区别,但是其基本内容和传统图书仍然包含了元数据的基本结构,即数据描述、环境馆的信息组织有本质的区射。数字化图书馆信息组描述和权利描述。RDF主要用来和XML配套,有织的基本内容包括:选择、生成、标识、描述和整合。
望成为万维网一种标准数据格式。目前元数据的建4.1选择
立还处于一个战国纷争的时代,还投有形成统一的选择是数字化图书馆信息组织的第一步。所谓标准。这是数字化图书馆信息组织所面临的一个重选择是在浩瀚的信息海洋里发现并确认具有组织、要问题,如果统一的全局性的元数据标准迟迟不能整理和保存价值的信息。美国国会图书馆召开的第有效建立,将大大影响数字化信息的有效组织。
l届全球数字化图书馆信息组织会议解释大会名3.3数据(Data)
称用信息组织(Organizing)而不用编目数据是数字化图书馆信息的载体,数字化图书(Cataloging)时,就强调了选择的作用。对数字化信馆的信息组织归根到底是对数据的管理。数据有多息进行整理,首先是一个选择的过程,而不是对所种表现形式,其中主要是用SGML语言表示的数有的数字化信息进行编目。由于数字化信息易于生据和Adohe的PDF格式数据。SGML语言是一种成、复制与传播,在信息生成阶段.缺乏像印刷型信国际标准的文本标记语言.文献[n]详细介绍了息生成所具有的一个完善的选择、评价制度。数字SGMI。语言,这皂不再赘述。HTML语言是S(;ML化信息的质量与价值参差不齐,这就要求数字化图语言的一个分支.同样是一种文本标记语言,它可书馆在信息组织时,首先进行有效地评价和筛选,以将一个文本标记成超文本,将数据信息由线性组只有有价值的信息才可能被有效组织。对数字化信织转化成为网状组织。H1、ML语言的出现和万维息的选择和评价,将在信息组织阶段由数字化图书网有密切的关系,可以说,万维网的几个关键技术馆实现。也就是说.在数字化信息时代,数字化图书都是和HTML有关的:首先,HTMI。被用来写网馆将承担信息出版机构的职能,从而成为整个杜会页;其次,超文本传输挤议(HTTP)来传输这些网信息评价体系的重要组成部分。所以,信息的选择页;再次,网页浏览器接受、解释和显示用HTMI。是数字化图书馆信息组织的重要内容,是实现数字表示的网页。所以lITML被几乎所有的万维网浏化图书馆信息评价功能的主要手段。
览器所支持,是万维网上的通用数据描述语言。而4.2生成
标准的SGML文件则需要特定的浏览器来借读,生成主要是指数字化图书馆馆藏的建立过程。其在万维网上远不如HTML流行。另一种万维网数字化图书馆的馆藏是数字化信息的有序体系,其上流行的数据格式是Adobe的PDF格式,这种格建立过程主要包括收集和转换两个过程。(1)收集式的最大优点在于可以保持信息在印刷型载体上现有的数字化信息。南于计算机和其他数字化信息的原有样式,可以自然地展示文本中的图像、图表、输^工具的普及,本源的数字化信息越来越多.特复杂公式等文本文件难以展示的信息,特别适合表剐是互联网的发展,更是刺激了本源的数字化信现科学文献信息。其次,这种格式文件生成也较为息,如网上电子期刊如雨后春笋般出现,包括纯粹容易,可以借助扫描仪等数字化转换工具生成.比的电子期刊和普通期刊的网络版等。人们已经习惯较适合将印刷型文本信息转换成数字化信息。再
并乐于将自己的研究成果公布在互联网上。所以.
万一74方数据