1、元数据的定义
元数据(Metadata)是描述、解释、定位或者为更容易地进行检索、使用或管理信息资源而进行的结构化信息。换句话讲元数据是指有关数据的数据或有关信息的信息。在不同的领域,元数据有不同的用法。一些领域使用它指机器可理解的信息,另一些领域将其仅用于描述电子资源的记录。在图书馆环境中,元数据通常应用于各类客体,包括数字的或非数字的资源描述。传统的图书馆中使用的编目录便是元数据的一种形式。元数据是确保资源在将来继续存活并可接入的关键。元数据以非特定语言的方式描述在代码中定义的每一类型和成员。元数据存储以下信息,详见下表1。
表1:元数据存储的信息
2、元数据的种类
元数据有如下3种类型:
1) 描述型元数据:为发现和标识的目的描述资源的元数据。可以包括象标题、摘要、作者和关键字等元素。
2) 结构化元数据:该类元数据表明如何将构成组建组合在一起,如页如何排序来形成章节。
3) 管理用元数据:该类元数据提供帮助管理资源的信息,象何时和如何创建文件、文件类型和其他技术上的信息以及哪些人可以接入该文件的相关信息。包括产权管理元数据(涉及智能知识产权的信息)和保留元数据(包含为存档和保留资源所需要的信息)。
3、元数据的应用
创建描述性的元数据的主要原因之一是便于相关信息的发现。除了资源发现外,元数据可以帮助组织电子资源、方便互操作及与传统资源集成,以及数字标识并支持存档和保留。
1) 资源发现:在资源发现上,元数据与好的编目具有相同的功能。所完成的功能主要包括如下表3-1所示的4项。
表3-1:资源发现的功能
2) 组织电子资源:随着电子资源信息数量的迅猛增加,利用静态的内容列表来组织电子资源(给出资源的位置和端口)已经不能满足业务发展的需要。利用元数据来动态组织电子资源会为用户提供更高质量的服务。
3) 互操作:随着数字化内容信息网络化传输的应用越来越普及,跨网络跨应用系统和平台的业务及应用越来越多,采用相同标准的元数据可以方便信息的跨应用平台的查找和使用。
4) 数字标识:持续地唯一标识一个客体内容的标识信息。元数据可组合一系列标识数据以便于使一个客体区别于其他不同的客体。
5)存档和保留:随着存储媒体、硬件和软件技术的改变,在未来可能会出现数字化的资源不可用的可能性,为此元数据是确保数字资源在未来可以使用的关键。
上面所谈到的元数据的应用主要集中在对数字化资源本身的标识、组织、存档和保留、查找以及互操作等方面。随着Internet网络和应用的不断发展,利用网络进行数字化信息的存储、查找、使用变得越来越重要。为利用网络进行数据信息的查询、传输和应用,需要增加用于描述一些动态信息的元数据,如用户对内容的喜好、用户所使用的终端能力、使用的传输网络的动态资源信息,以及表示相同内容信息所采用的不同的编码压缩方式等相关信息的元数据,以辅助用户利用网络查找和消费数字化的内容资源。
4、元数据相关标准的发展情况
研究和制定与元数据相关的国际标准化机构包括: ISO/IEC、W3C、IETF、ETSI和ITU等。已经制定的相关标准有下表4所列。有关元数据的国际标准规范仍在发展过程之中。
表4:已制定的相关元数据的标准列表
元数据是描述信息资源或数据等对象的数据,其使用目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。
欲进一步了解数据通信系统的请进入。