5.1. 标记:概述

标记语言是一种用于标记文档以定义文档结构的系统。您可以在文档中添加标签来定义文档的哪些部分是段落、标题、章节、词汇表条目(等等!)。今天有许多标记语言在使用。XHTML 和 HTML 对于编写 Web 文档的人来说会很熟悉。LDP 使用一种名为 DocBook 的标记语言。每种标记语言都使用自己的 “受控词汇表” 来描述文档。例如:在 XHTML 中,段落将使用标签集 <p></p> 标记,而在 DocBook 中,段落将使用以下标记:<para></para>。标签集在一个被称为文档类型定义 (DTD) 的准字典中定义。

标记语言也遵循一组关于如何组装文档的规则。这些规则可以是 SGML(标准通用标记语言)或 XML(可扩展标记语言)。这些规则本质上是文档标记的 “语法”。SGML 和 XML 非常相似。XML 是 SGML 的一个子集,但 XML 在标记文档时需要更精确地使用标签。LDP 接受 SGML 和 XML 文档,但更倾向于 XML。

一个 XML/SGML 文档,当被人阅读时,有三个组成部分。

Note内容、标记和转换
 

Steve Champeon 在他的文章 标记的秘密生活 中出色地解释了内容、标记语言和转换是如何结合在一起的。尽管他是从 HTML 的角度写作,但这些想法是相关的,并且有一个 DocBook 标记的示例。