标记语言是一种用于标记文档以定义文档结构的系统。您可以在文档中添加标签来定义文档的哪些部分是段落、标题、章节、词汇表条目(等等!)。今天有许多标记语言在使用。XHTML 和 HTML 对于编写 Web 文档的人来说会很熟悉。LDP 使用一种名为 DocBook 的标记语言。每种标记语言都使用自己的 “受控词汇表” 来描述文档。例如:在 XHTML 中,段落将使用标签集 <p></p> 标记,而在 DocBook 中,段落将使用以下标记:<para></para>。标签集在一个被称为文档类型定义 (DTD) 的准字典中定义。
标记语言也遵循一组关于如何组装文档的规则。这些规则可以是 SGML(标准通用标记语言)或 XML(可扩展标记语言)。这些规则本质上是文档标记的 “语法”。SGML 和 XML 非常相似。XML 是 SGML 的一个子集,但 XML 在标记文档时需要更精确地使用标签。LDP 接受 SGML 和 XML 文档,但更倾向于 XML。
一个 XML/SGML 文档,当被人阅读时,有三个组成部分。
内容。 作为 TLDP 作者,记住这是最重要的部分是很好的。许多作者会先编写内容,然后再添加标记。内容可以包括纯文本和图形。这是 LDP 作者唯一需要的部分!
标记。 为了描述文档的结构,在内容之上添加了一个受控词汇表。它用于区分不同类型的内容:段落、列表、表格、警告(等等)。标记还必须符合 SGML 或 XML 规则。如果您不习惯向文档添加标记,TLDP 志愿者会为您完成。
转换。 最后,文档从 DocBook 转换为 PDF、HTML、PostScript,以便以数字或纸质形式显示。这种转换通过文档样式语义和规范语言 (DSSSL) 控制。DSSSL 告诉执行转换的程序如何将原始标记转换为人类可以阅读的内容。LDP 使用一系列脚本来自动化这些转换。您不需要转换自己的文档。
![]() | 内容、标记和转换 |
---|---|
Steve Champeon 在他的文章 标记的秘密生活 中出色地解释了内容、标记语言和转换是如何结合在一起的。尽管他是从 HTML 的角度写作,但这些想法是相关的,并且有一个 DocBook 标记的示例。 |