文本转换/过滤器工具

过滤器 (UNIX 系统/dos 格式)

以下 过滤器 允许您将文本从 Dos 风格 转换为 UNIX 系统风格 ,反之亦然 ,或者将文件转换为其他格式。 另请注意,许多现代文本编辑器可以为您执行此操作...

为什么要使用过滤器?

因为 UNIX 系统和 Microsoft 使用两种不同的标准 来表示 ASCII 文本文件中的行尾

这有时会在不熟悉其他操作系统行尾风格的编辑器 或查看器 中引起问题 以下 工具允许您解决此差异。

有什么区别?

区别非常简单,在 Windows 文本文件中,换行符 由回车符 后跟换行符表示 ,即 ASCII 中的 '\r\n'。

UNIX 系统中,换行符 只是一个换行符,即 ASCII 中的 '\n'。

dos2unix

这会将 Microsoft 风格的行尾字符 转换为 UNIX 系统风格的行尾字符。

只需输入

dos2unix file.txt
fromdos

这与 dos2unix (如上所述) 的作用相同。

只需输入

fromdos file.txt

fromdos 可以从 from/to dos 网站获取。

unix2dos

这会将 UNIX 系统风格的行尾字符转换为 Microsoft 风格的行尾字符

只需输入

unix2dos file.txt
todos

这与 unix2dos (如上所述) 的作用相同。

只需输入

todos file.txt

todos 可以从 from/to dos 网站获取。

antiword

此过滤器 将 Microsoft word 文档 转换为纯 ASCII 文本 文件

只需输入

antiword file.doc

您可以从 antiword 首页获取 antiword

recode

在各种格式之间转换文本文件 ,包括 HTML 和数十种不同的文本编码形式

使用 recode -l 获取完整列表 它也可以用于在 Windows UNIX 系统格式之间转换文本 (这样您就不会得到奇怪的符号)。

警告

默认情况下,recode 会覆盖输入文件,使用 '<' 仅将 recode 用作过滤器 (且不覆盖文件)。

示例

 

UNIX 系统文本转换为 Windows 文本

recode ..pc file_name

Windows 文本转换为 UNIX 系统文本

recode ..pc/ file_name

UNIX 系统文本转换为 Windows 文本,但不覆盖原始文件 (并创建新的输出文件 )

recode ..pc < file_name > recoded_file
tr

(仅限 Windows 到 UNIX 系统风格转换 )。 虽然 tr 不是专门 设计用于通过执行以下操作将文件从 Windows 格式 转换为 UNIX 系统格式

tr -d '\r' < inputFile.txt > outputFile.txt

-d 开关表示简单地删除字符串的任何出现 因为我们正在查找 '\r',即回车符 ,它将删除找到的任何回车符 使文件成为 UNIX 系统文本文件。 您可以在此处阅读更多关于 tr 的信息,名为文本操作工具的章节

转换工具

enscript

将文本文件转换为 postscript 、rtf 、HTML (使用 ghostview 查看 postscript 文件 )。 enscript 有大量的选项 ,可用于自定义 输出。

示例:[1]

enscript --language=html input_file.txt -o output_file.html

这将获取一些文件并将其输出为 html 文件

enscript --help-highlight

显示关于使用高亮功能的帮助 (列出所有可用的不同类型的高亮 )

enscript --help-highlight

高亮 (美化打印),示例

enscript -E --color --language=html --toc --output=foo.html *.h *.c 

将所有带有 .h 和 .c (C 源代码 和头文件 ) 的文件添加到名为 foo.html 的文件中,使用颜色并添加 目录

有关更多选项,请参阅 enscript 的编写良好的手册页

figlet

用于创建 ASCII “艺术字”。 Figlet 可以创建几种不同形式 (字体) 的 ASCII 艺术字 它是周围更不寻常的程序 之一

注释

[1]

这些示例基于 enscript 手册页中的信息,有关更多信息,请参阅参考书目中的 [12] Bibliography