11.3. 文本信息工具

wc

字数统计,统计文本文件中包含多少个单词。也可以用于统计文件中的行数或字节数。

使用选项 -w 统计单词数, -l 统计行数, -c 统计字节数。或者直接运行不带选项的 wc 命令,以获取全部三项统计结果。

命令语法

wc -option file.txt
style

对特定文本文件运行各种可读性测试。将输出多个不同可读性测试的分数(不带选项)。

命令语法

style -options text_file

Note在 diction 软件包中查找 style
 

此命令是 diction 软件包的一部分,现在似乎不常使用。

cmp

确定两个文件是否不同,适用于任何类型的文件。与 diff 非常相似,但它在二进制级别上进行比较,而不仅仅是文本。

diff

比较两个文本文件,并输出差异报告(有时称为“diff”),其中包含两个文件之间不同的文本。

可用于创建“patch”文件(可以被 patch 使用)。

示例

diff file1.txt file2.txt

diff 将为每个不在第一个文件但在第二个文件中的行输出一个 '>'(后跟该行),并将为每个在第一个文件但不在第二个文件中的行输出一个 '<'(后跟该行)。

sdiff

它不是给出差异报告,而是将文件以两列并排输出,用空格分隔。

diff3

diff 相同,但用于三个文件。

comm

逐行比较两个文件,并打印文件 1 特有的行(第 1 列)、文件 2 特有的行(第 2 列)以及两个文件共有的行(第 3 列)。

使用带有 -1、-2 或 -3 选项的 comm 命令来抑制打印特定的行。只需运行 comm 即可列出全部三列(即文件 1 和文件 2 特有的以及两者共有的行)。

命令语法

comm file1 file2
look

输出系统字典中以给定字符串开头的单词列表 -- 这对于查找以特定短语或前缀开头的单词非常有用。

将字符串作为参数给出;它不区分大小写。

命令语法

look string