文本信息工具

wc

字数统计,统计文本文档中包含多少个单词。也可用于统计文件中的行数或字节数

使用选项 -w 统计单词数, -l 统计行数-c 统计字节数。 或者直接运行 wc 命令不带任何选项,即可获取全部三项统计结果。

命令语法

wc -option file.txt
style

对特定文本文件运行各种可读性测试。 将输出多个不同可读性测试的得分(不带任何选项)。

命令语法

style -options text_file

在 diction 软件包中查找 style 命令:此命令是 diction 软件包的一部分,现在似乎不常用

cmp

确定两个文件是否不同,适用于任何类型的文件。 与 diff 非常相似,只是它在二进制级别进行比较,而不仅仅是文本。

diff

比较两个文本文件并输出差异报告(有时称为 "diff"),其中包含两个文件之间不同的文本。

可用于创建“补丁”文件(可供 patch 命令使用)。

示例

diff file1.txt file2.txt

diff 命令对于不在第一个文件但在第二个文件中的每一行,输出 '>' (后跟该行);对于在第一个文件但不在第二个文件中的每一行,输出 '<' (后跟该行)。

sdiff

它不是给出差异报告,而是将文件以两列并排输出,并用空格分隔。

diff3

diff 相同,但用于三个文件。

 

comm

逐行比较两个文件,并打印文件 1 特有的行(第 1 列)、文件 2 特有的行(第 2 列)以及两个文件共有的行(第 3 列)。

使用 comm 命令的 -1、-2 或 -3 选项来抑制打印特定列的行。 直接运行 comm 命令将列出全部三列(即文件 1 和文件 2 特有的行以及两者共有的行)。

命令语法

comm file1 file2
look

输出系统字典中以给定字符串开头的单词列表 -- 这对于查找以特定短语或前缀开头的单词非常有用。

将字符串作为参数给出;它不区分大小写。

命令语法

look string