语音识别是指计算机(或其他类型的机器)识别口语单词的过程。 基本上,它意味着与您的计算机交谈,并让它正确识别您所说的内容。
虽然任何涉及与计算机交互的任务都可能使用 ASR,但以下应用是目前最常见的。
听写是当今 ASR 系统最常见的用途。 这包括医疗转录、法律和商业听写,以及一般的文字处理。 在某些情况下,使用特殊的词汇表来提高系统的准确率。
旨在执行系统功能和操作的 ASR 系统被定义为命令与控制系统。 诸如“打开 Netscape”和“启动新的 xterm”之类的话语将做到这一点。
许多人由于身体限制(如重复性劳损 (RSI)、肌肉萎缩症等)而难以打字。 例如,听力有困难的人可以使用连接到电话的系统将呼叫者的语音转换为文本。
一些较新的蜂窝电话包括 C&C 语音识别,允许诸如“呼叫家”之类的话语。 这可能是 ASR 和 Linux 未来发展的一个主要因素。 为什么我还不能和我的电视说话?