此处列出的大部分自由软件都可以在以下网址下载:http://sunsite.uio.no/pub/Linux/sound/apps/speech/
XVoice 是一款听写/连续语音识别器,可以与各种 XWindow 应用程序一起使用。它允许用户自定义宏。这是一个很棒的程序,拥有光明的未来。一旦设置完成,它就能以足够的精度执行。
主页:http://www.compapp.dcu.ie/~tdoris/Xvoice/ http://www.zachary.com/creemer/xvoice.html
该软件包括一个麦克风音量配置实用程序、一个用于添加新命令和发声的词汇“模型编辑器”以及语音识别系统。
CVoiceControl 对于希望开始 ASR 的经验丰富的用户来说是一个极好的起点。它不是最用户友好的,但一旦正确训练,它会非常有帮助。设置时请务必阅读文档。
主页:http://www.kiecza.de/daniel/linux/index.html
文档:http://www.kiecza.de/daniel/linux/cvoicecontrol/index.html
密西西比州立大学信号与信息处理研究所已将其语音识别引擎公开。该工具包包括前端、解码器和训练模块。这是一个功能齐全的工具包。
该工具包(以及有关 ISIP 的更多信息)可在以下网址获取:http://www.isip.msstate.edu/project/speech/
Sphinx 最初在 CMU 启动,最近已作为开源发布。这是一个相当大的程序,包含许多工具和信息。它仍然“在开发中”,但包括训练器、识别器、声学模型、语言模型和一些有限的文档。
主页:http://www.speech.cs.cmu.edu/sphinx/Sphinx.html
来源:http://download.sourceforge.net/cmusphinx/sphinx2-0.1a.tar.gz
Richard Myers 的这款软件是用 C++ 代码编写的 HMM 算法。它为 L. Rabiner 的著作《语音识别基础》中描述的 HMM 模型提供了一个示例和学习工具。
信息可在以下网址获取:http://www.itl.atr.co.jp/comp.speech/Section6/Recognition/myers.hmm.html
更多信息可在以下网址获取:http://www.itl.atr.co.jp/comp.speech/Section6/Recognition/jialong.html
如果您知道上面列表中未包含的自由软件,请发送邮件至:scook@gear21.com。如果您有兴趣,也可以告诉我从哪里可以获得该软件的副本,以及您对它的任何印象。谢谢!
有关 Vocalis 和 Vocalis Speechware 的更多信息,请访问:http://www.vocalisspeechware.com 和 http://www.vocalis.com。
AbbotDemo 是 Abbot 的演示包。此演示系统拥有约 5000 个单词的词汇量,并使用连接主义/HMM 连续语音算法。这是一个演示程序,没有源代码。
K.K. Chin 告知我,HTK 的原始开发人员(剑桥大学的 Speech Vision and Robotic Group)仍在为其提供支持。还有一个“免费”版本可在以下网址获取:http://htk.eng.cam.ac.uk。另请注意,Microsoft 仍然拥有当前 HTK 代码的版权……