本节概述了计算机音频技术的非常粗略的概述,以帮助您理解本文档后面使用的概念。您应该查阅有关数字音频或数字信号处理的书籍,以了解更多信息。
声音是一种模拟属性;它可以取连续范围内的任何值。计算机是数字的;它们喜欢使用离散值。声卡使用一种称为模数转换器 (A/D 或 ADC) 的设备,将对应于模拟声波的电压转换为可以存储在内存中的数字或数值。同样,数模转换器 (D/A 或 DAC) 将数值转换回模拟电压,模拟电压又可以驱动扬声器,产生声音。
模数转换过程(称为采样)会引入一些误差。有两个因素是决定采样信号如何良好地表示原始信号的关键。采样率是每单位时间进行的采样次数(通常表示为每秒采样数或赫兹)。较低的采样率将提供不太准确的模拟信号表示。样本大小是用于表示每个样本的值范围,通常以位表示。样本大小越大,数字信号就越准确。
声卡通常使用 8 位或 16 位样本,采样率约为每秒 4000 到 44,000 个样本。样本也可能包含一个通道(单声道)或两个通道(立体声)。
FM 合成是一种较旧的声音产生技术。它基于组合不同的波形(例如,正弦波、三角波、方波)。FM 合成在硬件中比 D/A 转换更容易实现,但更难编程且灵活性较差。许多声卡提供 FM 合成,以便向后兼容较旧的声卡和软件。通常提供几个独立的声源或声音。
波表合成结合了 D/A 转换的灵活性和 FM 合成的多通道能力。使用这种方案,数字化的声音可以下载到专用内存中,然后以很小的 CPU 开销进行播放、组合和修改。最先进的声卡都支持波表合成。
大多数声卡都提供混音功能,可以将来自不同输入源的信号组合在一起并控制增益电平。
MIDI 代表乐器数字接口,是一种标准的硬件和软件协议,用于允许乐器相互通信。通过 MIDI 总线发送的事件也可以存储为 MIDI 文件,以便稍后编辑和播放。许多声卡都提供 MIDI 接口。那些不提供的声卡仍然可以使用声卡的板载功能播放 MIDI 文件。
MOD 文件是计算机生成歌曲的常用格式。除了有关要播放的音符的信息外,文件还包含乐器(或声音)的数字化样本。MOD 文件起源于 Amiga 计算机,但可以在其他系统(包括 Linux)上使用合适的软件播放。
MP3 文件是用于分发计算机音乐和语音的流行格式。MP3 使用一种复杂的编码方案(MPEG layer 3)来压缩音频,压缩率约为 10 倍,与 CD 音频相比,质量几乎没有下降。