
虽然当今许多音乐家,音频工程师和音乐制作人在其音乐职业生涯的早期就已经获得了采样率和位深度的概念,但似乎很少有人理解该术语背后的基本原理。
字符串类比
我喜欢考虑根据一个字符串进行采样和量化。 假设我们抓住了那条弦,然后将其以正弦波的形式放置,其两端和中间位于一条直线上(DC偏移)。 然后,采样是指使用垂直切割来切割琴弦,而量化是指使用水平切割来切割琴弦。
- Sia —五彩纸屑(带歌词的音频)
- Simgot EN700讲述了一个平衡的故事
- 司街生活:'我从没想过它将成为我散步的一部分
- 民主化的社交播客平台从未存在过。
- Hidizs EX-01对于深色IEM具有很好的价值
字符串两端之间的距离(直线移动)组成了波长,而我们从字符串的开始到结尾(直线也移动)所花费的时间组成了一个周期。 以此类推,采样就是我们可以切割出这条弦的精细程度。 采样率越高,切口越小。 在数字音频接口中,出于心理声学原因并满足采样标准,采样率通常为44.1 kHz。
采样标准或奈奎斯特定理指出,采样率应至少是我们试图记录的最高频率的两倍。 由于人类听觉的阈值在20至20kHz之间,因此44.1kHz的采样率为我们提供了整个人类听觉所需的最高频率的两倍以上。 通常,建议不要使用高于商业发行版的采样率,因为增加采样率将意味着使用更多的硬盘驱动器空间,而保真度不会明显增加。 由于历史原因,存在额外的4.1kHz,这必须归因于录像带的出现和所述协议的设计。
量化续
另一方面,量化是一种精度,我们可以用它测量零位移或0的点在任意点上弦线的垂直距离。如果我们使用非常细的尺子,也许需要一个显微镜才能看到它的直角单位,我们的测量会比仅使用瞄准镜更好。 在数字采样世界中,此量化因子称为位深度。
当涉及到声音的记录和处理时,位深度和采样率具有许多含义。 比特深度与用于编码每个样本的比特数成正比。 更高的位深度意味着更好的分辨率,但同时也意味着更大的文件大小,这可能会填满一个人的硬盘。 将以24位深度(高分辨率)记录的文件下采样到16位(低分辨率)的采样率会导致声音质量的明显差异以及不必要的伪影和失真的引入。 分辨率的这种降低称为量化误差。 幸运的是,这种信息丢失具有可预测性,这使我们能够对此进行补偿。
不完美就是解决方案
我们的大脑如此擅长注意到分辨率变化的部分原因是因为下采样以可预测的,引人注目的模式发生。 抖动是在重新量化之前将宽带噪声应用于此降采样声音源的过程,以使误差随机化。 抖动还可以通过减少失真的程度来有效地增加感知的动态范围,失真的程度是由录音中较安静的部分中的量化误差造成的。 (动态范围是指最大声音和最安静声音之间的差异,是一种主观度量。)
需要注意的是,抖动信号和非抖动信号之间的差异非常细微,为了真正理解它的效果,应该对信号进行大幅下采样(即从24位降至8位或更低),然后重新用抖动量化,或者应该找到低位深度记录的安静片段; 放大它会加重失真,失真可以通过抖动重新量化得到部分校正。
通常,位深度和采样率被认为是声音处理的基本方面,应尽早考虑和学习,但不要让这愚弄您,关于这些概念还有很多要说的。 如今,采样率已高达96kHz,对抖动和量化误差的研究以及改进还远远没有结束。 如果人们想熟练地进行数字声音处理,那么牢牢掌握位深度和采样率无疑是第一步,掌握它们的真实理解和含义,可能是一生的追求。