高级掌握:WTF是脉冲代码调制吗?

如果您是音乐制作人(或打算成为音乐制作人),则您可能会不可避免地与发烧友交谈,这些发烧友吹嘘原始WAV音频比MP3等压缩文件的优势。 我们中的一些人冒险(出于好奇心)进行了更深入的挖掘,只是由于在创建数字(甚至模拟)记录时所使用的低级系统的复杂性而感到困惑。 本文将尝试解释PCM的基本原理, PCM是当今用于对自然声音进行采样以将其转换为音频的最著名协议。

脉冲编码调制 (或简称PCM)是一种将模拟信号表示为离散数字信号的方法。 这个想法听起来很吓人,但实际上并不像看起来那样复杂。 本质上,PCM描述了计算机如何解释它从模拟信号中捕获的样本,这是许多协议之一。 要了解PCM,首先我们必须谈论比特。 位是信息的很小的单位,值为0或1。字节是由位组成的较大的信息单位,一个字节等于8位, 半字节等于4位。 为了简单起见,我们将使用一个半字节。

在二进制世界中,我们从右到左读取这些数字。 数字10的四位表示如下所示:1010。每个0和1都像是一个打开(1)或关闭(0)的门。 这些门后面的隐含数字基于2基系统(因此为二进制),其含义如下:2³,2²,2¹和2⁰(等于1)。 所以1010等于10,因为打开的两个“门”是值8(2³)和2(2¹)的门,它们的总和为10。 这与PCM有什么关系? 一切!

当我们说样本的振幅为0.5或-0.3时,计算机不知道我们的意思,它只能理解1s和0s。 PCM是描述计算机如何仅用这两个数字表示这些信号的一种方式。 我们可以清楚地看到采样率将如何发挥作用,采样率将决定我们收集多少个采样,但是位深度又如何呢? 比特深度将决定我们编码的分辨率。

对于8位深度记录,我们有256(2⁸)个可能的整数值,而半字节大小的单词只有16个(在数字音频处理中,一个单词是一个包含样本幅度的位包)。 我们将其分成两半。 负值的范围是-128到0,正值的范围是0到127。通过使用2的补码 (这个概念稍微复杂一点,但我鼓励读者进行探索),我们可以得到真正的0幅值,即对音乐很有用,因为沉默对于音乐来说很关键。 这也允许对负数实现二进制加法而不会出错。 至此,我们已经描述了PCM的代码部分,那么脉冲和调制又如何呢?

脉冲是指在读取1或0时记录的电脉冲。 调制描述了该系统解释模拟信号并将其转换为数字信号的能力。 在这种情况下,调制用于定义从一个系统到另一个系统的转换(模拟数字)。

那么这在电路方面如何工作? 采样保持是模拟电路的名称,它捕获信号产生的采样电压。 根据锁存器中的 晶体管,它会在一段时间内保持其值不变。 然后将这些值发送到将信息保留一定时间的寄存器,然后再将其作为幅度发送给扬声器。 最后,我们重新引入了抖动信号的概念,该概念描述了随机噪声如何帮助减轻样本编码中可能出现的量化误差量化误差是低位深度的结果。

如果您觉得这有帮助,请表示支持并让我知道如何使我的文章更好。