核心音频:采样

在以前有关Core Audio的文章中,我们正在使用原始音频和音频缓冲区。 能够使用MIDI(最流行的音乐符号协议)同样重要。 MIDI文件一目了然,可以包含乐谱所包含的信息-有关乐曲的常规信息(速度,拍号),还包含有关乐曲中每个音符的信息。 今天,我们将不详细讨论MIDI文件格式,而是专注于创建乐器。 与现实生活中的乐器一样,我们需要能够解释我们的音乐理念并再现某些声音的东西。 有许多方法可以实现这一点-我们可以尝试使用不同的声音生成器(振荡器是最简单的生成器之一)来合成这种声音-或可以尝试使用样本。 之前录制的声音。 实际上,许多现代专业音乐图书馆都采用了这种想法:它们以很高的质量录制真实的乐器(通常有许多样本用于提供不同的动态表达)。 而且这些声音会被播放。 复制这些样本的机制称为采样器 ,今天我们很幸运,因为我们可以为此使用AVAudioUnitSampler 。 在最简单的情况下,采样器会根据请求播放一种声音,而不是“内插”声音。 有时对于某些乐器来说已经足够好了,但对于某些乐器来说却是完全不能接受的,例如鼓组采样器通常需要为每个音符提供不同的采样。 对于其他高质量的乐器,通常每5-6个半音有一个采样就足够了。 实际上, AVAudioUnitSampler支持这两种想法。…

Shazam之类的Music Recognition应用程序如何识别我们的每一个果酱!

“人们想识别正在播放的音乐。” 在2000年左右,几家公司正试图解决这一问题。 但是他们都有相同的局限性- 他们只监视广播电台播放的音乐。 大约在同一时间,即使说话者的声音恰好位于手机的听筒上,并且词汇量仅限于一组有限的单词,语音识别在手机上的可靠性也很差。 值得一提的是,1999年最酷的手机是诺基亚8210,它体积小巧,并且具有黑白屏幕。 该问题陈述是如此复杂,以至于算法必须在以下约束条件下以精确的方式识别音乐样本。 样品中混有大量环境噪声。 样本需要进行混响和其他处理。 样品必须用一个小的手机麦克风捕获。 样本经过语音编解码器压缩。 在到达服务器之前出现网络中断。 为了使这项服务正常运行,Shazam拥有不断增长的数据库,该数据库包含超过800万首歌曲/音频文件。 假设平均音频文件的长度为三分钟,则每个背靠背播放音频文件将花费超过45年的时间! Shazam取得了巨大的成功,因为它解决了上述限制。 这意味着他们的服务可以在酒吧,咖啡馆,零售商店等中使用。 Shazam允许您发送手机上几乎所有歌曲的录音,Shazam会告诉您歌曲的名称,艺术家的名称以及有关该歌曲的其他数据。 这些其他数据通常包括指向您可以购买歌曲的地方的链接,以及该艺术家的近期巡演日期。…