Shazamed:关于音乐流的数据故事黑角

第1部分

就在最近,我坐在宾夕法尼亚州匹兹堡的Tina’s Bar,边喝酒边听点唱机。 当我记得有种旋律突然把我从阴霾中拉出来时,一阵chat不休的雾气和热情的热情使我沉入了一个摊位。 我绝对不会把自己当作“小怪兽”,就像Lady Gaga称呼她的歌迷那样,但是当您听到2009年她的热门单曲“ Alejandro”激怒的琴声在酒吧的声音中散发出来时,我向您保证,这很难保持你的心率下降。 但是,当琴桥变成了陌生的合唱歌词时,我意识到我的激动之情无济于事。 我所能想到的就是,“雷加夫人号的雷鬼模仿绝对是傻瓜。”

这首歌还不错(根据我自己可疑的指标)-实际上,它以“ Alejandro”的所有相同方式令人着迷:踩踏雷鬼音乐(但也有欧洲流行音乐?)的节奏大约设置为99 BPM和B小调中苦乐参半的旋律既适合俱乐部演奏,又适合您的400针埃及棉枕套。 我千禧年的懒惰中太舒服地休息了,无法走路三十英尺来检查声源,我拿出手机,然后对它进行Shazam编辑。

如果您曾经看到过iPhone用户将手机放在某个地方的扬声器旁边,然后说“我知道!”或“很奇怪……!”,您可能已经看到他们使用Shazam。 该应用程序通过将预先录制的音乐与其数据库中所携带的数百万首歌曲进行比较来识别音乐。 Shazam自豪地说,“音乐大师”的员工从100多个国家/地区搜索曲目,以识别大约150亿首歌曲。 这项技术并不是什么新鲜事物-他们成立于1999年,并于2002年作为拨号服务在您几乎坚不可摧的诺基亚时尚手机上首次发布。 十六年前,英国的用户可以将键盘捣碎以拨出该服务,该服务将收听录音30秒钟,断开连接,处理结果,并向用户发送带有标题和艺术家的文字。 2004年,该服务在美国发布,但每次识别费用约为1美元。 当它于2008年首次作为iPhone的免费应用程序推出时,它将在iTunes中识别歌曲,同时获得一些建议的购买购买量。 这是Shazam能够货币化并证明音乐识别作为公共事业的经济价值的方式之一,以至于在2014年,Apple以400M的价格收购了Shazam并将其与Siri集成。 据推测,苹果公司对它作为增强现实营销平台所具有的潜力感兴趣,它利用图像和音频识别技术来利用客户可以用来购买他们好奇的产品。

我当然很好奇。 但是大约30秒后,该应用程序一无所获。 这里似乎需要注意的一点是,Shazam只能识别预先录制的音乐,这意味着将不会记录现场音乐或嗡嗡声。 虽然看到酒吧中的自动点唱机只能播放预先录制的曲目,但仅凭这个原因就无法证明结果不合理。 此外,Shazam的工业强度算法可识别曲目,不受干扰,这意味着它可以在嘈杂的环境,不良的wifi和手机连接中匹配歌曲。 它仅通过绘制记录的三个维度来做到这一点,即它们的频率和幅度随时间变化。 然后,该算法会选取能量含量最高的点,这些点表示为图表上的峰值,该峰值与周围的所有其他注释形成对比。 该公司首席执行官安德鲁·费舍尔(Andrew Fisher)甚至表示,该应用程序可以检测俱乐部DJ察觉不到的加速曲目,并判断同一首歌曲不同版本之间的区别。 但是,只有将每个版本手动存档并作为唯一的数字代码存储在Shazam的数据库中时,它才能执行此操作。 例如,该公司注意到他们在尝试识别古典或爵士唱片时遇到的困难,因为各种艺术家经常将它们覆盖到各种数字独特的唱片中。 在他们的支持页面上,它指出:“ Jazz不受技术限制,我们正在努力向数据库中添加尽可能多的Jazz音乐。 我们的数据库中已经有许多爵士乐和古典乐作品,而且每天都会增加,因此,值得Shasham找出您最喜欢的作品。”这一陈述为我们提供了另外一些不透明的音乐识别过程的线索,就是说,如果Shazam编辑的音频与数据库中的录音无法完美匹配,他们可能无法识别。

对于具有如此专业和优化目标的应用程序,当它无法识别自动点唱机歌曲时,我不知所措。 通常,如果Shazam没有足够或适当的声音信息来建立录音与其数据库中音轨之间的奇偶校验,则它将变成空白而不是做出错误的猜测。 显然,该应用程序在识别仅听起来像“ Alejandro”之类的录音时并不会提供太多帮助,但是,如果根本不是另一种录音,为什么Shazam无法与之匹配? 可能是Shazam HQ的音乐大师让这名大佬在雷达下溜走了吗? 我不确定,但是整晚都没想过这首歌。 直到发生同样的事情, 再一次

第2部分

人类通过强大的编码机构来识别声音。 我指的是当神经元像轨道的前几个小节一样响起闪电般放电时的反应,或者您A.与朋友欢呼雀跃,或者B.当您自信地束缚腰带时自欺欺人。错误的歌词,错误的歌曲。 我并不是要暗示我提到的这些歌曲都是彼此抄袭的-实际上,我的比较过于主观,以至于其他人(甚至您!)也可能不同意。 但是,如果您的耳朵习惯于识别不同歌曲之间的特征段落和短语,它们就会变得可疑。 您会在听其他歌曲时继续认出它们,即使它们不在同一时代或流派的任何地方。 甚至有一个关于这种复杂现象的词,称为Baader-Meinhof现象,也称为频率错觉(很酷,请查一下)!

幻觉所描述的现象是选择性注意-一旦您接触到感兴趣的项目,您就会开始注意到它。 例如,当您的旧运动鞋磨损了并且决定购买一双您真正喜欢的新运动鞋时,突然间,您会注意到学校,工作场所和DMV中的每个人都穿着同一双运动鞋。 当您发现其中一些确实是来源明确的且带有明显的“耐克”,但您可能会注意到其他一些是黑市炒作仿冒品,带有或多或少地完成工作的“挥霍”或“花样”。 在我们对所宣传的品牌和美学的集体文化熟悉中,通常很清楚一个人是另一个人的衍生品,甚至是未经训练的人。 关于人工制品的独特形式和工艺,可以讲述其起源和血统的更多故事。 然而,关于音乐人工制品及其如何产生和分配的棘手问题是,引用不同音乐美学的声音标记不能轻易地追溯到特定的或单一的“来源”。 要把像艺术表达那样主观的东西追溯到“源头”,首先要体现出一种关于定义知识产权的相当规范的意识形态。 然后,要定义“源”是什么,需要开发一个过程,该过程指示音乐中声音标记之间的关联程度和意图。 根据建立该协会的目的,无论是用于营销企业还是保护艺术家对其知识产权的权利,描绘此过程可能至关重要。

对于像Shazam这样的公司,其意图是允许用户识别和购买他们立即收听的歌曲,从技术上讲,“源”的定义被简化为简单的数字代码,即唱片匹配或遗漏。 进行粗略的比较,这就像说黑市Balenciaga(有时写成倒写或称为“ Balenciego”)仿冒品(左图)与真正的Balenciagas(右图)完全不同,因为您可以在不同的URL上找到它们。 如果Shazam的服务没有解决哲学上更为复杂的辩论,即确定超越单个录音的声音关系,那么谁来解决这个问题呢?

第三部分

奇怪的是,从采样技术和音乐发行中获得的创造可能性的范围正是使知识产权在更大的音乐世系和流行音乐的集体文化记忆的大背景下变得更复杂的东西。 享誉全球的制片人和DJ马克·罗森(DJ Mark Ronson)争辩说:“采样并非要劫持怀旧之情,而是将自己插入歌曲的叙事中,同时还将故事推向前进。”当一位艺术家采样另一位艺术家的作品时他们自己的转换,编码和解码以及编辑技术的风格来塑造音乐风格,他们的数据“足迹”在音系中创造了新的标记。 但是仅这些足迹就能在多大程度上使我们追溯该血统? 在研究诸如Shazam之类的现代音乐识别工具时,我的猜测是它并不遥远。 并非所有“足迹”都是一样的(或留下数字可识别的痕迹)。 包含无意识or窃,类似和弦进行,类似旋律的即兴演奏,短语和歌词的数字化更改的录音或封面可以与他们所引用的艺术大体相同,并且正如我们在Shazam算法中看到的那样,这些元素可能未被发现,因为它们无法与数据库中的存档音轨完美匹配。 另外,要完全存储歌曲,必须经过现实生活中的人员来处理。 这个想法使我回到了Shazam HQ音乐大师那里,不幸的是,他可能从来没有存档过我一直在寻找的歌曲。 但是也许有人,其他地方有。

第4部分

我尝试谷歌搜索。 当时我在自动点唱机轨道上获得的数据点仅仅是它所模仿的歌曲和歌手,因此我查看是否存在代表Lady Gaga进行legal窃的合法记录。 我打了一个金矿链接(并以为自己疯了感到有些as愧)。

事实证明,加加的音乐引发了关于她对流行音乐期刊和论坛的借入影响的一些争论。 她一再被指控从艺术家(尤其是麦当娜)那里窃取专辑和视频概念。

录像带上的视频吸引人地说明了亚历杭德罗和各种歌曲之间的相似之处,特别是Base的单曲“ Do n’t Turn Around”(1986)。 我立即意识到这是我在酒吧听到的那首曲子,并开始审视其他人说的话。

(注释部分已重建,以强调)

捍卫Gaga的评论员说,她在采访中明确将Base Ace归功于她的歌曲的影响力,但是当我尝试搜索歌曲时,没有弹出链接。

在音乐讨论板上,我阅读了有关Gaga网站的评论,这些内容izing窃了Base Ace的“ Do n’t Turn Around”和麦当娜的“ Isla Bonita”。 一些用户批评Gaga缺乏从歌曲中借用元素的微妙之处,而另一些用户则热烈地捍卫了艺术家的创作许可以引用这些歌曲,并说这首歌是对歌曲的一种敬意,而不是was窃。

在论坛的较深层列表中,我找到了一个链接,该链接使我进入了据称听起来相似的歌曲的Wikipedia页面麦加 这是一首歌曲的集合,其中没有合法授权再使用的证据(例如许可的采样,模仿或期满)。 我想知道为什么为什么有如此多的人争辩说,加加和阿斯·巴思的歌曲之间存在合法的音乐重叠,却没有法律文件?

在寻找合法的采样文档来源时,我偶然发现了Whosampled.com,这是一个内容广泛且维护良好的互联网档案馆,其中列出了艺术家和歌曲之间的信用。 与Shazam相似,一组管理员手动管理和存档数据库中托管的所有内容。 根据艺术家在歌曲中进行的声音参考或更改的类型来标记信用。 为了让您了解信用类型的广度,我在下面列出了一些。

回放采样:通过对两个音轨进行一点点比较,您可以分析部分歌曲之间的奇偶性。 这种信誉最常见于从其他曲目中采样诸如重复节拍或人声等元素的歌曲中(许多嘻哈和R&B歌曲就是很好的例子)。

封面:覆盖受版权保护的作品可以使原始作曲家们心驰神往,因此通常在声音上很容易追踪。 但是,从数字上看,要识别不包含点对点奇偶校验的两首歌曲,将需要花费更多的算法,因为这是一条新录音,有时使用不同的乐器和不同的声音。

旋律的节奏和短语:如果某位艺术家合法地确定他们已经引用了除数字采样之外的一位艺术家,文档通常会记录正在使用的旋律或短语。

歌词出于相同的原因,歌词很棘手,而旋律即兴也很棘手。 有人拥有“打动我的心”这个词吗? 并非如此,但是如果您举起一整节经文,则很明显它是在引用其他内容。 在这些情况下,如果所涉及的艺术家合法清除了歌词,则歌词会记入文档中。

当然,这些信用仅解决了歌手参考其他歌曲的某些方式。 网站上未列出的其他类型的信用包括:

和弦进行在流行音乐中,和弦进行是相当普通和标准的,并在许多歌曲中使用。 例如,声称某人“拥有”这12条蓝调是一个滑坡,因为在各种音乐中都可以发现这种结构的普遍性。 在爵士乐中,和弦进行通常是标志性的,但只占所有在那里音乐的一小部分。 法院通常裁定,没有人拥有和弦进行的功能,因此,在此处分配功课很困难。

不确定:认为自己写的,但实际上是从听到的内容中提炼出来的。 这种引用通常是非法的,如果被引用的艺术家发现,则会受到处罚。

这就是网站上合法认证的样子。 它包括歌曲标题,专辑,发行年份和制作人,以及指向歌曲本身的嵌入式链接。 它还特别注明在哪里找到样品或参考。 在这种情况下,我们看到Boney M的Ma Baker的“ ma ma ma”出现在Gaga的Poker Face中8秒。 该文档还确保包括债权人(谢谢您,batmanguy!)和whosampled社区对该文档的评级。

令我惊讶的是,看不到“亚历杭德罗”上的“不要转身”的单一认证。 所以我试着做一个!

它没有按我的计划进行。 但这显然不是第一次拒绝此类提交。 幸运的是,WhoSampled为其社区举办了论坛,以讨论围绕适当提交和认证的灰色区域(有时还对管理员进行说唱)。 尽管许多论述是主观的,但仍有一些线索掩盖了WhoSampled严格的提交准则中深层隐藏的相关信息,而这些准则经常被忽略或忽略。

现实情况是,像Whosamples这样的平台在将适当的信誉归功于与采样或引用的歌曲缺乏法律联系的音乐时会遇到困难。 这在很大程度上使得当曲目缺乏使用参考的合法许可时,可能的参考实际上仍然不可见,并且如果没有在线社区的详尽记录,则很难进行追踪。

每个内容制造商均有权提出其知识产权被盗的合法主张,就像每个内容制造商均有权对这一主张进行抗辩一样。 但是,尽管侵略性的版权法有助于恢复艺术家对其知识产权的完全所有权,但在法律上将一种作品的独特特征和创作意图与另一种作品区别开来的标准化程序并不具体存在。 归根结底,艺术性的解释权是一种防御,而不是既定的权利,并且经常受到谁拥有更多财力的人的影响。

第5部分:结论

虽然知道自动点唱机歌曲的特性令人非常满意,但同时,我对音乐认证世界的神秘性和复杂性感到沮丧。 亲眼目睹特别令人感兴趣的是,音乐存档和标识工具的创建在艺术可见度和知识产权法律方面的政治中是如何紧密交织在一起的。 从目前的情况来看,音乐识别可能是一个高度主观的过程,通常依赖于手工数据库和用户参与。 为音乐发现创造更好的工具,不仅可以帮助好奇的听众扩大音色,还可以增加音乐流和音乐家的销量。

当然,这次冒险激发了各种各样的问题,这些问题一直没有得到解决。 归功于谁的责任? 保真程度如何? 除了法律诉讼外,Lady Gaga是否应该以公开/声音的方式更明确地提及她的消息来源,尤其是年轻的毫无戒心的听众? 对于进一步远离公众视野的人,此责任是否有所不同?

资料来源

Shazam支持

https://support.shazam.com/hc/zh-CN/articles/204462958-What-type-of-music-can-Shazam-identify-

https://support.shazam.com/hc/zh-CN/articles/205135297-Collected-information-and-privacy

https://support.shazam.com/hc/zh-CN/articles/204609128-Submitting-tracks-to-Shazam

苹果为何花400M收购Shazam

https://appleinsider.com/articles/18/09/25/why-did-apple-spend-400m-to-acquire-shazam

音乐识别应用Shazam的工作原理是多么神奇

https://slate.com/technology/2009/10/how-does-the-music-identifying-app-shazam-work-its-magic.html

Baader-Meinhof-现象

https://science.howstuffworks.com/life/inside-the-mind/human-brain/baader-meinhof-phenomenon.htm

http://www.ee.columbia.edu/~dpwe/papers/Wang03-shazam.pdf

“不要转身” Shazam曲目ID

https://www.shazam.com/track/293513/dont-turn-around

NPR关于Lady Gaga与Base Ace的故事

https://www.npr.org/templates/story/story.php?storyId=128199077

听起来相似的歌曲

https://pineight.com/mw/index.php?title=Songs_that_sound_alike#cite_note-2