电子游戏实际上体现了现代冒险。 一种引人入胜的,广泛的,以玩家为中心的体验,其内容引人入胜的内容吸引了我们的想象。 因此,游戏音频开发人员一直在寻求超越游戏,尤其是下一代VR沉浸式游戏中声音和音乐体验的能力。 但是自从磁带和盒带的早期发展以来,游戏音频已经走了很长一段路。 让我们回顾一下机器辅助音乐,机器生成音乐和程序音乐的历史,同时通过一些关键示例来突出它的许多挑战和创新。

程序内容生成
一般而言,程序生成是指游戏开发的任何方面,这些方面都遵循计算机算法,而不是由游戏开发人员或设计人员手动创建。 例如,在太空模拟器中,人们可能会决定编写代码,该代码自动生成具有某些随机性的巨大星系,而不是详尽地确定每个行星或系统的外观,物理性质或属性。 实际上,这正是开创性的Elite系列游戏成功创建其丰富而庞大的行星系统以进行玩家探索的方式。 在这些早期的游戏中,处理能力和内存非常宝贵,并且程序生成使从单个软盘产生大量的体验。
如今,作为游戏设计师,我们受计算资源的限制可能比我们自己的想象力要少,而程序生成通常用于为用户创造独特,动态和个性化的体验。 Maxis的Spore从DNA测序和分形理论中汲取灵感,创造出了飞行中的奇异生物。 Minecraft采用Perlin噪声公式,并生成大量具有复杂动植物群的景观和地形元素。

音乐的程序生成
程序音乐-通常与非线性,动态,交互式或自适应音乐结合使用的术语-是指游戏中的程序化音乐,通常可以实时改变或响应不同的状态或事件。 对于游戏,我们寻求一种非线性音频体验,而不是电影,在电影中,每个音频事件都紧随系列中的另一个事件,与电影中规定的事件相匹配。 玩家可能会在游戏环境中花费更多时间,多次或连续多次追溯和重播特定阶段。 不变的线性配乐很容易变得令人厌烦,甚至更糟,这会刺激演奏者并使他们分心。
Karen Collins区分交互式和自适应音频。 交互式音频直接受到玩家的动作或游戏输入的影响(例如,超级马里奥击中问号框以显示硬币会立即识别出声音效果)。 自适应音频不受演奏者的动作直接影响,而是受更复杂的状态和事件(例如环境时间,位置或其他可能并不总是对演奏者透明的因素)影响。
在Melodrive,我们使用的方法被描述为深度 自适应音乐 ,反映了我们的系统如何对深度 音乐进行动态反应。 包含人类情感和唤醒方面的多维状态。 您可以在此博客上了解有关我们正在进行的研究的更多信息。
作为该主题的最后注解,在更广泛的学术和音乐背景下,程序自适应音乐与算法音乐或生成音乐密不可分,还使用一套正式的规则或程序将音乐和作曲决策放弃给机器。 存在许多用于自动生成音乐的技术,通常会汲取灵感并参考自然或生物系统。 例如,Al Biles借鉴了自然选择的进化原理,使用遗传算法交易爵士乐,而Google最近使用深度学习网络登上了头条新闻,该网络可以模拟神经过程吐出钢琴乐句,这是AI创作历史上的一个里程碑。
早些年
开发游戏的最大挑战是,由于所用平台的局限性,有时您不得不妥协自己的好主意。 尽管早期的视频游戏声音和音乐在我们今天的耳朵里听起来可能是原始的和原始的(甚至是Chiptune,它的复古气息令人回味),但事实证明,这个时代的许多突破性创新对后代产生了深远的影响游戏音频方法。
卢卡斯艺术
对程序音乐的历史使用的任何评论都必然始于LucasArts,它是乔治·卢卡斯(George Lucas)互动媒体帝国的视频游戏部门,还包括天行者声音,工业照明与魔术。 在90年代初期,该工作室发布了一系列具有丰富的故事讲述,恶魔般的谜题和独特幽默的点击游戏。 作曲家迈克尔·兰德(Michael Land)和彼得·麦康奈尔(Peter McConnell)在彼得·朗斯顿(Peter Langston)在80年代的BallBlazer游戏上的先前工作的基础上,开发了iMUSE系统,该系统使他们可以根据不同的游戏场景通过主题的变化平稳过渡。 您可以在许多游戏中听到iMUSE,例如X-Wing,Sam&Max和Grim Fandango,但最令人难忘的是在Monkey Island系列中,加勒比海“轻松聆听”的无穷无尽的模仿伴随着不幸的海盗Guybrush Threepwood的冒险。
水平和垂直茎混合
今天早期游戏感觉过时的部分原因是音频是使用当时的硬件人工合成的,而不是使用现有的录制或采样的声音来播放的。 随着数字音频,光盘和MPEG压缩的激增,“真实”音频很快就可用于消费类PC和控制台。 我仍然很高兴地记得我第一次听到我的PlayStation上实际的 Leftfield和Chemical Brothers曲目的震撼声音,例如Wipeout或Public Enemy的高辛烷赛车场时的震撼声音,这是我在Tony Hawk的Pro Skater中跳了360 。 但是过了一会儿,我听了相同的曲目不胜枚举 ,并且很快就利用了将光盘换成另一张来获得不同效果的技巧。
游戏开发者很快意识到,现有音乐的固定, 线性轨道对于现代视频游戏音乐而言不够灵活或缺乏交互性,尤其是在新颖性逐渐消失之后。 为了解决这个问题,他们迅速与作曲家和有声音的人合作,使用音乐的主旨而不是最终的混音。
词干是一组或多组有助于最终混音或歌曲的音轨的音频措辞。 因此,鼓可以被视为一个茎,所有吉他,所有键盘或所有吉他和键盘也可以被视为一个茎。 词根的确切内容取决于使用它们的人。 在称为垂直分层的过程中,可以以许多不同的方式组合茎,以形成无尽的排列,这是将不同的茎堆叠在一起以同时听到的情况。
茎也可以重复(以小环或小节)或以各种组合顺序改变和分支(称为水平混合) 。 通过将水平和垂直分层相结合,我们可以开始设想从很小的一组元素构建不断变化的音乐的扩展,动态排列。 例如,在赛车游戏《极限竞速》(Forza Motorsports)系列中,就是这样做的。 (完全公开:我曾处理过其中几个游戏。)音频主管Mike Caviezel说:
Forza的最后几个名称 分别为 3、4和5 , 它们非常适合EDM。 电子音乐非常适合进行混音。 因此,如果您是一位电子艺人,想要将音乐投放到游戏中,请确保您拥有自己的主干,以便我们在赛车过程中想创建替代混音或拔鼓游戏中,我们可以即时进行。 这对我们非常重要。
作曲家兰斯·海斯(Lance Hayes)提供了一个很好的视频,介绍了这是如何工作的:
但这并不仅限于EDM。 近年来,茎混合的最引人注目的应用之一是Rockstar的Red Dead Redemption ,并在下面的视频中进行了精美记录。 聚集了众多传奇音乐家和大量地道的乐器,他们完美地再现了塞拉利昂和莫里康内的荒野西部幻想的棕褐色沙漠。 但是,如果您观看视频,您会注意到它们将所有内容限制为一个键:一个小调。
诸如FMOD和Wwise之类的现代音频中间件系统可以充当开发人员和音频人员之间的桥梁。 它们的独特优势之一是能够完全满足交互式游戏的非线性和响应式音乐需求,而这些功能在传统的以时间轴为中心的环境(例如Pro Tools或Logic)中固有地缺乏。
纯程序音乐
干混和分层音频资产无疑会增加游戏音乐体验的参与度和多样性,但是与将音乐生成过程的所有参数链接到游戏中事件的“纯”程序音频系统相比,这些仍然不足。 游戏音频专家和研究人员安迪·法内尔(Andy Farnell)经常讨论复兴可以通过程序控制的早期“嵌入式”合成技术的好处。 他认为,对声音的所有参数进行细粒度的控制可能会在复杂的游戏世界中提供最丰富的集成。
有些现代游戏使用程序性内容生成来创建整个音乐作品。 Demoscene Shooter ..krieger在游戏的所有方面都利用PCG,并且配乐为自己的V2合成器生成MIDI数据流。 Rez Infinite对音符事件进行量化,以确保EDM重音乐与播放器的动作保持同步。 Spore与Brian Eno合作,并使用交互式媒体软件Pure Data的大量定制版本来创建其身临其境的环境音乐声景。 最后,《 无人深 空》的作曲家保罗·威尔 与英国摇滚后乐队65 Days of Static合作 ,后者利用他们先前的现场编码和模块化合成知识,创造了真正独特的音乐体验。
两全其美的
要为现代游戏和交互式媒体构建真正丰富而引人注目的配乐,我们需要拥有互动,不断变化的体验,以应对游戏中细节和玩家进步与发展的无数结构。 游戏音乐还需要利用丰富的音乐知识和资源,包括高质量的采样和合成声音。
在Melodrive,我们努力工作,将这两个领域紧密结合在一起:将复杂的算法组合和新声音的参数合成与用于现实世界的复杂乐器样本结合在一起,并使用最新的DSP效果进行处理。 数以百计的游戏玩家告诉我们,如果他们有能力做音乐,他们将乐于创造自己的音乐。