Каждые шесть-семь лет выходит новое поколение игровых консолей. И всякий раз первый вопрос, который задают игроки и журналисты: насколько продвинулась графика? Разрешение, частота кадров, терафлопсы производительности, изменения в дизайне корпуса и контроллера — всё это неизменно оказывается в центре обсуждений. Но в этих дискуссиях почти всегда остаётся в тени одна принципиально важная характеристика — звук.
Между тем именно звук долгое время служил главным опознавательным знаком каждой консоли. Сегодня большинство современных платформ звучат примерно одинаково — и это воспринимается как должное. Но было время, когда по одному лишь музыкальному фрагменту, звучащему из соседней комнаты, любой мало-мальски знакомый с видеоиграми человек мог безошибочно определить, на какой именно консоли идёт игра. Это не случайность и не маркетинговый трюк. За этим стоит увлекательная инженерная история длиной в несколько десятилетий.
Что такое звук и как его создавала старая электроника
Прежде чем погрузиться в историю игровых консолей, необходимо разобраться с природой самого звука — это позволит понять, какие именно задачи приходилось решать инженерам.

Звук представляет собой волну, распространяющуюся в какой-либо среде — чаще всего в воздухе. Чем выше частота этой волны, тем выше воспринимаемый человеком звук. Частоты принято делить на три диапазона: низкий (бас) — от 20 до 300 Гц, средний — от 300 до 5 000 Гц, высокий — всё, что выше. Именно эти диапазоны отображаются на эквалайзере в любом музыкальном проигрывателе.
Однако волны различаются не только по частоте, но и по форме, и каждая форма порождает свой неповторимый тембр. Выделяют четыре основных типа: синусоида, меандр (квадратная волна), треугольная волна и пилообразная волна. Для создания звуковой волны в электронных устройствах применяется осциллятор — специализированная схема, которая генерирует периодическое изменение напряжения. Форма этого напряжения и есть форма звуковой волны. Электрический сигнал передаётся на динамик, тот приводит в колебание воздух, и человек воспринимает это как звук.

Ключевой вывод из этого объяснения: на картридже ранних игровых консолей хранились не аудиофайлы в привычном нам понимании, а текстовые команды для осциллятора — указания, какую волну какой высоты и когда воспроизводить. По сути, старые консоли выступали в роли синтезаторов, генерируя звук в реальном времени прямо в процессе игры, — а не считывая готовые записи с носителя, как это делают современные устройства.
Atari 2600: рождение игрового звука
Чтобы в полной мере оценить эволюцию игровой аудиотехники, стоит начать с самого начала — со второго поколения домашних консолей. В 1977 году в США вышла приставка Atari 2600, на долгие годы ставшая символом целой эпохи. Именно она во многом породила расцвет индустрии видеоигр, и именно её кризис в 1983 году едва не поставил на этой индустрии крест. Но речь сейчас о другом.

За звук в Atari 2600 отвечал специализированный чип под названием TIA (Television Interface Adaptor). Его задачей была одновременно обработка видеосигнала и звука, причём последний являлся явно второстепенной функцией. Возможности TIA были крайне ограниченными: чип располагал двумя независимыми звуковыми каналами, каждый из которых мог воспроизводить лишь одну ноту в любой момент времени. При этом набор доступных высот тона для каждого канала ограничивался всего тридцатью двумя значениями. Грубо говоря, музыкальная «палитра» состояла из тридцати двух предустановленных нот — не больше.

Ни о каких мелодиях с несколькими независимыми инструментальными линиями речи не шло. Это были простые, короткие звуковые сигналы — джинглы. Впрочем, кое-какие выразительные возможности TIA всё же предоставлял: на звук можно было накладывать эффект дисторшна, сходный с тем, что применяется на электрогитаре и создаёт характерный «перегруженный» тембр. Кроме того, чип умел генерировать шум — звук, образованный множеством звуковых волн, занимающих весь слышимый диапазон и сливающихся в однородный шелест или гул.

Дополнительным ограничением служил и катастрофически малый объём оперативной памяти: всего 128 байт. В это пространство необходимо было уместить графику, игровую логику и звук одновременно. Результат предсказуем: у некоторых игр для Atari 2600 звук отсутствовал вовсе, а в других воспроизводился лишь тогда, когда на экране в данный момент ничего не отображалось — процессор просто не справлялся с параллельной обработкой.
Nintendo Entertainment System: рождение «восьмибитного» звука
В 1983 году Nintendo представила консоль, которая изменила всю индустрию видеоигр. Она носила название Family Computer (или Famicom) в Японии; в западных странах её знали как Nintendo Entertainment System (NES), а на постсоветском пространстве были распространены её клоны под торговым названием Dendy.

Именно с этой приставки начался тот самый узнаваемый «восьмибитный» звук, который по сей день вызывает ностальгию у миллионов людей по всему миру.
Звуковые возможности NES были сосредоточены непосредственно в центральном процессоре — чипе Ricoh 2A03 (для стран NTSC) или Ricoh 2A07 (для стран PAL). Точнее, в его составе находился отдельный программируемый генератор звука, известный как APU (Audio Processing Unit). Этот блок располагал пятью независимыми звуковыми каналами, каждый из которых выполнял строго определённую функцию.

Два главных канала генерировали квадратные волны — так называемые прямоугольные или пульсовые волны. Именно они отвечали за ведущую мелодию. Для каждого из них можно было независимо задавать высоту тона, громкость и скважность импульса (соотношение длительности «высокого» и «низкого» состояния волны), что существенно влияло на тембр звука. Третий канал генерировал треугольные волны и отвечал за партию баса. Важная особенность: управлять громкостью этого канала было невозможно — она оставалась фиксированной. Зато треугольная волна придавала нижнему регистру музыки ту самую насыщенную, чуть мягкую глубину, которая столь характерна для звука NES. Четвёртый канал производил шум и использовался для создания ритмических паттернов, ударных эффектов и перкуссии.

Наконец, пятый канал — DPCM (Differential Pulse-Code Modulation) — позволял воспроизводить реальные звуковые записи с картриджа, пусть и крайне низкого качества. Из-за ограниченного места на картридже этой возможностью пользовались далеко не все разработчики. Тем не менее в некоторых играх она нашла применение: например, в Contra этот канал задействовался для воспроизведения живых барабанов, придавая военному боевику дополнительную энергетику.
Музыкальная тема первого уровня Super Mario Bros., носящая официальное название Overworld Theme (в оригинальной документации — «Running Around»), по сей день остаётся одной из наиболее узнаваемых мелодий в истории не только видеоигр, но и популярной культуры в целом. И сложена она именно из этих пяти каналов.

Следует оговориться: в японской версии консоли (Famicom) имелся разъём на картридже, позволявший подключать дополнительные звуковые чипы. Это давало японским разработчикам расширенные возможности — в международных версиях NES данная функция была исключена.
Sega Mega Drive: FM-синтез и рождение стерео
В то время как Nintendo завоёвывала рынок, её главный конкурент — компания Sega — разрабатывал принципиально иной подход к звуку для своей новой консоли четвёртого поколения.

Sega Mega Drive (известная в Северной Америке как Genesis) поступила в продажу в 1988–1989 годах и сразу заявила о себе не только передовой по тем временам шестнадцатибитной графикой, но и звуком, моментально ставшим узнаваемым. За аудио отвечали два чипа, работавшие в тандеме.

Главным из них был Yamaha YM2612 — шестиканальный FM-синтезатор. Расшифровка FM — Frequency Modulation, то есть частотная модуляция. Принцип работы этой технологии принципиально отличается от того, что использовала NES. Если в консоли Nintendo каждому звуковому каналу соответствовал один осциллятор с фиксированной формой волны, то в Sega каждый из шести FM-каналов располагал четырьмя операторами — четырьмя осцилляторами, способными генерировать различные волны. Обязательное условие одно: все четыре оператора в рамках одного канала работают на одной высоте тона, то есть играют одну и ту же ноту. Зато форма результирующей волны может быть практически любой: операторы можно складывать, вычитать и комбинировать между собой самыми разными способами. Это и есть FM-синтез — и именно он открывал огромные возможности для создания уникальных, сложных тембров, приближавшихся по богатству к звучанию настоящих синтезаторов класса Yamaha DX7. Не случайно патчи (наборы настроек) для YM2612 были совместимы с рядом профессиональных синтезаторов линейки Yamaha DX.

Кроме того, все шесть FM-каналов поддерживали стереозвук: каждый из них можно было независимо вывести в левый или правый канал, либо подать на оба сразу. До этого момента звук во всех игровых консолях был исключительно монофоническим. Sega Mega Drive стала первой массовой игровой платформой с полноценным стерео.
Шестой FM-канал обладал особым режимом: вместо синтеза он мог воспроизводить восьмибитный звуковой сэмпл с картриджа — PCM (Pulse-Code Modulation), импульсно-кодовая модуляция. Именно этот режим использовался для воспроизведения ударных инструментов, при этом сам сэмпл считывался с картриджа. В таком режиме FM-синтез шестого канала недоступен — можно работать только в одном из двух режимов.

Помимо Yamaha YM2612, в состав Mega Drive входил второй звуковой чип — Texas Instruments SN76489, обеспечивавший обратную совместимость с консолью предыдущего поколения, Sega Master System. Этот чип, известный как PSG (Programmable Sound Generator), мог генерировать три квадратные волны и один канал белого шума. В сочетании с FM-синтезатором это давало разработчикам богатый инструментарий.

Однако у FM-синтеза был и очевидный недостаток: воспроизвести звучание реальных акустических инструментов — живой гитары, натуральных барабанов — с его помощью крайне сложно. Реальные инструменты обладают множеством акустических нюансов, которые невозможно точно описать математическими операциями над несколькими волнами примитивной формы. Именно поэтому кавер-версии рок-классики на Sega Mega Drive, при всей узнаваемости, звучали скорее как синтетическая имитация, нежели как оригинал.
Super Nintendo: сэмплирование и революция в реализме звука
Именно этот недостаток FM-синтеза, по всей видимости, повлиял на выбор Nintendo при разработке звуковой системы для своей шестнадцатибитной консоли. Super Nintendo Entertainment System (SNES) пошла принципиально иным путём.

Звуковая система SNES была разработана совместно Nintendo и Sony и реализована в виде отдельного самодостаточного модуля — S-SMP. Интересно, что её архитектором выступил Кен Кутараги — тот самый инженер, который впоследствии создаст Sony PlayStation и войдёт в историю как «отец PlayStation». В состав S-SMP входил 8-битный процессор Sony SPC700, 64 килобайта выделенной оперативной памяти и отдельный цифровой сигнальный процессор (DSP, Digital Signal Processor) — специализированный чип для обработки звука.

Главное принципиальное отличие от конкурентов: SNES вовсе отказалась от синтеза звуковых волн. Вместо этого консоль целиком полагалась на воспроизведение сэмплов — реальных записей звучания инструментов, хранившихся на картридже в сжатом формате BRR (Bit Rate Reduction). DSP располагал восемью независимыми каналами воспроизведения и поддерживал весь спектр пространственной обработки: стереопанорамирование, независимое управление громкостью каждого канала, эффект эха, наложение шума и, что особенно важно, изменение высоты воспроизводимого звука.
Именно последняя возможность стала ключом к решению главной проблемы — ограниченного объёма памяти на картридже. Если бы потребовалось хранить отдельную запись для каждой ноты каждого инструмента, место закончилось бы мгновенно. Вместо этого разработчики хранили лишь один сэмпл для каждого инструмента, а система воспроизводила его с разными частотами, получая таким образом любую нужную ноту. Принцип отдалённо напоминает работу клавишного синтезатора, где одна записанная нота транспонируется в нужный регистр. Для инструментов это работает значительно лучше, чем для человеческого голоса.

Собственный процессор S-SMP служил связующим звеном между DSP и основным процессором SNES, а выделенная оперативная память избавляла от необходимости постоянно обращаться к ресурсам центрального процессора. Это кардинально отличало архитектуру от предыдущих поколений: звуковая подсистема работала практически автономно.
Скачок в качестве звука по сравнению с предшествующим поколением оказался колоссальным. Барабанная секция стала чёткой и ощутимой. Разные фрагменты одной композиции могли звучать принципиально по-разному. Например, тема первого уровня игры Star Fox поражала своей многоплановостью и живостью звука — нечто подобное ранее было просто недостижимо на домашних консолях.

Дискуссия о том, чья звуковая система была лучше — Sega Mega Drive с её FM-синтезом или Super Nintendo с сэмплированием, — не утихает в ретро-игровом сообществе по сей день. У каждого подхода были неоспоримые преимущества. FM-синтез Sega давал плотный, насыщенный бас и яркое, узнаваемое синтетическое звучание — незаменимое для определённых жанров. SNES, в свою очередь, предлагала значительно более реалистичное воспроизведение акустических инструментов, пусть звук и казался чуть более приглушённым из-за особенностей алгоритма сжатия BRR и встроенного гауссовского фильтра, сглаживавшего высокие частоты.
Пятое поколение: компакт-диск меняет всё
Противостояние двух философий звукового синтеза могло бы продолжаться и дальше, порождая всё более изощрённые решения. Но в пятом поколении консолей вся эта борьба в одночасье утратила смысл. Причиной тому стали два слова: компакт-диск.
Ёмкость стандартного диска CD составляла около 700 мегабайт — в сотни раз больше, чем любой картридж предыдущего поколения. Одновременно произошёл значительный качественный скачок в производительности микроэлектроники: процессоры стали достаточно мощными, чтобы без труда декодировать и воспроизводить потоковое аудио в реальном времени.

Это означало, что звуковые дорожки игр теперь могли хранить как полноценные аудиофайлы. Нужды в синтезе звука на лету более не было. Разработчики получили возможность использовать лицензионную музыку, профессиональные студийные записи, полноценные оркестровые саундтреки. В играх стало значительно больше озвученных диалогов и кинематографических роликов с живым звуком.

Sony PlayStation, вышедшая в 1994 году (в Японии) и 1995 году (в остальных странах), сделала именно на это главную ставку. Приставка располагала специализированным звуковым процессором SPU (Sound Processing Unit) с 24 каналами ADPCM-сэмплирования на частоте дискретизации до 44,1 кГц — это полноценное качество компакт-диска. Но главным аргументом служила именно возможность воспроизводить музыку прямо с диска. Проект Wipeout, вышедший в том же 1995 году, наглядно продемонстрировал возможности нового подхода: саундтрек к игре был составлен из треков легендарной британской электронной группы The Prodigy.

Sega Saturn, конкурировавшая с PlayStation в том же пятом поколении, также полностью полагалась на звук с диска, хотя её коммерческая судьба сложилась значительно менее удачно.

Единственной консолью пятого поколения без CD-привода осталась Nintendo 64 — приставка, практически неизвестная на постсоветском рынке, однако чрезвычайно популярная за рубежом. Nintendo сохранила верность картриджам, максимальный объём которых вырос до 64 мегабайт. В N64 не было отдельного звукового чипа: за воспроизведение сэмплов PCM отвечал сам центральный процессор. Это давало практически неограниченное количество теоретических звуковых каналов, хотя в большинстве случаев использовались лишь два — левый и правый для вывода стереозвука. Когда места на картридже не хватало для хранения полноценных аудиофайлов, разработчики прибегали к хорошо знакомому приёму: хранили отдельные сэмплы инструментов и воспроизводили их в нужном темпе и на нужной высоте — ровно так же, как это делала Super Nintendo поколением ранее. Кстати, и сама Sony PlayStation порой прибегала к этому старому методу — в тех играх, где графика или видеовставки занимали столько места на диске, что для хранения полноценных аудиофайлов его попросту не оставалось. Хрестоматийный пример — Final Fantasy VII, культовая ролевая игра 1997 года.
Шестое поколение: звук уходит на второй план
Шестое поколение консолей принесло следующий шаг в эволюции носителей: на смену CD пришёл DVD. Объём доступного пространства увеличился до 9 гигабайт на двусторонних дисках. Графика сделала очередной качественный скачок. В играх стало ещё больше кинематографических заставок, лицензионной музыки и профессионального озвучивания.

И именно в этот момент звук как самостоятельная техническая проблема окончательно перестал существовать. Он был решён настолько радикально, что превратился в нечто само собой разумеющееся. Разработчики больше не ломали голову над тем, как уместить саундтрек в ограниченную память или как симулировать звучание живых инструментов с помощью математических операций над волнами. Это освободило их для других задач: нарратива, игровой механики, визуального дизайна.

Но именно в этом успехе и таится некоторая потеря. Та самая «восьмибитная» и «шестнадцатибитная» музыка, рождавшаяся в жёстких технических ограничениях, обладала чем-то совершенно особенным — характером, который невозможно получить, просто записав музыку в студии. Тема первого уровня Super Mario Bros., синтетический джаз Sonic the Hedgehog, эпическое звучание Final Fantasy VI на SNES — всё это создавалось в условиях, когда каждый байт памяти был на счету, а каждый звуковой канал требовал ювелирной работы со стороны композитора и программиста.
Вместо эпилога: ностальгия как эстетика
История эволюции игрового звука — это история постепенного освобождения от ограничений. Сначала один тон, потом пять каналов, потом FM-синтез и сэмплирование, потом полноценная студийная запись. На каждом этапе инженеры и музыканты делали максимально возможное в рамках существующих технологий, и именно эти ограничения породили уникальную эстетику, которая живёт по сей день.

Жанр чиптюна — музыки, намеренно воспроизводящей звучание старых игровых чипов, — существует и процветает. Эмуляторы YM2612, SPC700 и Ricoh 2A03 выпускаются как программные плагины для современных музыкальных студий. Ретро-саундтреки остаются востребованными у независимых разработчиков игр. Любопытно, что звуковой чип Sony SPC700, разработанный для SNES, был создан Кеном Кутараги — тем самым человеком, который затем построит PlayStation и изменит всю игровую индустрию. История любит подобные закольцованные сюжеты.

Пожалуй, самый точный вывод, который можно сделать из этой истории: технический прогресс расширяет возможности, но не гарантирует выразительности. Иногда самые запоминающиеся вещи рождаются именно там, где ресурсов катастрофически мало, — и именно поэтому музыка из игр тридцатилетней давности всё ещё звучит в наушниках миллионов людей