Если дать вам послушать два абсолютно одинаковых музыкальных фрагмента, которые будут отличаться лишь громкостью, вы почти наверняка выберете тот, что громче. Как и все. Ну, или почти все. Дело в психоакустическом феномене, который заключается в том, что слушатели предпочитают громкую музыку при прочих неизменных ее параметрах. Данный феномен привел к явлению, которое получило название «Война громкостей» (Loudness war) и привело к ухудшению слуха у молодежи, падению качества звучания фонограмм и повлияло на продажи музыкальных альбомов. Благодаря этой «войне» появились новые методы музыкального производства, основанные на принципе «чем громче, тем лучше». Давайте разберемся в причинах, последствиях и методах борьбы в этой войне.
Восприятие музыки человеческим ухом не является линейным. То есть, на низких уровнях громкости наш слух менее чувствителен к низким и высоким частотам, воспринимая в основном средние. В связи с этим, музыка воспринимается приглушенно, плоско и не дает нужной энергии. Всё меняется, когда мы добавляем громкости: отчетливо слышны низкие и высокие частоты, звук воспринимается более ярким и энергичным, с басами, которые качают и т.д. Большинство слушателей предпочтут второй вариант.
Любовь к громкой музыке можно также объяснить эффектом маскировки, когда мелодию не слышно в шумном месте и хочется добавить громкости.
Если посмотреть на сигналограмму, то она будет выглядеть как поваленная ёлка, то есть будут чередоваться тихие и громкие участки, доказывая, что мелодия всегда нестатична. Делать громкие места более громкими опасно, это может быть неприятно для слуха, а иногда и просто опасно. Вывод какой? Правильно: подтягиваем по громкости тихие участки. Что в итоге происходит с «ёлкой» сигналограммы? Она становится почти плоской, одинаковой ширины, невыразительной и скучной. Описанные выше действия носят название «динамическая обработка» или сжатие динамического диапазона при помощи компрессии.
После динамической обработки получаем на выходе более громкое звучание, которое при этом не травмирует уши (мы же не трогали пики максимальной громкости). Человеческий слух воспринимает громкость не по пиковым значениям, а по среднеквадратичным (RMS или средняя громкость), поэтому средняя громкость возрастает, несмотря на то, что пиковые значения остались на том же уровне. Звукорежиссеры используют такое понятие как кросс-фактор – это разница между пиковым значением громкости и среднеквадратичным, чем выше данная разница, тем шире динамический диапазон произведения.
И вроде бы сделали хорошее дело: и фонограмма звучит громче, и басы с верхами более заметны, и не затеряется мелодия среди другого шума. Но не все так радужно. Дело в том, что динамика (смена тихих и громких фрагментов) является важной составляющей почти любого музыкального произведения. Динамика придает музыке уникальность, какие-то особенные оттенки, объемность, которые пропадают в процессе компрессии.
Динамика музыкального произведения делится на два типа:
макродинамика – разность в громкости между отдельными частями произведения;
микродинамика – единичные колебания громкости.
Когда звукорежиссер чересчур увлекается компрессий, то пропадает и макро-, и микродинамика, что сказывается на качестве самого музыкального произведения.
Термин «война громкости» появился в 1979, когда Роберт Орбан впервые использовал его в статье, посвященной чрезмерной динамической обработке, применяемой на радио. Дело в том, что в те годы радиостанции в борьбе за рейтинг с удовольствием использовали чрезмерное компрессирование и лимитирование фонограмм.
Применять же компрессию к записям начали еще в 60-70-х годах знаменитые The Beatles, когда заметили, что громкая музыка продается лучше. С записями на виниловых пластинках трудно было экспериментировать в плане компрессии, что связано с особенностями звукозаписи на виниле. Высокая громкость записанной музыки могла привести к большим колебаниям иглы, которая могла просто соскочить с дорожки. Вторым отрицательным моментом чрезмерного увеличения громкости было бы увеличение ширины дорожки, что приводило бы к сокращению продолжительности записи на пластинке, а это невыгодно.
Всё изменилось, когда пришли они – компакт-диски (CD). Они начали постепенно вытеснять винил в 1982 году, когда записи были перенесены с аналоговых на новые цифровые носители. В этом отношении цифровое аудио отличается от аналогового двумя вещами: оно имеет гораздо более низкий уровень шума (настолько низкий, что CD был первым носителем, имеющим больший динамический диапазон, чем живая музыка), а также оно имеет четко определенную максимальную пиковую амплитуду, которую невозможно превысить. Если часть аудиосигнала превышает данный предел, то пики «обрезаются» (клиппирование) и их вершины теряются, фактически превращаясь в шумы, которые большинство людей не замечают.
Поэтому многие звукорежиссеры и в 90-е легко применяли компрессию, в результате чего музыкальные записи становились всё громче. Таким образом, средняя громкость компакт-дисков со временем росла, пики обрезались чаще, война громкостей процветала, а динамический диапазон продолжал сокращаться.
Окончанием войны за громкость можно считать появление метаданных файлов. Цифровые аудиоплееры и программное обеспечение для воспроизведения мультимедиа считывают значения громкости метаданных и соответствующим образом настраивают уровень воспроизведения для каждой дорожки, что не позволяет громкости негативно влиять на качество звука. Это простой и гениальный способ, который работает: брать громкие треки и уменьшать их громкость по сравнению с тихими. При такой «уравниловке» война громкостей стала бессмысленной: дорожки, записанные с применением компрессии, не становились громче. Вместо этого вы четко замечаете отсутствие динамики, вызванное избыточным сжатием.
Все современные потоковые сервисы автоматически применяют нормализованные уровни громкости, обычно основанные на «интегрированной громкости» (измерении громкости для всего аудиофайла).
Диапазон громкости, показатель того, насколько динамична дорожка, также имеет место в метаданных аудиофайла. Применение этих мер и методов выравнивания позволяет перейти от «нормализованного по пику» к «нормализованному по громкости» звуковому миру, когда вы можете переключаться между музыкальными композициями различных жанров, не трогая регулятор громкости.
Анализ за 40 лет. В исследовании испанских ученых, опубликованном в 2012, были проанализированы несколько миллионов песен за период 1965-2005 года и оценены по трем параметрам: тембр, тональность и громкость. Результаты оказались очень интересными. Тональность произведений ощутимо не изменилась (всё те же аккорды и ноты). В отношении тембра результаты были печальными: разнообразие существенно сократилось, это относится к количеству используемых инструментов, голосов и диапазонов. То есть произведения стали менее «богатыми» в отношении инструментальных аранжировок, более скудными и плоскими. А вот громкость за эти 40 лет выросла существенно, причем громкость за счет компрессии.
На рисунке ниже вы можете видеть, как с годами подвергалась компрессии песня группы ABBA. Это сигналограммы одной и той же песни. Посмотрите, сравните, обратите внимание на динамику произведения и заметное ее исчезновение с годами.
Жертвы войны. Жертвами войны громкостей стали многие альбомы, выпуск которых пришелся на ее время. В качестве примера можно привести альбом группы Metallica под названием «Death Magnetic», который подвергся такой компрессии, что был жестко раскритикован в отношении качества звука: настолько сильным было искажение. В 2008 году с помощью редактора и возможности перенесения многодорожечных записей данного альбома, фанаты группы Metallica смогли услышать, как мог бы звучать выпущенный альбом, если бы он не подвергался столь жесткой компрессии.
И вот тогда альбом зазвучал по-настоящему хорошо и, что самое главное, динамично. Данное обстоятельство позволило привлечь внимание к проблеме перекопрессированной музыки, качеству и громкости ее звучания.
Потеря качества музыки. Увлекаясь избыточной компрессией, звукорежиссер лишает музыкальные произведения динамики, но добавляет множество нелинейных искажений при клиппировании сигнала. В результате фонограмма звучит громко и «басовито», но однообразно и грязно. В итоге страдает именно художественная ценность произведения.
Потеря слуха. Любители громкой музыки постепенно теряют слух. Связано это с тем, что при настройке громкости слушатель ориентируется на ее пиковые значения. Но звуковое давление (SPL) зависит от «средней громкости», поэтому, слушая перекопрессированную музыку, вы подвергаете свои уши избыточному звуковому давлению. Более того, в попытке услышать более отчетливо басы, слушатели повышают уровень громкости при прослушивании, например, танцевальной музыки, доводя ее до слишком высоких значений. В результате за последние 30 лет количество молодежи, имеющей проблемы со слухом увеличилось более чем на 30%, и эта цифра продолжает расти.
Таким образом, война громкостей закончилась потерей интереса к богатству тембра, к оригинальности и динамики. Победила громкость, потому что она лучше продается. Любители винила и аудиофилы негодуют и не ведутся на громко звучащие басы. В итоге каждый остается при своем мнении: кому-то погромче, а кому-то подинамичней. А вы что предпочитаете?
Подытожить хотелось бы высказыванием Эрла Викерса: «Если бы при оценке мастерства громкость была определяющим фактором, то Вагнер считался бы самым величайшим композитором, превзойдя Моцарта, Баха, Бетховена вместе взятых. А в свою очередь Вагнеру было бы далеко до творчества современного реактивного самолета!»