Громкость, гейн и уровень в звукозаписи: понятный гайд для музыкантов (без формул)

Многое сбивает с толку в цифровом звуке. Например, в природе громкость (на самом деле не «громкость», но об этом позже) физики измеряют в децибелах, выраженных положительными числами, а в цифровых рабочих станциях (DAW) децибелы почему-то отрицательные.

А еще, оказывается, видимый на виртуальном пульте уровень сигнала может превысить значение «ноль», и на экране вдруг появляются какие-то «положительные» децибелы — что это значит, помогите!.. Все вокруг и на YouTube говорят то «громкость», то «гейн», то «уровень» — в чем разница?

Давайте наконец в этом разберемся по возможности без формул — ведь мы тут по большей части музыканты, а не инженеры. И заодно научимся безопасно организовывать так называемый headroom или «запас по уровню» в своих музыкальных проектах, реализуемых с помощью DAW.

Громкости в цифровой звукозаписи, по сути, не существует. Что такое «природные» децибелы

«Громкость» — всего лишь слово, призванное как-то обозначать интенсивность звукового давления на уши. Каждый человек воспринимает тихое и громкое субъективно. Что одному просто «громко», другому — «ужас как орёт».

Субъективными критериями при создании музыки и так приходится пользоваться постоянно, что мешает взаимопониманию между участниками процесса. Поэтому в пылу творческого производства нам нужно понимать про громкость что-то более объективное, «техническое».

В природе ее тоже не существует — звук распространяется в газообразной, жидкой и твердой среде в виде особых упругих волн. Источником звука является физическое тело, совершающее механические колебания в пространстве — струна или, скажем, голосовые связки человека.

Опишем звук не строго научно, но зато наглядно: после щипка струна, множественно изгибаясь, колеблется из стороны в сторону (на самом деле в 3D), с определенной частотой (высота звука; и на самом деле там несколько частот — фундаментальная и обертоны) и на определенное расстояние от оси неподвижности (амплитуда, «громкость»).

Струна как бы «толкает» воздух вокруг себя, и во все стороны начинают распространятся упругие волны. Они создают в газообразной среде повторяющиеся области повышенного давления. Поэтому физики и могут говорить о всех этих слышимых колебаниях именно как о «звуковом давлении».

Его интенсивность нужно как-то измерять. Но в каждой точке комнаты, где некто дернул струну, замеренные в определенный момент времени значения могут сильно меняться. Мы же имеем дело с волнами, они периодические — перед нами то область избыточного давления воздуха, то нормального, то опять избыточного, но поменьше (ведь звуки со временем затухают).

Решая проблему измерения, умные ученые поняли, что интенсивность звукового давления нужно вычислять по определенной формуле, получая среднеквадратичное значение. Не будем углубляться в это, отметим лишь, что в формуле учитываются: само звуковое давление, удельное акустическое сопротивление среды (воздуха, например) и усреднение по времени.

В музыке звуковые колебания в подавляющем большинстве явно периодические — как у струны. Иногда их интенсивность вычисляют с использованием понятия «амплитуда звукового давления». Но это нам не особо важно.

А важно нам то, что положительные (со знаком «+») децибелы, о которых мы рассуждаем, в физике говорят об интенсивности звукового давления, но не вообще, а по отношению к некоему началу шкалы.

Децибелы — относительные, они же логарифмические или дольные единицы (подробности — к черту), и поэтому имеют смысл, только в случае, если у нас есть «точка отсчета», с которой эти единицы и соотносятся.

В физике таким началом шкалы был выбран уровень давления в 20 микропаскалей (мкПа). Это средний порог слышимости человека, ниже которого он не воспринимает звуки и считает, что слышит тишину. Хотя кошка бы с этим не согласилась.

Маленькое замечание: воспринимаемая человеком громкость изучается отдельно, у нее свои единицы измерения. Она зависит от формы сигнала, его частотного состава и прочих условий. Но для работы с DAW эти сведения не первостепенны. Нам главное не накосячить с децибелами.

0 нормальных, «природных» (с подразумевающимся знаком «+») децибел (dB SPL, что означает sound pressure level или «уровень звукового давления) — это тишина для людей. Вот некоторые типичные значения для сравнения:

15 dB — «едва слышно» — шелест листьев;
35 dB — «хорошо слышно» — приглушённый разговор, обстановка в тихой библиотеке, шум в лифте;
50 dB — «отчетливо слышно» — разговор средней громкости, тихая улица, стиральная машина;
70 dB — «шумно» — громкие разговоры на расстоянии 1 м, шум пишущей машинки, шумная улица, пылесос на расстоянии 3 м;
80 dB — «очень шумно» — громкий будильник на расстоянии 1 м, крик, мотоцикл с глушителем, шум работающего двигателя грузового автомобиля. Длительное прослушивание звука такой громкости вызывает ухудшение слуха;
95 dB — «очень шумно» — вагон метро на расстоянии 7 м, громкая игра на фортепиано на расстоянии 1 м;
130 dB — «боль» — сирена, шум клепки котлов, рекорд по самому громкому крику, мотоцикл без глушителя;
160 dB — «шок», возможен разрыв барабанной перепонки — выстрел из ружья близко от уха, соревнования автомобильных звуковых систем, ударная волна от сверхзвукового самолета или от взрыва давлением 0,002 мегапаскаля.

Звукозапись. Громкость и гейн

Когда мы имеем дело с записью звука, нам как-то нужно переводить периодические звуковые колебания в воздухе в колебания электрические. С 1857 года, когда был изобретен фоноавтограф, ученые и инженеры опробовали массу способов писать звук.

Качественнее и дешевле всего оказалось делать это методами именно электрическими — при помощи микрофонов, магнитных звукоснимателей и пьезозвукоснимателей (для струнных и иногда ударных инструментов — например, фортепиано).

Эти электроакустические устройства улавливают колебания звукового давления воздуха (в случае магнитных звукоснимателей те улавливают колебания струн, а в случае пьезодатчиков — вибрацию деки) и «переводят» их на язык электроприборов — в аналоговый сигнал.

Как мы понимаем, звук для нас в момент такого «перевода» как бы исчезает. Дальше в своей работе мы имеем дело лишь с «молчаливыми» электрическими колебаниями.

Именно они путешествуют внутри музыкальных аппаратов – усилителей, аналоговых примочек, магнитофонов и т. п. Чтобы эти колебания, усиленные, обработанные или просто записанные, скажем, на магнитную ленту, снова стали звуком, их надо с помощью специального устройства опять превратить в звуковые колебания воздуха. Таким устройством выступает динамик.

У аналогового сигнала есть главное свойство — он непрерывный во времени и в каждую миллисекунду — да хоть в одну миллионную долю секунды — имеет некий параметр. Допустим, в случае аналогового электронного представления звука это может быть амплитуда (наибольший разброс значений от среднего).

Аналоговый сигнал, полученный с микрофона, показывает нам историю частых изменений звукового давления за какой-то временной период. Поем мы, скажем, песню в которой задумали 2 минуты вокала в куплетах и припевах, и при записи получаем как бы хронику изменений звукового давления на мембрану микрофона.

Электрические аналоговые сигналы, полученные при преобразовании звуковых колебаний проще всего представлять в виде синусоподобных графиков. Музыкальный и немузыкальный звук — это, по сути, сложная сумма синусоид.

Но бывает она и простой — когда аналоговый тон-генератор выдает нам одну единственную синусоиду с частотой, скажем, 440 Герц (нота «ля»), из динамика мы слышим чистый, но скучный «бип».

И вот, наконец, здесь мы добираемся до гейна. Слово «гейн» означает «усиление». Его уровень мы задаем регуляторами на усилителях и звуковых картах. От ручек регуляции «громкости» (Volume) или «уровень звукового давления» (Level) это отличается тем, что усиливать сигнал мы можем свыше предела за которым начинаются его искажения.

Сейчас давайте внимательно: наша синусоида (помним, что она символизирует и визуализирует для нас аналоговый сигнал внутри электроприбора) — это такие симметричные округлые «горочки» и «впадины», повторяющиеся периодически.

Мы можем увеличивать высоту «горочек» и глубину «впадин» (то есть, амплитуду) или, другими словами, «усиливать сигнал», «добавлять гейна» не бесконечно.

Не будем говорить здесь о схемотехнике приборов, давайте просто примем на веру, что у каждого их них есть физический предел, до которого прибор может увеличивать амплитуду сигнала пропорционально — без того, чтобы его не «сломать».

Когда усиление достигает критической точки и выходит за пределы допустимых значений, физическая схема устройства начинает срезать «горочки» сверху и подрезать «впадины» снизу. Вот так:

На инженерском языке это называется «аналоговый клиппинг». Из динамиков в этом случае, кроме полезного звукового сигнала, могут слышаться хрип, дребезг, треск. В звукотехнике это еще называют «нелинейными искажениями»

Теперь мы можем уяснить себе, что уровень громкости в музыкальной технике — это изменение амплитуды сигнала ДО предела, за которым он начинает искажаться. А «гейн» — запросто может выходить на эти пределы.

Парадокс в том, что при увеличении гейна на значительные величины сверх допустимого, звуковое давление, создаваемое динамиками (на которые выходит обработанный сигнал), не всегда увеличивается. Сказанное верно для цифровой обработки звука.

Скажем, внутри DAW, посылающей обработанный сигнал на звуковую карту, при клиппинге и выкручивании гейна на виртуальном пульте в зону безумных значений никакого реального повышения уровня громкости не происходит. В динамиках аудио мониторов мы слышим лишь добавление все больших искажений. Это связано с особым представлением звука в «цифре», о котором чуть ниже мы скажем пару слов.

А пока вернемся к «отрицательным децибелам». Вспоминаем, что dB – это относительные единицы, имеющие смысл только в том случае, если они соотносятся с какой-то точкой отсчета.

В звукозаписи за такую точку принимают как раз уровень сигнала, за которым начинаются его искажения. Его обозначают как «ноль». Все что в зоне «до нуля» — это сигнал без клиппинга, уровень которого обозначают в dB с «минусом». Все, что выше — это сигнал с искажениями, со срезом амплитуды («горочек и впадин»). И обозначают его в dB с «плюсом».

В «отрицательных» децибелах уровень громкости принято показывать как на аналоговых, так и на цифровых приборах. Это удобно и наглядно.

Что происходит с громкостью в «цифре»

В наших звуковых картах аналоговый сигнал после небольшого усиления предусилителем попадает на аналого-цифровой преобразователь (АЦП). Если немного упростить, вот что делает АЦП:

1. Обрезает полосу частот, убирая лишнее. Например, звук ниже 20 Герц, который не воспринимается человеком.

2. «Дробит» непрерывный сигнал на сумму конкретных значений (дискретизация и квантование). То есть, как бы превращает нашу синусоиду в псевдосинусоиду, состоящую из многих-многих «столбиков».

Частота дискретизации — это количество «столбиков». Разрядность квантования или «битность» — количество битов, использованных для кодирования «высоты» каждого «столбика».

Чем больше «столбиков» (выше частота дискретизации) тем ближе будет наш цифровой сигнал к плавной синусоиде его оригинала.

Разрядность отвечает за точность измерения сигнала в данный момент времени. Чем она выше, тем меньше погрешность. 16 бит для звука — хорошо. 24 бита — еще лучше.

3. АЦП кодирует или «цифрует» каждый «столбик», представляя его в виде конкретного числа с порядковым номером.

В наших DAW бывший физический звук, превратившийся сначала в аналоговый сигнал, а потом при помощи АЦП — в цифровой, становится набором математических абстракций. И, конечно, мы должны понимать, что никакой «звук» не гуляет в звуковой карте, в проводах, в Cubase, других цифровых аудиостанциях, в плагинах обработки, в синтезаторах.

«Нулевой» предел уровня громкости в DAW, за которым начинаются искажения, тоже умозрительный. Для глубины АЦП в 24 бита «цифровой ноль» — это всего лишь 24 двоичных «ячейки», в каждой из которых записано значение «1».

Поскольку 25-й ячейки и всех последующих просто нет, клиппированный (искаженный) сигнал на уровнях выше «0» просто не может стать «громче». К нему лишь примешивается все большее количество искажений.

Когда мы работаем с уровнями громкости в DAW, нам важно этих искажений избежать. Ибо наша DAW отдает суммированный цифровой сигнал с мастер-шины на звуковую карту, там он попадает в цифро-аналоговый преобразователь (ЦАП), тот преобразует и выводит его на выходы уже в виде аналогового сигнала, откуда последний попадает на динамики наушников или аудио мониторов.

Тут-то мы и слышим ушами искажения (клиппинг). Они обычно неприятны и указывают на то, что фонограмма испорчена. Бывают и приятные искажения — например, легкий ленточный (магнитофонный) дисторшн, который звукорежиссерами привносится в фонограмму нарочно. Но это отдельная тема.

Забавно, что на пульте DAW до «нуля» фейдер вполне безопасно меняет уровень громкости звукового сигнала (работает как Volume), а «выше нуля» превращается как бы во вносящий нелинейные искажения гейн. Однако стоит помнить, что это не настоящий гейн, с чем мы уже разобрались.

Как обращаться с уровнями громкости в DAW

Мировые лейблы по обе стороны Атлантики, имеющие в своем штате или на контракте in house звукорежиссеров, обычно запрашивают у музыкантов миксы и stems без мастеринга с уровнями громкости не превышающими -6 dB в пике. Это нужно им, чтобы иметь «запас по громкости» для дальнейшей обработки.

Важно, что речь идет именно о пиках, а о не о среднеквадратичном уровне виртуального звукового давления фонограммы, исчисляемого в RMS или LUFs (формальный средний уровень громкости в сочетании с воспринимаемым уровнем громкости).

Логика и практика подсказывают, что, когда мы записываем через звуковую карту голос, живые инструменты и синтезаторы, мы можем контролировать уровень гейна на входе и видеть уровень громкости в -dB внутри DAW.

Стоит добиваться того, чтобы пики записываемого сигнала на входе никогда не превышали -6, ну пусть -5 dB, и уж точно ни при каких условиях не «допрыгивали» до 0 dB.

Когда внутри DAW мы используем виртуальные синтезаторы и сэмплированные инструменты, мы можем чувствовать себя чуть свободнее. Однако необходимо на виртуальных выходах синтезаторов и сэмплеров (а также плагинов обработки) всегда быть «в минусе».

И вообще, начиная аранжировку в проекте, лучше сразу устанавливать фейдеры пульта DAW для всех дорожек на -10, а то и -12 dB. Таким образом вы создадите себе запас по громкости.

Ведь в фонограмме обычно задумана некая драматургия. Музыкальные события будут развиваться, приводить к кульминациям. И в момент, когда на «форте» у вас вступит одновременно много инструментов, уровень суммарного сигнала на мастер-шине обязательно превысит уровень сигнала любой конкретной дорожки. А мы помним, что на лейбл для финальной обработки (мастеринга) следует отдать файл, в котором пики не выходят за -6 dB.

Лучше в процессе аранжировки и предварительного сведения ни разу не превысить заветную границу на мастер-шине, чем потом сидеть и муторно понижать уровень каждой дорожки. К тому же на многих может быть прописана еще и автоматизация громкости, что добавит проблем и затрат времени на редактирование. Ведь в предварительном миксе, отвечающем требованиям лейбла, мы хотим получить ту же картину, что задумали изначально.

Опасения, что микс будет звучать «тихо», напрасны. Звук в DAW никогда не бывает реально «тихим» — это же математическая абстракция, помните? Звукоинженер лейбла, получив stems или «сухой» микс с пиками -8 и даже -10 dB, ничуть не расстроится. Все, что необходимо добавить, он добавит.

По сути, в работе с уровнями громкостями в DAW следует соблюдать очень маленький набор правил, но они уберегут от большинства проблем.

Владимир Лакодин