Аудио плагины vs «железо»: чем закончились горячие споры к 2020-м

Бескомпромиссные холивары вокруг темы неспособности аудио плагинов показать качество обработки, сопоставимое с аналоговым оборудованием, начались примерно в первой половине 2000-х. К этому времени компания Steinberg, в недрах которой была в 1996 году изобретена технология Virtual Studio Technology (VST), выкатила уже 2-ю ее версию. А в 2006-м в версии 2.4 появилась поддержка 64-битного формата.

Прошло 20 лет, и сегодня у так называемых аудиофилов практически не осталось объективных аргументов против софтверной имитации музыкального оборудования и в защиту каких-то особых качеств «железа».

Вкратце перечислим основные претензии, которые все эти годы, предъявлялись аудио плагинам. Якобы они:

- обладают цифровой стерильностью и не способны передать «теплоту» аналогового оборудования;

- вносят в звук специфические искажения, вызванные эффектом звукового алиасинга;

- если имитируют физические приборы, то делают слишком правильные и одинаковые вещи, внося сатурацию (насыщение дополнительными гармониками) и искажения не так, как это делает «железо».

Даже в середине 2020-х убеждения аудиофилов заставляют их считать вообще всю цифровую звукозапись «мертвой», неестественной и недостаточно «глубокой».

Однако сегодня мы можем с точностью сказать, что за этими убеждениями стоит нормальный человечески субъективизм. И что аргументация сторонников «железа» потеряла силу еще в прошлом десятилетии.

Двойные слепые тесты показывают: слушатель не различает «цифру» и аналог

Проблема аудиофилов в том, что они старательно избегают участия в реальных научных сравнительных аудио тестах цифровых и аналоговых музыкальных записей, которые построены на выверенной методике под названием «Двойной слепой метод».

Она отличается тем, что не только испытуемые не знают какие именно музыкальные миксы им включают (цифровые или аналоговые), но и сами ученые не в курсе этого, пока не окончится эксперимент. Это нужно, чтобы экспериментаторы невольно не повлияли на восприятие участников исследований.

Реальных научных слепых тестов по теме «музыкальная цифра vs аналоговое железо», к сожалению, проводится очень мало. Ученым не слишком хочется участвовать в маркетинговой борьбе. Видимо, они не считают саму проблему реально серьезной.

Тем не менее, одно из таких исследований было проведено аж в 2000 году. В нем участвовали студенты-музыканты. Они слушали цифровые и аналоговые записи одного и того же живого концерта.

Исследование было двойным слепым, и участники могли переключаться между разными версиями записей.

И вот незадача: в конечном итоге цифровые версии получили более высокие оценки по таким критериям, как качество баса, верха, общее качество звука и слышимое разделение звучания инструментов (иногда это называют «читаемость» микса). В целом эксперимент показал, что цифровые записи были предпочтительнее для большинства испытуемых.

Результаты второго известного исследования по похожей теме были опубликованы в 2007 году в журнале международного «Общества аудио инженерии» (Audio Engineering Society), основанного в США в 1948 году.

Оно опровергло миф о том, что человеческое ухо слышит цифро-аналоговое преобразование в формате CD (16 бит, 44,1 кГц). В те годы считалось (да и сейчас некоторые настаивают), что это слишком узкая пропускная полоса для аудио сигнала, и что запись нужно делать с большей глубиной «битности» и более высокой частотой дискретизации.

В эксперименте тоже использовался двойной слепой метод. Его участниками были профессиональные звукорежиссеры, студенты университетской программы звукозаписи и преданные своему увлечению аудиофилы.

И да, им предоставили для сравнения записи в более емких форматах, наряду с записями CD качества. А воспроизведение осуществлялось на нескольких звуковых системах, среди которых были дорогие профессиональные мониторы и даже высококлассное оборудование с электростатическими громкоговорителями, очень недешевыми компонентами и аудиофильскими кабелями.

Эксперимент показал: никто (вообще никто!) из участников эксперимента не смог отличить на слух CD качество записи от формата более высокого разрешения. Цифро-аналоговое преобразование оказалось не обнаруживаемым на слух.

На закуску приведем еще одно (правда, маленькое – с выборкой всего в 19 испытуемых) исследование с двойным слепым методом 2019 года на холиварную тему «цифра vs аналог». Оно также было опубликовано на ресурсе Audio Engineering Society.

В данном случае обученным слушателям в возрасте от 17 до 37 лет включали варианты миксов восьми поп-треков. Каждые трек имел версии, сделанные только на аналоговом оборудовании и только в цифровой среде с плагинами.

Ученые обнаружили, что лишь один из восьми аналоговых миксов удостоился явного предпочтения у участников эксперимента по сравнению со всеми остальными.

Также исследователи заметили, что чем выше возраст испытуемого, тем несколько большую склонность он питает к выделению аналоговых миксов. Однако эту тенденцию экспериментаторы охарактеризовали как «небольшую».

Наше резюме: когда в 1980 году совместная инженерная группа компаний Sony и Philips предложила стандарт CD, она учла реальные возможности человеческого слуха, увеличила динамический диапазон записи по сравнению со студийными магнитофонами и виниловыми пластинками.

Кстати, если оценивать условную «глубину битности» очень хорошо калиброванного студийного магнитофона, исходя из динамического диапазона, который он способен записать (оценка «битности», конечно умозрительна для аналоговой техники), то магнитофон выдает диапазон, соответствующий максимум 14-битной глубине. Но чаще – 12-13-битной.

Считается, что магнитная лента хорошо передает низкоуровневые шумы (а это точно нужно в музыке?) и тихие звуки (потому что мягко компрессирует их).

Однако большинство специалистов полагают, что в области высоких частот даже CD формат более точно передает спектральный состав записи, чем лента. Что уж говорить о форматах с более высокой частотой дискретизации и глубиной битности...

В общем, не предвзятому рациональному человеку придется согласиться с тем, что на самом деле не слышат «цифру» даже профессионалы музыкальной индустрии, не то, что обычные слушатели, включая аудиофилов.

А тот, кто утверждает, что уж он-то точно слышит, тот просто не участвовал в реальных научных тестах с применением двойного слепого метода.

Также придется признать, что преимущества записи музыки на магнитную ленту в 2020-х годах сделались довольно сомнительными.

Качество работы аудио плагинов vs качество работы «железа»

Мы как разумные люди должны верить не интернет-форумам, не музыкальным мифам и даже не мнениям авторитетных музыкальных продюсеров и артистов, а только науке, которая всегда приводит эмпирические доказательства своих открытий и теорий.

В научном мире есть такой жанр исследования как «обзорное» или «метаисследование». Это когда группа ученых собирает всю доступную по какой-либо теме доказательную научную литературу, обобщает находки других ученых и делает выводы.

Один из важных научных источников по теме качества работы цифровых приборов, а затем и плагинов касается самого часто применяемого метода обработки аудио сигнала – эквализации.

Это большой обзор «Все об эквализации аудио: решения и передовые рубежи», опубликованный в журнале Applied Sciences («Прикладные науки»).

Исследование показывает, что современные цифровые компьютерные решения могут достигать результатов, сопоставимых с аналоговым оборудованием, особенно в контексте аудиоконтента и музыкального продакшна. Приведем прямую цитату:

«Хотя параметрические и графические эквалайзеры низкого порядка хорошо зарекомендовали себя, вариации и расширения этих конструкций, такие как параметрические эквалайзеры высокого порядка или графические эквалайзеры на основе свертки, предлагают почти безграничные возможности формирования спектрального содержимого сигнала.

Эти варианты конструкции позволяют пользователю или разработчику отдавать предпочтение точному управлению, низким вычислительным затратам и/или минимальной задержке...»

Под «сверткой» здесь понимается один из вариантов «Быстрого преобразования Фурье», которое активно применяется разработчиками современных плагинов эквализации.

Переводим на человекопонятный язык: цифровые, в том числе софтверные эквалайзеры обрабатывают звук сильно точнее, чем аналоговые, и имеют гораздо более гибкое и совершенное управление.

Как решили проблему алиасинга

Даже самый молодой и чертовски здоровый человек не слышит никаких звуков выше 20 килогерц. Зачем же тогда в цифровой звукозаписи применяют частоту дискретизации 44,1 килогерц и выше?

Дело в том, что если частота дискретизации не превышает частоту самого высокого записанного звука минимум в два раза, то при преобразованиии звука из «цифры» обратно в аналог от «потолка» частоты дискретизации как бы «отражаются» спектральные хвосты высокочастотных звуков (выше 20 килогерц) и проникают в полезный сигнал, часто звуча даже ниже его фундаментальной частоты.

Слышится это как неприятный шум, маскировка частот в миксе, как подмена частот. И принято этот дефект называть звуковым алиасингом.

Спрашивается, откуда в цифровой записи берутся звуки выше 20 килогерц? А от работы плагинов. Как и аналоговое оборудование, плагины часто «красят» звук, особенно если имитируют железные приборы. Это, в частности, касается плагинов насыщения (сатурации).

В процессе работы плагины добавляют к обрабатываемому сигналу дополнительные гармоники, и нередко самые высокие из них выходят далеко за пределы 20 килогерц.

Это именно их «хвосты» «упираются» в потолок частоты дискретизации и лезут обратно в слышимый сигнал.

У аналоговых приборов такого эффекта не происходит, поскольку у них нет никакой дискретизации звука, и они порой способны пропускать через себя ультразвук на частоте даже в районе мегагерца. Слушатель этого, конечно, не воспринимает, потому что динамики таких частот не воспроизводят, а ухо не способно их услышать.

Ультразвуку не во что «упираться» в аналоговой цепи, не от чего «отражаться», соответственно и алиасинга аналоговые приборы не дают.

Чтобы избежать описанного дефекта, поначалу предлагалось в цифровой звукозаписи использовать более высокую частоту дискретизации – от 96 килогерц и выше. Однако это так сильно нагружает работу процессоров компьютеров, что многие из них порой перестают вывозить даже простые проекты в DAW.

Разработчики современных аудио плагинов решили проблему по-другому. Они используют временную передискретизацию звука, проходящего через цифровую обработку, прямо на лету – внутри плагина. Нередко временное повышение частоты делается аж в 8 раз. Это позволяет избавиться от алиасинга.

К середине 2020-х внутреннюю передискретизацию стали использовать разработчики даже бесплатных плагинов. Так что жаловаться на цифровой алиасинг аудиофилы больше не могут.

Аргумент о «слишком правильном» звуке в «цифре»

Действительно плагины, имитирующие аналоговое звуковое оборудование работают более предсказуемо и чисто, особенно если эмулируют нелинейные искажения вроде тех, что дают гитарные педали и усилители, всякие там лампы предусилителей, транзисторы микшерных консолей и ленты магнитофонов.

Аудиофилы настаивают, что аналоговые приборы делают искажения звука особенно «теплыми» из-за своего конструктивного несовершенства, а это, мол, нельзя сымитировать в цифровой среде.

Звучит вроде убедительно, но мы-то знаем, что эксперименты с двойным слепым методом исследования установили: люди не слышат разницы между «цифрой» и аналогом. Просто не могут этого.

Поэтому аргумент аудиофилов слаб. Особенно в контексте того, что современные разработчики плагинов успешно освоили моделирование аналоговых цепей железных приборов.

Если уж человеческое ухо в принципе не слышит разницу между цифровой и аналоговой обработкой аудио сигнала, как оно может слышать, что моделирующий плагин слишком правильно имитирует конкретный железный прибор, которому свойственны некоторые вольные отклонения?

И вообще, то, что моделирование «слишком правильное», – это скорее достоинство для многих музыкальных продюсеров и звукорежиссеров. Потому что в реальной работе мы ждем от плагинов предсказуемого поведения, а не сюрпризов при каждом запуске проекта в DAW, как бы хорошо они иногда ни звучали...

Словом, в середине 2020-х не осталось разумных оснований утверждать, что качественные плагины в чем-то уступают железу. Особенно если сравнить стоимость софта и физических приборов и учесть, что многие совершенно бесплатные плагины серьезно конкурируют с платными аналогами.

Стоит, наверное, признать, что предпочтение аналогового звука – это не про разумный выбор, а скорее про искреннюю любовь, которую, правда, не все готовы демонстрировать, скрываясь за технической аргументацией. Но зачем прятать любовь к «железу» – непонятно. Ведь она заслуживает всяческого уважения, если никому не навязывается...

Владимир Лакодин