воскресенье, 3 июля 2016 г.

Война за громкость [основная статья]

Эммануэль Дерюти
журнал "Sound on Sound" / сентябрь 2011 г.
  

Почему музыка стала звучать хуже?

«Поклонники жалуются, что Death Magnetic в Guitar Hero звучит лучше, чем на CD». «Даже фанаты хеви-метала считают, что сегодняшняя музыка слишком громкая!» «Dynamic Range Day объявляет новое движение против громкости». «Смерть Hi-Fi»… В прессе и сети растёт движение против «войны за громкость», практики, когда люди пытаются получить максимально возможную громкость в своих треках, чтобы заставить слушателей ощущать их более «горячими» по сравнению с конкурирующими релизами. Согласно этим статьям, неблагоразумные методы мастеринга и, более конкретно, злоупотребление brickwall-ограничителями, ставят музыку под угрозу. В современном производстве не хватает детальности, и оно жертвует качеством ради уровня. Боб Дилан в 2006 году в своём интервью заявил, что «Вы слушаете эти современные альбомы, и они звучат просто по-зверски. У них один звук везде. Нет никакой чёткости и детальности, ни в вокале, ни в чём-то другом. Всё статично».
Но не является ли замечание Дилана отражением извечного конфликта между отцами и детьми? Это был бы не первый случай, когда старая гвардия презирает то, что делает новое поколение. Хотя, верно и то, что многие звукоинженеры присоединяются к обществу, предпочитающему «более динамичную» музыку. Но объективно ли они говорят о том, что такая музыка лучше, или они просто предпочитают какой-то определённый тип звучания? Моё исследование постарается дать ответы на эти вопросы. Мы узнаем, действительно ли стала громче современная музыка, и стало ли в ней меньше динамики. Мы также рассмотрим гипотезу, что громкость может быть стилистическим признаком специфических музыкальных жанров, а не «дурной манерой», мотивированной презренными коммерческими интересами. И, наконец, мы пристально поглядим на печально известный альбом Death Magnetic группы Metallica и выясним, почему многим людям кажется, что он звучит плохо.

Действительно ли теперь музыка стала громче?

Да, это так, и здесь нет никаких сомнений. Давайте возьмём большое количество известных поп-песен, записанных в промежутке между 1969 и 2010 годами, нормализуем их так, чтобы пики стали под 0 dBFS, и измерим значение RMS. Теперь давайте рассортируем все значения согласно году релиза каждой песни. Первая диаграмма (вверху) показывает результаты эксперимента, и они реально возбуждают! Красная линия показывает усреднённые значения RMS для каждого года, а прямоугольники показывают распределение: чем темнее, тем больше песен имеет такой же уровень. Здесь, несомненно, наблюдается постоянный рост среднего уровня между 1982 и 2005 годами, и сегодняшние записи примерно на 5 dB громче, чем было в 70-х.
По общему признанию, RMS даёт только информацию об «электрическом» или «физическом» уровне аудиофайла, но никак не говорит о той громкости, что мы реально воспринимаем. Для этого, согласно нормативным рекомендациям EBU 3341, мы оцениваем «интегрированную громкость». Как видно на второй диаграмме, это значение весьма сильно коррелируется с RMS, и два графика очень похожи друг на друга. Таким образом, второй набор результатов подтверждает первый.
Давайте воспользуемся другими критериями и повторим эксперимент. К примеру, для описания динамического поведения музыки часто используется такой критерий, как крест-фактор. Говоря простыми словами, он показывает разницу между пиковым и RMS-уровнями на протяжении песни. Он является хорошим маркером, позволяющим оценить количество компрессии, применённой к музыке: обычно, чем больше компрессии, тем ниже крест-фактор. Некоторые профессионалы считают аккуратное обращение с крест-фактором залогом успешного мастеринга. В общих словах, опять же, чем ниже крест-фактор, тем громче музыка.
Третья диаграмма показывает эволюцию крест-фактора. Основываясь на тех же самых 4500 песен, этот усреднённый график, начиная с 80-х годов, показывает падение на 3 dB. Это укрепляет нас во мнении, что увеличение громкости, явно начавшееся с 90-х, было порождено компрессией. Нетрудно заметить, что эволюцию крест-фактора можно разделить на три этапа. Первый, с 1969 по 1980-й, показывает увеличение крест-фактора, обусловленное, вероятно, совершенствованием студийного оборудования, улучшением отношения сигнал/шум и, как следствие, расширением его динамического диапазона. С 1980 по 1990-й крест-фактор остаётся довольно устойчивым. Затем, с 1990 по 2010-й – в эпоху войны за громкость – крест-фактор драматически уменьшается.
Наконец, ещё один полезный и информативный критерий – это пропорция сэмплов, после нормализации близко подобравшихся к потолку 0 dBFS. Большая плотность очень громких сэмплов предполагает, что в мастер-копии был клиппинг или использовался цифровой brickwall-ограничитель. Четвёртая диаграмма отслеживает плотность пиковых сэмплов в той же самой коллекции из 4500 треков. Первые две диаграммы показывают, что музыка становится громче; третья указывает, что это происходит, вероятно, в результате компрессии динамического диапазона; а эта иллюстрирует, что компрессия, скорее всего, сопровождалась цифровым brickwall-ограничением.

Что такое динамический диапазон музыки?

Вы удивитесь, но на этот вопрос довольно трудно ответить. Интуитивно, мы чувствуем, что динамический диапазон это некий критерий, показывающий, насколько варьируется уровень в музыкальной композиции. Давайте попробуем материализовать эти догадки. Первая диаграмма сравнивает значения RMS в двух песнях: «Fuk» от Plastikman и «Smells Like Teen Spirit» от Nirvana. Очевидно, что уровень в Smells Like Teen Spirit более подвижен, чем в Fuk. И это не удивляет, поскольку Plastikman приверженец минимал-техно, тогда как для Nirvana характерны мягкие куплеты и громкие припевы.
Однако, результат меняется просто радикально, если для анализа использовать окно не 2 секунды, а 100 миллисекунд. При большем окне музыка Plastikman демонстрирует более стабильный RMS-уровень, но, как Вы видите на второй диаграмме, при меньшем времени интеграции в ней появляются более интенсивные вариации. Это обусловлено громкими и сухими барабанами. Поэтому, если мы хотим объективно измерить «подвижность уровня», то должны тщательно подумать над тем, какой масштаб использовать.
Также есть вопрос по поводу того, как фактически вычислить эту подвижность уровня. Иными словами, как получить цифровое значение, которое было бы мерой «динамического диапазона». Очевидно, мы могли бы измерить полную вертикальную амплитуду кривой RMS в заданном временном масштабе, суммируя амплитуду каждого вертикального движения. На первый взгляд, это даёт идеальную картину: снова посмотрите на первую диаграмму, на которой синяя кривая выглядит более подвижной, чем красная, и имеет большую общую вертикальную амплитуду.
Однако, на практике, этот метод ненадёжен. К примеру, изолированный пик посреди плоской RMS-кривой исказит измерение, давая ложное представление подвижности уровня. Существует более надёжный метод, используемый EBU для оценки диапазона громкости. Он заключается в вычислении распределения значений RMS. Такое распределение показано в третьей диаграмме. Затем мы измерили «разброс» распределения, используя трюк, подобный методу вероятностной выборки из арсенала описательной статистики, оставив только 5% высших значений и 10% низших. Результаты анализа в двухсекундном окне показывают более широкий разброс RMS у Smells Like Teen Spirit.
Давайте теперь изменим масштаб и измерим разброс RMS в окне 0,1 секунды. Итоги эксперимента показаны в четвёртой диаграмме и снова результаты прямо противоположны: разброс в Fuk намного больше, чем в Smells Like Teen Spirit. Теперь, проведём этот же эксперимент с другими размерами окна. Результаты представлены в последней диаграмме. Интересно, что вариации уровня в Smells Like Teen Spirit всегда больше, за исключением окон менее 0,18 секунды. Это как раз тот временной промежуток, где барабаны Fuk оказывают решающее влияние.
То, что изображено на пятой диаграмме, является хорошей кандидатурой на роль измерителя «динамического диапазона» музыки. Теперь предположим, что вместо того, чтобы пользоваться значениями RMS, мы будем иметь дело с некой единицей измерения воспринимаемой громкости, типа той, что упомянута в рекомендации ITU BS 1770. Это и есть тот самый «диапазон громкости». Основы того, как EBU определяет «диапазон громкости» находятся в документе EBU Tech 3342 и объясняются нами в главе «Измерение диапазона громкости по методике EBU».
Теперь остаётся только вопрос, нужно ли вообще использовать такой термин, как «динамический диапазон». Нет никакого официального определения для него, и это понятие можно спутать с динамическим диапазоном носителя записи, который показывает разницу между самым маленьким и самым большим уровнями, с которыми он может работать. Поэтому, в этой статье я не буду говорить о «динамическом диапазоне» музыки. Вместо этого, я буду использовать такие термины, как «RMS-вариабельность» или, в более широком смысле, «динамическая вариабельность». А термин «динамический диапазон» мы оставим для определения отношения сигнал/шум носителя записи. Я буду использовать термин «диапазон громкости» в строгом соответствии с документом EBU 3342 и термин «вариабельность громкости» во всех других случаях, вовлекающих понятие громкости вместо RMS.

Так уменьшился ли диапазон громкости?

А вот здесь нас уже ждут сюрпризы. Мы можем без всяких сомнений доказать, что «война за громкость» никак не уменьшила диапазон громкости, описанный в EBU 3342! И при этом никак не уменьшилась вариабельность уровня или громкости. Кажется, что музыка последнего десятилетия имеет такую же динамическую вариабельность, как и музыка из 70-х или 80-х. Давайте докажем это утверждение.
Как мы уже говорили, такие параметры, как RMS-уровень, интегрированная громкость, крест-фактор и пропорция сэмплов выше -1dBFS, демонстрируют нам захватывающую эволюцию - начиная с 90-х и где-то до 2005 года. Это эффект войны за громкость. И, вроде бы, результаты измерений диапазона громкости по методике EBU тоже должны следовать за этой тенденцией? Но, как мы видим на первой диаграмме, это не так. Мы видим, что диапазон громкости уменьшается с 1969 по 1980-й годы, и затем стабилизируется до 1991-го. После 1991-го он неожиданно возрастает и в последующие годы совершенно не демонстрирует никакой предсказуемой тенденции к уменьшению.
Как мы уже говорили, плотность высокоуровневых сэмплов резко возросла с начала 90-х. Это показывает, что стало использоваться больше компрессии и цифрового ограничения, в результате чего увеличился общий уровень той музыкальной коллекции, которую мы тут анализируем. Но связано ли использование цифровых ограничителей с уменьшением диапазона громкости? Давайте ответим на этот вопрос, сравнив значения, измеренные по методике EBU 3342, с плотностью высокоуровневых сэмплов. Графики представлены на второй диаграмме, и они нам очень ясно показывают, что ответ – нет. Увеличение «тяжести» ограничения, происходившее в процессе наращивания войны за громкость, в общем, никаким образом не уменьшало наблюдаемый диапазон громкости.
Нельзя сказать, что brickwall-ограничители не уменьшают диапазон громкости. Как мы увидим позже, они это успешно делают. Наблюдение заключается в том, что при анализе этих треков мы приходим к выводу, что война за громкость не привела к любому заметному сокращению диапазона громкости.
Однако, «диапазон громкости» по методике EBU 3342 измеряется с размером окна около 3 секунд. Давайте посмотрим, что произойдёт, если для анализа выбрать другой размер окна (блока). Для этого оценим стробированную RMS-вариабельность, основанную на размерах окна от 0,05 до 12,8 секунд. И, чтобы ещё больше конкретизировать результаты, модифицируем эту оценку так, чтобы она отражала влияние соответствующих временных окон. Этим путём мы сможем увидеть, уменьшала ли война за громкость вариабельность уровня при использовании любого окна измерения. Результаты экспериментов на третьей диаграмме. Мало того, что они подтверждают предыдущие исследования, но и идут немного далее, показывая, что война за громкость не имеет явно идентифицируемого влияния на вариабельность уровня. Это весьма решительное заключение: вопреки тому, что часто пишут в Интернете, война за громкость не вызвала никакого уменьшения вариабельности уровня. Современные песни такие же, как в 70-х или 80-х.
Чтобы подтвердить эти результаты, я попросила доктора Damien Tardieu (специалиста по обработке сигналов из института IRCAM) выполнить аналогичные исследования с абсолютно другим набором музыкальных композиций. Для этого, 20000 песен были случайно выбраны из каталога EMI. Правда, эти альбомы отбирались на основании даты копирайта, что несколько уменьшило надёжность этого анализа, поскольку старые треки могут иметь недавний копирайт или ремастерённые версии. Однако, нам нужна общая оценка этого глобального явления, поэтому можно позволить небольшую погрешность. Четвёртая и пятая диаграммы показывают эволюцию диапазона громкости, измеренного в соответствии с EBU 3342, и плотность высокоуровневых сэмплов. Мы видим, что диапазон громкости не уменьшился после 1990 года, причём, несмотря на то, что ограничение стало использоваться всё тяжелее и тяжелее. Нет никаких сомнений: из-за войны за громкость не возникло никакого явного уменьшения её диапазона, и brickwall-ограничители практически не повлияли на этот параметр.


Так в чём же противоречие?

Как мы уже говорили, количество компрессии/ограничения, используемого при мастеринге, резко выросло между 1990 и 2000 годами. Однако, хотя ограничение во многих случаях уменьшает диапазон громкости музыкальной композиции (глава «Диапазон громкости и ограничители»), мы не наблюдаем общее понижение этого параметра во всём музыкальном производстве. Так как же мы можем разрешить это очевидное противоречие?
Возможно, мастеринг-инженеры нашли разумные щадящие методики, применяя лишь столько ограничения, чтобы не привести к очевидной потере диапазона громкости. Как показано в главе «Диапазон громкости и ограничители», это теоретически возможно, поскольку RMS-вариабельность может иметь определённую «эластичность» по отношению к этой обработке. Но я не верю, что дело обстоит именно так. Существенное ограничение можно измерить или увидеть в характерных изменениях формы звуковой волны. Кроме того, его легко услышать: звуки приобретают специфическую атаку, становятся плотнее, жёстче и зачастую ярче. Прослушав очень большое количество треков из коллекции, использованной при написании этой статьи, вполне очевидно, что значительная часть недавних песен подверглась тяжёлой динамической обработке.
Остаётся только одно решение, о котором я могу думать: возможно, диапазон громкости музыки до мастеринга (или даже до микширования) также возрастал одновременно с тем, как возрастало количество компрессии и ограничения. Иными словами, исходный материал имел больше первичной вариабельности и больше эластичности к ограничению. Это подтверждается стилистическими изменениями, произошедшими в музыке во время войны за громкость. Начало 90-х (когда, в общем-то, и стартовала война за громкость), отмечено ростом популярности рэп-музыки и появлением большого количества исполнителей в этом жанре. Рэп типично имеет довольно разрежённую аранжировку с очень громкими большим и малым барабанами, которые значительно увеличивают вариабельность уровня в очень малых масштабах (0,1 секунды или около того). Примерно в то же самое время, родился такой стиль, как nu metal, объединивший в себе элементы фанка и рэпа. Также, во многих песнях изменился и подход к аранжировке, а именно, к переходам от одной секции к другой. Многие хиты 80-х использовали в качестве перехода достаточно гладкий брэк, сыгранный на том-томах, тогда как рэп-продюсеры 90-х предпочитали резкий «монтаж» звуков, увеличивающий вариабельность уровня в масштабах около 0,5 с.
Если воспользоваться большими масштабами, относящимися к структуре песен, можно выдвинуть идею, что современные треки используют контрасты уровня, чтобы очертить различные секции песни, тогда как старые композиции использовали для этого изменения тональности или гармонии. Сейчас часто можно услышать рэп или R&B, где куплеты настолько минималистичны, что там практически невозможно разобрать какие-то аккорды, но зато припевы похоронены под плотными вокальными гармониями и/или богатыми клавишными партиями, увеличивающими RMS-уровень. Хорошие примеры – «Lollipop» от Lil’Wayne и «Gangsta’s Paradise» от Coolio, или, до некоторой степени, «Single Ladies» от Beyonce. В таких композициях, вариации уровня используются для создания структуры песни.
Чтобы лучше иллюстрировать этот момент, давайте сравним две совершенно разные песни из разных эпох: Beatles «Come Together» (1969) и Lady Gaga «Telephone» (2010). На диаграмме показан анализ RMS для обеих песен. Белые линии отображают структурные границы песен, определяемые слухом. Более светлые квадраты указывают на части с отличающимся от других фрагментов уровнем, а более тёмные указывают на части с похожими уровнями. Это сравнение – показательный пример: в Telephone больше крупномасштабных изменений уровня и они сильно синхронизированы со структурой песни. Этот пример помогает объяснить идею, что в современной музыке первичная крупномасштабная RMS-вариабельность может иметь больший размах.


Может ли музыка, обработанная ограничителями, иметь музыкальную динамику?

Определённо. Но путь, которым выражается музыкальная динамика, может измениться. Представьте, что Вы слушаете музыку. И захотели сделать её громче. Вы просто вращаете регулятор уровня и поднимаете его значение. Заодно Вы увеличиваете RMS и пиковый уровень, но это никак не затрагивает крест-фактор. Назовём это термином «первая парадигма громкости». Теперь предположим, что есть регион в Pro Tools, пики которого достигают 0 dBFS. Вы не можете поднять уровень традиционным способом, поскольку в результате возникнут искажения. Но мы можем вставить туда ограничитель и понизить его порог. Благодаря этому, Вы сможете поднять RMS, но при этом пиковый уровень останется стабильным. А вот крест-фактор уже будет уменьшен. Назовём это «вторая парадигма громкости».
Когда Вагнер сочинял оркестровое крещендо, то использовал первую парадигму, добавляя больше инструментов. Но при помощи ограничителя можно сделать крещендо на основе второй парадигмы. Результаты обоих подходов показаны на иллюстрации. Mike Oldfield (слева) использовал первую парадигму в конце первой части Tubular Bells, а Trent Reznor (справа) использовал вторую в «Closer».
Чтобы получить более точное представление о различиях между парадигмами, давайте возьмём шесть крещендо из шести различных треков. Трое из них будут представлять первую парадигму и трое – вторую. Теперь проанализируем их RMS, пиковый уровень и крест-фактор. Результаты показаны на нижней иллюстрации. Левый график показывает все крещендо, основанные на увеличении RMS и пикового уровня. Средний график показывает крещендо на основе второй парадигмы, когда пиковый уровень остаётся неизменным. Правый график показывает систематическое уменьшение крест-фактора для второй тройки и демонстрирует, что в первой тройке нет никакой связи между ним и громкостью.
Можно сказать, что крещендо, использующие вторую парадигму, не являются «чисто» динамическими событиями: чем громче становится музыка, тем сильнее ограничитель влияет на сигнал и тем сильнее изменяется оригинальный тембр. Но разве не это же верно и для традиционного крещендо? Исполняя крещендо на одной скрипичной ноте, мы не только изменяем уровень, но и тембр. А многие оркестровые крещендо вводят дополнительные инструменты в процессе своего развития. В результате, комбинация этих двух факторов вызывает более глубокие изменения тембра, нежели любой brickwall-ограничитель.


Случай Death Magnetic

Не столь давний альбом группы Metallica стал очень сильным раздражителем для противников текущей моды в мастеринге. Насколько я могу сказать, основная проблема Death Magnetic – это конфликт между звучанием гитар и тем способом мастеринга, которым обрабатывался этот альбом. Очень агрессивный мастеринг просто не подходит к «производственному» стилю этой группы, более характерному для 80-х и опирающемуся на плотные искажённые гитары, заполняющие собой большую часть звукового пространства. Эта музыка и так имеет достаточно стабильный уровень, а в этом случае её крест-фактор был понижен до очень малых значений. В результате, её звучание воспринимается на слух как очень «компактное» и статичное на протяжении всего времени.
P.S. Под «компактностью» здесь подразумевается такое звучание, когда всё играет очень близко к слушателю, чуть ли не прямо ему в ухо. Подобный тип звука также называется in-your-face, и в контексте данной статьи рассматривается его крайне гипертрофированный вариант.
Первая диаграмма показывает распределение крест-фактора для 4500 песен и значения этого параметра для альбомов Master Of Puppets и Death Magnetic. Анализ других альбомов Metallica, таких, как ...And Justice For All или Black, показывает, что значения их крест-фактора примерно такие же, как и в Master Of Puppets. Мы видим, что крест-фактор Death Magnetic не только значительно ниже, чем у «нормальных» альбомов Metallica, но и чрезвычайно низок по сравнению с любой другой музыкой.
Такие значения крест-фактора сопоставимы с тем, что можно обнаружить в треках My Beautiful Dark Twisted Fantasy от Kanye West или Get Rich Or Die Tryin’ от 50 Cent. Эта стилистически громкая музыка базируется на сильных перкуссионных элементах, артикулирующих текст и лучше сочетающихся с низкими значениями крест-фактора, чем постоянно гудящие гитары Metallica. Они также сопоставимы с треками из Oracular Spectacular или Congratulations от MGMT. Эти два альбома имеют настолько специфическое звучание, что постоянное использование второй парадигмы громкости и наличие артефактов динамической компрессии для них не представляют совершенно никакой проблемы. Но «классический» звук Metallica просто не сочетается с такими методами обработки.
Вторая диаграмма показывает RMS-вариабельность Death Magnetic по сравнению с их же альбомом Master Of Puppets и двумя другими альбомами с низким крест-фактором: My Beautiful Dark Twisted Fantasy и Congratulations. И вот здесь начинаются реальные проблемы. Из-за низкого крест-фактора он звучит не только очень «компактно», но и очень статично (малая RMS-вариабельность). Третья диаграмма подводит итоги, показывая, насколько необычна эта комбинация низкого крест-фактора и уменьшенного диапазона громкости. Это можно сравнить, разве что, не более чем с тремя песнями MGMT. Даже невероятно компрессированный My Beautiful Dark Twisted Fantasy не может конкурировать с ним, сохраняя в себе больше контраста, чем Death Magnetic. И, хотя низкая вариабельность его RMS примерно сравнима с музыкой группы Dagoba (исполняет индастриал-метал и специализируется на эффектно громком, компактном и «жирном» звуке), Death Magnetic компрессирован ещё более свирепо. Но, по моему мнению, Вы вряд ли захотите, чтобы традиционный хеви-метал звучал более «компактно», чем преднамеренно экстремальный industrial/death metal. Хотя, если Вы стремитесь именно к этому, то должны сами изменить свою музыку, создав в ней больше контраста. Только так Вы сможете позволить себе такую сильную компрессию и даже получить от неё какие-то дополнительные выгоды.


Так представляет ли проблему война за громкость?

Не составит труда найти массу людей, публикаций в прессе и Интернете, единодушно обвиняющих войну за громкость в том, что она разрушает музыку. Многие связывают её с уменьшением «динамического диапазона», хотя никто обычно не объясняет, каким он должен быть. Однако, как мы узнали в этой статье, война за громкость фактически не привела к уменьшению такого параметра, как диапазон громкости, определённый по методике EBU 3342 (по сути дела, это довольно близко к тому, что люди как раз и подразумевают под словами «динамический диапазон»). При этом, невозможно установить никакого уменьшения динамической вариабельности ни в каком масштабе.
Так что ж за проблема с войной за громкость? Очевидно, ограничение делает что-то «неправильное» с сигналом, иначе б люди не жаловались – даже при том, что они указывают на не совсем корректный критерий, описывающий его параметры.
Чтобы правильно ответить на этот вопрос, попробуем представить, что звук – это фотография, и сделаем анализ этого «фото» по такому параметру, как распределение яркостей. У Фотошопа это можно найти в диалоговом окне Levels. Чтобы сделать оценку, алгоритм проверяет все пиксели в картинке и затем сортирует в зависимости от яркости. В результате, получается график распределения, показывающий, включает ли изображение преимущественно светлые, средние и тёмные области, и их относительные пропорции. Тот же самый процесс можно провернуть и со звуковыми файлами: мы проверяем все сэмплы в песне и сортируем их по абсолютному уровню. Как показано на иллюстрации, кривая распределения может рассказать много интересного.
Посмотрим на кривую распределения для песен, выпущенных в 2007 году (красная кривая). Их пики имеют более высокий уровень, чем в песнях 1967 года (синяя кривая). Очевидно, что более новые песни в среднем намного громче. Следующим делом, посмотрим на ширину обеих кривых: они сравнимы, и это означает, что кое-какие вещи, близкие к динамической вариабельности, остались неизменными между 1967 и 2007 годами. Теперь посмотрим на всплеск в правой стороне красной кривой. Он показывает, что песни этого года имеют ненормально высокую плотность высокоуровневых сэмплов: кривая перестаёт следовать за «нормальным» распределением Гаусса в зоне высоких уровней. Это результат воздействия brickwall-ограничителей.
Продолжим сравнивать звук и изображение. Представим, будто последние 20 лет все картинки в журналах и книгах становились всё ярче и ярче. В них всё ещё есть глубокий чёрный цвет, контраст не повреждён, но при этом все картинки выглядят очень яркими. Подобные вещи иллюстрируют нам две фотографии Тауэра. Можно подумать, будто всё в наши дни прямо таки «сияет», хотя здравый смысл предполагает, что есть какие-то вещи, которые не могут быть настолько сияющими ни при каких условиях. Это тем более верно в случае со звуком, для которого «яркость» означает не только высокую плотность засвеченных пикселей. Это также означает уменьшенный крест-фактор, изменённую огибающую, использование второй парадигмы громкости и, в особо тяжёлых случаях, искажение. Хотя, в общем-то, эти характеристики не обязательно означают что-то плохое, но всё-таки здравый смысл нам подсказывает, что такого не должно быть буквально в каждой записи.



В конце концов, это всё – вопрос стиля. Уменьшенный крест-фактор создаёт «компактность» в звучании; и на странице MaxxBCL компания Waves описывает это как «тяжёлый in-your-face сигнал, что сотрясает дом». Подобные вещи могут подойти к Вашим песням, а может и нет. Или, может быть, Вы нарочно захотите оставить «мягкость» в своих треках. Хотя, если Вы делаете тяжёлую техно-музыку, стремление к «компактности» может быть хорошей идеей. Также, описанные ранее две парадигмы громкости обладают весьма отличающимися «ароматами», и, в зависимости от материала и художественных целей, можно предпочесть тот или иной вариант. Хотите, чтобы каждая громкая атака изменялась компрессором/ограничителем? В одних случаях это пойдёт на пользу, в других – во вред. Или, может Вы хотите просто уменьшить динамический диапазон музыки и не затронуть более ничего? В таком случае, лучше активнее пользоваться автоматизацией уровня, нежели ограничением, поскольку, как мы уже говорили ранее, диапазон громкости имеет определённую сопротивляемость к процессу ограничения.
Важно понимать, что делаете, и как это соотносится с тем звуком, к которому Вы стремитесь. И если Вам нравится компрессия, но Вы боитесь, что Боб Дилан не одобрит Ваш звук, потому что он «слишком современный» и «слишком статичный», то не волнуйтесь. Скорее всего, он просто не слушает такую музыку.

Измерение диапазона громкости по методике EBU
В декабре 2010 года EBU выпустила документ Tech 3342, являющийся частью технической рекомендации EBU R128. Он даёт практическое руководство по поводу измерения «диапазона громкости», параметра, у которого есть хорошие шансы стать [а может уже и стал] стандартом для измерения динамической вариабельности аудио. Поэтому, будет нелишним потратить несколько минут, чтобы в деталях выяснить, что же скрывается под словами «K-взвешенная RMS-вариабельность со стробированием и временным окном 3 секунды».
Итак, во временном окне продолжительностью три секунды выборка осуществляется каждую секунду. Это означает, что измерение относится к динамическим событиям продолжительностью более трёх секунд. [Здесь не совсем понятно: скорее всего, подразумевается интегрированное значение всех замеров в данном окне]. С одной стороны, такое измерение не будет учитывать ударные звуки. С другой стороны, вариации громкости, связанные со структурными изменениями, тоже не всегда будут чётко видны, поскольку их могут замаскировать вариации, происходящие в более мелких масштабах. Впрочем, именно такой компромисс был выбран EBU.
Вместо того, чтобы наблюдать за значениями RMS, мы измеряем значения громкости по методике, описанной в ITU-R BS 1770. Процесс измерения не очень сложен: берём оригинальный файл, эквализуем его и затем измеряем RMS. Как Вы видите на рисунке, фильтр довольно прост. Может стать неожиданностью, что ITU пользуется столь простым инструментом, чтобы вычислить различие между RMS и громкостью, но, как они заявляют, «для типичного монофонического вещательного материала, основанное на энергии простое измерение громкости сравнимо с более сложными методиками измерения, включающими детальные перцепционные модели». ITU называет это «К-взвешивание» и даёт «LKFS» в качестве единицы громкости [громкость, К-взвешенная, относительно полной цифровой шкалы]. Таким образом, мы имеем последовательность измеренных значений, соответствующих «кратковременной громкости», описанной в EBU 3341. Впрочем, EBU вместо LKFS рекомендует использовать термин LUFS [единицы громкости, относительно полной цифровой шкалы].



Теперь, последовательность измеренных значений подвергается такому процессу, как стробирование. Используется два последовательных процесса. Первый называется «абсолютным стробированием», который исключает из результатов измерения все значения ниже -70LKFS. Сюда попадают паузы, фоновый шум и прочие очень тихие звуки, могущие исказить результаты и негативно повлиять на дальнейшую обработку. Второй процесс называется «относительным стробированием». После того, как очень тихие части сигнала были убраны, измеряется средняя громкость. Теперь исключаются все значения, которые ниже средней громкости на 20dB. К примеру, если после абсолютного стробирования средняя громкость получилась -15LKFS, то все значения ниже -35LKFS будут исключены из результатов измерения. Относительное стробирование нужно для того, чтобы устранить «нетипичные» части сигнала. И вот теперь, после всех этих манипуляций, мы и получаем «K-взвешенную RMS-вариабельность со стробированием и временным окном 3 секунды».
И вот теперь мы подходим к ключевому моменту, и именно – измерению диапазона громкости звуковой программы. Это долговременная интегрированная громкость за весь хронометраж, вычисленная статистическими методами на основании вышеописанных измерений. Этот параметр состоит из одного числа (в LUFS), который показывает, насколько громка программа в среднем. Для относительных измерений используются единицы громкости (LU), где 1 LU эквивалентно 1 dB.

Диапазон громкости и ограничение
Так уменьшают ли ограничители диапазон громкости или нет? И да, и нет. Фактически, эта проблема намного сложнее, чем выглядит на первый взгляд. Представьте, что у Вас есть нормализованный аудиофайл и Вы не можете уже увеличить его уровень, не вызвав искажений. Но используя на таком материале компрессор или ограничитель, Вы можете поднять уровень, одновременно увеличив значение RMS. Это также расширяет динамический диапазон носителя: к примеру, в 16-битном файле это 96 dB, но Вы можете его как бы растянуть до 100 или 105 dB. На верхней диаграмме этот дополнительно доступный динамический диапазон отмечен серым прямоугольником. С этой точки зрения, лимитер не только не уменьшает диапазон громкости, но и даже увеличивает его.
Идея относительно того, что компрессор или ограничитель могут расширить доступный динамический диапазон, конечно интересна, но уже далеко не нова. Много десятилетий назад, звукоинженеры вставляли компрессор между микрофоном и рекордером с целью увеличить динамический диапазон носителя записи и уменьшить проблемы с низким отношением сигнал/шум.
Диаграмма показывает анализ RMS трёх файлов: оригинальный нормализованный, ограниченный с порогом -6 dB и с порогом -12 dB. Для начала, давайте сфокусируемся на различии между оригиналом и вторым файлом (-6 dB). Если смотреть со стороны низких уровней, то второй файл даёт 6 dB прироста RMS. Но, поскольку высокоуровневые события были ограничены, то прирост RMS для них только 5 dB. Таким образом, уменьшение RMS-вариабельности составляет всего 1 dB. Теперь давайте установим порог на -12 dB: низкие уровни поднимутся ещё на 6 dB, но высокие – только на 3 dB. RMS-вариабельность уменьшится ещё на 3 dB, составив в общем 4 dB. С этой точки зрения, лимитер конечно же уменьшает диапазон громкости – в этом случае, величина уменьшения составляет примерно 4 LU.
Однако, 1 dB потери RMS-вариабельности – это очень маленькая величина. Порог, ниже которого лимитер начнёт реально вмешиваться в сигнал, зависит от типа музыки. Вторая диаграмма показывает RMS-вариабельность в различных масштабах для трёх музыкальных композиций. Обратите внимание, что поп/рок музыка имеет RMS-вариабельность более устойчивую к воздействию ограничения, нежели две другие композиции, представляющие оперу и джаз. Это особенно заметно в более мелких временных масштабах: в данном случае, порог должен быть установлен как минимум на -6 dB, чтобы получить заметное уменьшение RMS-вариабельности. Это может быть связано с наличием громкого и заметного большого барабана, что указывает нам на то, что чем больше у музыки первичная RMS-вариабельность, тем сильнее она сопротивляется ограничению. Отсюда следует, что высокую вариабельность не так легко уменьшить. Эта первичная «упругость» - ещё один аргумент к утверждению, что ограничение автоматически не означает уменьшение диапазона громкости, особенно если первичный материал обладает очень высокой вариабельностью уровня.



Ремастеринг и ограничение
Многие альбомы, выпущенные в до-цифровую эпоху, подверглись ремастерингу и были выпущены в новых форматах. В качестве примера, давайте рассмотрим дискографию группы Cure. Начиная с 2004 года, все их альбомы, выпущенные до 1990 года, были ремастерены и изданы с дополнительными материалами. Первая диаграмма сравнивает уровни RMS оригинальных и ремастерённых версий. «Deluxe»-версии реально громче оригиналов, и их RMS в среднем на 5 dB выше. Тем не менее, они тише альбомов, выпущенных после 1995 года. Здесь можно заметить, как недавние альбомы Cure стали жертвой войны за громкость: между Wish и Wild Mood Swings мы видим внезапный скачок на 6 dB.
Давайте более пристально рассмотрим альбом Pornography, первоначально выпущенный в 1982 году. На рисунке Вы видите сигналограммы оригинальной и ремастерённой версий. Очевидно, что ремастер 2005 года подвергся тяжёлому цифровому brickwall-ограничению. Это хорошо или плохо? Лично мне нравится слушать обе версии. С более объективной точки зрения, давайте сфокусируемся на выделенном фрагменте сигналограммы, который относится к окончанию «A Strange Day». В оригинале, как раз перед короткой паузой, мы видим небольшое декрещендо, за которым следует короткое крещендо. Наши читатели, которые знают эту песню, согласятся, что эти вариации громкости очень согласуются с музыкальным контентом (кульминационный момент песни и затем пауза). Как мы видим, в оригинале использована первая парадигма громкости. Теперь, давайте посмотрим на ремастерённую версию. Вариации громкости теперь имеют другую природу и, возможно, это не очень хорошо. По моему мнению, это может быть главной опасностью ремастеринга альбомов, выпущенных до-цифровую эпоху: по неосторожности можно увеличить плотность высокоуровневых сэмплов, уменьшить крест-фактор и превратить первую парадигму громкости во вторую.




Альбомы знаменитых групп, как например Beatles или Pink Floyd, зачастую неоднократно подвергаются ремастерингу, так что, бывает довольно трудно найти референсную версию для любого из них. Для примера, возьмём Dark Side Of The Moon. Третья диаграмма показывает плотность высокоуровневых сэмплов для пяти его релизов. Здесь есть две версии с названием Original Master Recording, но даже они очень сильно отличаются. Скорее всего, потому что первая – это пластинка, а вторая – компакт-диск.
В контексте войны за громкость в голову приходит один вопрос: а насколько уважительно отнеслись эти ремастерённые версии к оригиналу 1973 года? Диаграмма даёт нам некоторые ответы. Версии 1981, 1989 и 1992 годов показывают общее количество ограничения, вполне сравнимое с альбомами 1973 года (об этом мы писали в начале статьи). Версия 2003 года уже более проблематична, поскольку количество ограничения здесь уже сравнимо с 1995 годом. С версией 2007 года ситуация пока не очень ясна: «Eclipse» либо ограничена, либо сильно скомпрессирована, но вот другие треки показывают очень умеренную плотность высокоуровневых сэмплов.
Послушав каждую версию и изучив сигналограммы, мы усовершенствуем результаты анализа. Версии 1981, 1989 и 1992 годов звучат очень «по пинк-флойдовски», и используют исключительно первую парадигму громкости. Напротив, релиз 2003 года не очень убедителен в этом отношении. Этот ремастеринг был сделан в формате 5.1 и его правый и левый каналы подверглись тяжёлому ограничению, с преобладанием второй парадигмы громкости. Он звучит как Pink Floyd на FM-радио. Даже то, что окружающие каналы не расплющены, совершенно не компенсирует это. Релиз 2007 года – более интересный случай. На мой взгляд, он обработан очень элегантно. Хотя, к примеру, «Eclipse» звучит громко – намного громче оригинала. С другой стороны, «Eclipse», как финал альбома, разве не должна звучать громко? Другие же песни были ремастерены уже по-другому. К тому же, в «Eclipse» нигде не используется второй парадигмы громкости, хотя, взглянув на сигналограмму, мы ясно видим, что она находится буквально на пределе между ними. Хорошо, что правообладатели издеваются не над всеми легендарными альбомами: релиз 2007 года Dark Side Of The Moon демонстрирует нам настоящее уважение и понимание этой музыки, создавая хороший компромисс между «ароматом» оригинального альбома и современными вкусами.

Перевод Бережной Вячеслав

Комментариев нет:

Отправить комментарий