Что такое нормализация звука
Что такое нормализация звука и как ее применять?
Упомяните слово «нормализация» в группе, ориентированной на звукозапись и обработку, и некоторые «эксперты» скажут, что нормализация — это любительский путь и его никогда не нужно делать. Другие же вам скажут, что это полезная функция. Так кто же прав? Давайте разрушим мифы, которые окружают данную терминологию.
Что такое это такое?
Существует два типа нормализации — пиковая и средняя. Пиковая определяет максимальный (пиковый) уровень аудиофайла, а затем повышает (или понижает) его до целевого. Этот целевой пиковый уровень часто составляет 0 дБFS (максимально доступное значение), но может иметь другой уровень, например, на 6 дБ ниже максимального значения. Средняя нормализация определяет средний уровень аудиофайла и аналогичным образом повышает или понижает его до целевого.
В чем разница между средним и пиковым уровнями?
Компания Shure провела замечательную аналогию: средняя высота Гималайских гор составляет 5400м, но пик высоты Эвереста — 8848м. Измерители уровня громкости представляют средний уровень сигнала, поэтому некоторые ударные звуки часто не регистрируют такое высокое показание измерителя, даже если сигнал искажается.
Наши уши склонны воспринимать на основе среднего уровня, а не его пикового. Например, ударный звук с быстрым релизом может иметь высокие пики, но низкий средний уровень, поэтом в целом он звучит не так громко. С другой стороны, искаженный аккорд на гитаре — который все время увеличивается в громкости — может иметь тот же пиковый уровень, что и ударный звук, но из-за его среднего уровня он будет звучать намного громче. Многие DAW предлагают измерения, которые показывают как пиковые, так и средние уровни.
Нормализация ухудшает звук?
Те, кто говорит, что нормализация может ухудшить звук, то да, она действительно может это сделать, если вы создадите машину времени и вернетесь к середине 1980-х, а затем выполните обработку Sound Designer на Mac Plus. В те времена, когда существовали 16-битные звуковые движки, практически любая обработка могла теоретически вызвать ухудшение, поскольку некоторые операции округляли бы цифровые числа, представляющие звук. Если вы сложили несколько обработок, и часть из них была с ошибками — то в сумме звук будет с проблемами. С современными звуковыми движками высокого разрешения (например, 32-битной плавающей запятой) это просто не проблема. Математика легко справляется с огромными числами.
Разве нормализация не влияет на соотношение сигнал/шум аудиофайла?
Посекундное балансирование голоса — это полезно?
Вы не всегда нормализуете звук до 0db. Можно устанавливать баланс до целевого уровня. Часто в вокале некоторые фразы поются тише или выше по уровню. Выделяя их и нормализуя до приемлемого уровня, вы сможете создать более согласованную и равномерную партию (и сможете исключать/ослабить компрессор). Конечно, вокал обладает естественной динамикой, которую вы не хотите стерилизовать — так что используйте свои уши. Регулируйте уровни только в тех случаях, когда они нуждаются в настройке.
Важно помнить, что нормализация — это инструмент. Как и любой инструмент, результаты, полученные с помощью этого инструмента, зависят от того, кто и как его использует. Не бойтесь нормализации, но и не нажимайте эту кнопку «нормализовать» на каждом источнике. Как упоминалось в начале, обе стороны правы — так что выбирайте правильный инструмент для правильной работы, и у вас все будет хорошо.
Как пользоваться Audacity. Нормализация звука в популярном аудиоредакторе
Всем привет! Нормализация звука не проблема для того, кто умеет пользоваться Audacity даже на самом начальном уровне.
Начнем с определения.
Нормализовать звук — это, по простому говоря, так обработать его в аудиоредакторе, чтобы было приятно слушать, а именно:
Сразу скажу, что если вы уповаете на свою суперсовременную дорогую профессиональную видеокамеру, то это напрасно. Шумы-то она запишет даже лучше чем смартфон. Так что на 100% «вытянуть» звук первоклассным «железом» не получится.
Профессионалы пользуются для этого звуковыми редакторами. Берут отдельно аудиодорожку и правят ее. В этом посте я научу вас, как пользоваться Audacity для нормализации звука.
Почему именно Audacity? Потому, что это:
Из этой статьи вы узнаете:
Как извлечь звук из видео в отдельный звуковой файл
Способов — масса. Чтобы не загромождать пост второстепенными подробностями, вкратце расскажу всего про три. Выберете удобный для себя.
Первые два пункта подробно объяснять не стоит. Там все совершенно несложно, но если будут проблемы – пишите, объясню.
Вот на видеоредакторе остановлюсь поподробнее. В смысле как извлечь звук из видео с его помощью. Видеоредакторов тоже очень много. Я пользуюсь одним из самых популярных – Sony Vegas.
Копируем отснятое видео из смартфона на компьютер.
Через меню Файл – Открыть открываем видеофайл.
Теперь кликаем по кнопке Просчитать как.
и выбираем формат сохраняемого файла mp3. Нажимаем на Custom…
и выбираем параметры сохранения. Рекомендую выбрать Моно, битрейт 128 kbps и частоту 44 100 Hz.
Выбираем папку сохранения и желаемое имя сохраняемого mp3 файла.
Все аудиодорожку мы отдельно сохранили и теперь начнем нормализовать звук. Я распишу все пошагово.
Шаг 1. Первичное применение плагина Hard Limiter
На записанном звуке могут оказаться пики-выбросы по громкости. Если их не уменьшить, то они здорово раздражают или могут даже оглушать. Это может быть и кашель, и внезапно громко передвинутый стул, сигнал рядом проезжающей машины и так далее. Поэтому:
Кликаем по области управления свойствами дорожки левой кнопкой мышки и тем самым выделяем всю дорожку
Затем идем в меню Эффекты-Hard Limiter… и ставим вот такие параметры
Шаг 2. Нормализация звука
Жмем ОК. Смотрим результат.
Шаг 3. Обработка аудиофайла плагином Компрессор…
Продолжаем пользоваться Audacity для нормализации звука и на этом шаге освоим плагин Компрессор… Обращаю ваше внимание, что обрабатывать дорожку нужно именно в таком порядке пошагово, не путая и не перескакивая. Для чего нужен Компрессор…? Компрессор усредняет, уменьшает разницу между самыми тихими и самыми громкими участками. Бывает, человек говорит в микрофон то громче, то тише и при слишком большой разнице слушать такую запись некомфортно. После обработки компрессором, громкость голоса становится более ровной, без скачков.
Итак идем в Эффекты-Компрессор… Ставим вот такие же параметры
и жмем ОК. Радуемся результату.
Шаг 4. Финишная обработка плагином Hard Limiter…
Вот вобщем и всё. В большинстве случаев этих 4 шагов достаточно. Теперь рассмотрим более сложные случаи, а именно:
Ручное выравнивание громкости отдельных участков аудиодорожки
Для этого применим простой плагин Усиление сигнала. Он действует как ручка громкости. На этом этапе применение его оправдано, так как звук уже прогнан через Нормировку сигнала… и Компрессор… и в целом представляет собой выровненную без скачков диаграмму. Только, как видите она глобально разная на больших участках. С таким «раскладом» предыдущие плагины не всегда хорошо справляются и поэтому вот сейчас исправим это руками. Замечу, что такая ситуация бывает нечасто.
Итак, выделяем ту часть звуковой дорожки, где уровень сигнала явно ниже. Идем в меню Эффекты-Усиление сигнала… и подбором уровня усиления добиваемся выравнивания фрагментов аудиодорожки по громкости. Посмотрите на видео, как это происходит.
Как убрать шум из записи
Обратите внимание, что сейчас я буду объяснять как бороться именно с непрерывным фоновым шумом. Если вдруг во время непосредственно записи кто-то кашлянул, чихнул, что-то упало – это все не фоновый шум и если есть желание его убрать, то делать это нужно другими способами. А сейчас мы будем убирать именно фоновый шум. Итак, чтобы убрать шум из аудио, нужно найти на аудиодорожке участок тишины, выделить его и внимательно прослушать. Желательно, чтобы он содержал только ровный фоновый шум, без щелчков и других «выпадающих» или выделяющихся кусочков. Чем лучше мы подберем такой фрагмент, тем качественнее программа справится с зачисткой всей аудиодорожки.
Для этого визуально выбираем на диаграмме участок с нулевой или около того амплитудой и выделяем его мышью. Кликаем на кнопку Play в панели кнопок Audacity и внимательно слушаем. Если на фоновом шуме есть другие единичные звуки, то стараемся найти и выделить фрагмент без них.
Найдя наилучший фрагмент, выделяем его. Идем в меню Эффекты-Удаление шума-Создать модель шума.
Затем выделяем всю дорожку. Идем в меню Эффекты-Удаление шума. Оставляем вот эти параметры
Единственный параметр, с которым можно поэкспериментировать, это Подавление шума. Самое первое поле. Советую оставаться в пределах 12-24 db. Если сделать ниже 12, то шум может снизиться совсем незначительно. Если сделать выше 24, то могут появиться искажения на оставшихся участках со звуком.
Смотрим видео, где я все это делаю:
Вот и всё. Аудиодорожка нормализована, осталось сохранить ее в виде файла.
Сохранение обработанной Audacity дорожки в отдельный аудиофайл
Делается это через меню Файл-Экспортировать… Обращаю ваше внимание, что через меню Файл-Сохранить проект… вы сохраните аудиозапись именно в формате Audacity и только. Для того, чтобы сохранить в формате mp3 или wav нужно пользоваться именно Экспортировать… Далее все просто. Выбираете желаемый тип файла. Если необходимо – кликаете Параметры… и задаете нужные параметры. Например, если вы делаете экспорт в mp3, то вы сможете выбрать через Параметры качество звука. Рекомендую не делать его ниже 80 кбит/с и выше 128 кбит/с. Это для голоса, конечно. Если вы писали музыку и вам необходимо максимальное качество звучание, то можете поставить даже 320 кбит/с. Имейте только в виду, что чем выше битрейд (это качество звука), тем большего размера будет получаться итоговый файл.
Итак, из этого поста вы узнали как пользоваться Audacity в части нормализации звука.
Дополнено в декабре 2018 г. — Эта статья написана в 2014 году. За прошедшие 5 лет, к концу 2018го, накопился опыт, выявились тонкости и приемы, которые:
Нормализация громкости
Меня всегда интересовало, существуют ли какие-то критерии правильной нормализации громкости аудиодорожек. Ну, что обычно подразумевается под нормализацией, так сказать, в быту? Простой пересчёт пиков до отметки в 0 дБ. Однако, результат чаще всего неудовлетворителен — динамический диапазон, т. е., разница между самым громким и самым тихим звуками вроде бы сохраняется (хотя ещё вопрос, так ли это в действительности при простом пересчёте), но сама по себе общая громкость может не повыситься совсем или повыситься незначительно из-за того, что самые громкие звуки, которых может быть один-два на всю запись, уже нормализованы и их повышать уже некуда, а остальной материал так и остался где-то снизу, и слышно его всё так же плохо.
Понятно, что простая линейная нормализация не подходит и нужна какая-то динамическая (в сочетании с компрессией), причём желательно основанная на каких-то объективных критериях. Последнее время я увлёкся изучением возможностей совершенно прекрасного консольного медиаконвертера ffmpeg, где я обнаружил аудиоплагин loudnorm, как раз занимающийся нормализацией аудиосигнала по стандарту Европейского вещательного союза EBU R128.
Какими основными критериями оперирует loudnorm?
Что касается диапазона громкости (Loudness Range, LRA), то здесь нужно действовать по ситуации. Я нашёл на сайте AudioKinetic рекомендации по максимальному уровню LRA, там даны примерные значения для разных условий:
Домашний кинотеатр — 20 единиц
Гостиная — 18 единиц
Кухня — 15 единиц
Гостиная (поздний вечер) — 9 единиц
Общественный транспорт, мобильное устройство — 6 единиц
Чем шумнее вокруг, тем меньший динамический диапазон нужно выставлять, чтобы расслышать все звуки в записи. Чем больше и громче динамики, тем больший LRA возможен. В общем, однозначного критерия здесь быть не может, хотя некоторые значения мы выяснили.
Перейдём, наконец, к практике. Имеется DVD-Video с полукустарно записанным концертом классической музыки, имеющий стандартные проблемы: громкие аплодисменты, тихая музыка и речь ведущей концерта. Графически аудиодорожка выглядит так:
После окончания анализа получаем следующие данные:
После окончания обработки получаем следующую картину:
Видно, что общая громкость стала на 6,1 выше, несмотря на то, что максимальный пик снизился на единицу, в соответствии с рекомендованным значением. Динамический диапазон стал уже на 7,1 — это привело к более ровному звучанию без резких перепадов громкости, но и сохранило динамику.
Результат обработки в графическом виде:
Субъективно могу сказать, что стало гораздо лучше. Приведу отрывки из записи, где есть большой перепад громкости.
UPD: Всё же, нужно задавать динамический диапазон вручную, чтобы автомат не зажимал его слишком сильно. В итоге, более-менее универсальные параметры получились следующие:
Если LRA уже узкий, то он обратно не разжимается, насколько я успел заметить.
Что такое нормализация звука и почему она вам необходима
Нормализация звука – это выравнивание максимального уровня громкости аудиофайлов до заданных пределов. Для грамотной работы необходимо знать, в каких ситуациях требуется это действие, а также, какую программу для выравнивания уровня звука стоит использовать новичкам. Ниже в подробностях разберем оба вопроса и приложим подробное руководство к действию.
Когда и как помогает выравнивание: немного матчасти
Разберём основные случаи, в которых требуется нормализация аудио.
1. Сглаживание качества звука и настроек микрофона. Это актуально при записи аудио в домашних условиях. Профессиональные чувствительные микрофоны улавливают сторонние вибрации, что в сочетании с высоким уровнем громкости (выставляется в настройках устройства) приводит к «эховому» сопровождению звучания.
Рекомендация по выравниванию: нормализовать звук по нулевому диапазону. Максимальная громкость исходного материала может колебаться на уровне от +15 db до +20 db, это признак завышенных неправильных настроек. Максимальный уровень спокойного звука близится к 0 db. Чтобы сгладить эффект эха, рекомендуем нормализовать звуковую дорожку в пределах от 0 db до +5 db.
2. Сглаживание шумов. Запись в домашних условиях – это «соседство» с внешними шумами, которые неизбежно попадают на дорожку. Инструмент «шумоподавление» поможет лишь частично, поскольку:
Рекомендация: использовать шумоподавление максимум один раз, после чего нормализовать звук. Вместе нулевого предела достаточно сбросить 5-10 db от текущего уровня максимальной громкости. Результат: приемлемое подавление шумов с сохранением качества дорожки.
3. Выравнивание громкости. При любительском (порой даже профессиональном) озвучании англоязычных видео встречается ситуация: русский голос в десятки раз тише оригинальной речи. Если все оставить, как есть, зрители не расслышат ни единого слова.
Простой совет по нормализации аудио: увеличить максимальный уровень русской речи. Второй вариант – ручное повышение громкости на особо тихих участках.
Инструменты по нормализации доступны каждому, и пользоваться ими можно в автоматическом режиме. Мы возьмем для примера программу АудиоМАСТЕР – простой софт для обработки аудиофайлов. Узнать больше о редакторе АудиоМАСТЕР и скачать его вы сможете, пройдя по этой ссылке https://audiomaster.su
После скачивания воспользуйтесь этой пошаговой инструкцией по оптимизации звука.
Как нормализовать звуковую дорожку в аудиоредакторе
Установка скачанной программы займет 2-3 минуты, затем откройте ее через ярлык на вашем рабочем столе.
В стартовом меню выберите опцию «Открыть файл» и найдите аудиозапись. Композиция загрузится в редактор, став доступной для обработки, редактирования и нормализации.
Наша задача – сгладить звуковые скачки с резкими перепадами громкости. Выбираем функцию «Выровнять громкость» на панели инструментов слева. Программа запустит обработку аудиофайла, чем короче/длиннее дорожка, тем больше/меньше времени занимает действие.
Аудиомастер позволяет быстро сглаживать скачки на отдельных участках дорожки. Наводим курсор на начало отрезка, зажимаем левую кнопку мыши и выделяем фрагмент, который визуально станет черным. Выбираем функцию «Выровнять громкость» для заданной части.
Сохраняем проект после завершения выравнивания. Нажимаем на изображение дискеты в верхней панели инструментов, выбираем формат аудиофайла (mp3, wav, wma и другие), нажимаем «Сохранить». Нормализованная дорожка будет перезаписана вместо исходного файла. Чтобы исходная версия осталась нетронутой, выбираем «Файл» > «Сохранить как…», прописываем путь размещения новой аудиозаписи.
Вывод: профессионалы используют простые программы для обработки звука, недорогие или бесплатные софты. Инструменты доступны обычным людям для работы в домашних условиях. Если необходимо автоматизировать процесс, устанавливайте и скачивайте АудиоМАСТЕР – программу, которая нормализует звук для вас!
Введение¶
В этой статье дается краткое пояснение терминов Громкость звука, Уровень звука, Нормализация, Усиление и некоторых других, и их взаимосвязи и использование применительно к системе автоматизации телерадиовещания Digispot.
Уровень звука¶
Под термином Уровень звука понимается уровень амплитуды звукового сигнала. Применительно к элементу расписания, элементу МБД или иному фрагменту звука речь идет о пиковом (максимальном) уровне сигнала на протяжении всего фрагмента. Данный уровень измеряется единицах dBFS и практически всегда является отрицательным числом. Этот уровень важен, т.к. от него зависит, насколько можно увеличить уровень, и следовательно, громкость звучания, не превысив теоретический порог 0 dBFS.
Для визуального наблюдения за текущим уровнем сигнала в реальном уровне предназначены индикаторы уровня сигнала.
Диаграмма изменения уровня сигнала во времени называется сигналограммой и используется для визуального отображения фонограмм и других звуковых элементов в различных окнах системы Digispot, например, окне редактирования склейки, при монтаже звука и пр.
В системе Digispot максимальный уровень элемента расписания и МБД рассчитывается однократно и запоминается для последующего использования, например, для нормализации.
Определение пикового сигнала совмещено с одновременным определением ее громкости, эти величины всегда рассчитываются совместно.
Истинный уровень звука¶
Термином Истинный уровень звука понимается гипотетический уровень амплитуды аналогового звукового сигнала, который является интерполяцией имеющейся оцифрованной фонограммы. Разница с просто «Уровнем» в том, что при сэмплировании точки взятия сэмплов на временной оси могут не попадать в точки максимума аналогового сигнала. Например, если у нас имеется синусоидальный сигнал частотой 11025 Гц и мы оцифровываем его с частотой 44100, то далее пиковое значение уровня по оцифрованной фонограмме может иметь значение от –3dBFS до 0dBFS в зависимости от того, с каким фазовым смещением точки сэмплирования на временной оси будут попадать на сигнал. При более высоких частотах сигнала пики могут быть ещё более недооценены.
В документе ITU-R BS.1770-3 (Annex 2) определяется алгоритм вычисления показателя «True Peak Level». Предлагаемая процедура сводится к повышению частоты дискретизации в 4 раза и фильтрации, затем по полученной интерполяции сигнала находится максимум амплитуды.
В системе Digispot пиковые индикаторы в редакторе, окнах свойств, склеек, имеют возможность отображать истинный уровень звука.
Громкость звука¶
Для оценки громкости интервала звука разработана специальная методика, вычисляющая величину громкости интервала, обозначаемую величиной I и называемую Интегральной громкостью (Integrated loudness). Именно эта величина имеется в виду, когда говорится о громкости элемента расписания или МБД.
В системе Digispot интегральная громкость элемента расписания и МБД рассчитывается однократно и запоминается для последующего использования, например, для нормализации.
В России методика измерения громкости программ определена приказом ФАС от 22 мая 2015 № 374/15. Громкость программ регламентируется федеральным законом 338.
Соотношения между пиковым уровнем цифрового аудиосигнала, истинным пиковым уровнем, громкостью, и обозначения¶
Возможности индикаторов Дигиспот-2 с лихвой перекрывают требования R-128, хотя для удобства в Джине сделана более гибкая система шкал. Индикаторы в Дигиспот-2 могут измерять
Аномалии пикового уровня аудиоисточников с кодеком отличным от PCM с фиксированной точкой¶
При кодировании аудио MPEG кодеками, результат декодирования может не поместиться в ту разрядность, которую имел исходный сигнал. Пример: у вас есть аудиофайл в PCM кодировке с фиксированной точкой 16 бит, пиковый уровень материала в файле –6dB. Вы закодировали его MP3 кодеком, и при декодировании в ту же разрядность обнаруживается, что декодированный материал имеет максимум уровня –3дБ. То есть, цикл кодирование-декодирование добавляет +3дБ к уровню сигнала. Если бы ваш файл был нормализован под 0дБ, то при декодировании возникло бы переполнение и дефекты звучания (щелчки). В принципе, это явление можно счесть дефектом кодека, но, к сожалению, практика показывает, что подобных файлов довольно много.
Усиление звука¶
Применение коэффициента усиления, назначенного элементу расписания или иному элементу системы Digispot, происходит автоматически при воспроизведении или другом использовании звука элемента.
Операция расчета коэффициента усиления по требуемому результирующему уровню звука или его громкости называется нормализация звука.
Нормализация звука¶
Нормализацией называется операция, рассчитывающая коэффициент усиления для элемента так, чтобы в результате его громкость или пиковый уровень достиг желаемого значения. Коэффициент усиления рассчитывается как разница между желаемым и текущим уровнями.
Для нормализации необходимо знать текущий уровень и громкость нормализуемого элемента. Если они не известны, то при выполнении операции запускается процесс расчета громкости и уровня, в противном случае нормализация происходит мгновенно.
На выполнение нормализации в системе Digispot влияют Общие настройки\Доп\Базовые установки\Автоматически нормализовать аудио.
Автоматическая нормализация может выполняться при ручном или автоматическом добавлении материала в МБД и в других случаях.
Кроме этого, в некоторых случаях происходит автоматическое определение громкости и уровня, которые могут использоваться при последующей нормализации.
В более ранних версиях системы Digispot присутствовала только пиковая нормализация, начиная с 2.16.2.10 в системе есть нормализация по громкости.
Автоматическая нормализация звука¶
Автоматическая нормализация звука позволяет гарантировать, что звук, поступивший в систему «извне» будет приведен к требуемому уровню и громкости.
Автоматическая нормализация происходит в двух направлениях
Кроме этого, существует возможность нормализовать элемент в процессе импорта к уровню, явно заданному в импортируемом файле и отличающемуся от указанных в общих настройках. Подробнее об этом:Установка_усиления_и_нормализация_при_импорте_в_расписание.
Материал, произведенный внутри системы, например, записанный в Трек 2 и сохраненный в МБД, автоматической нормализации не подвергается, т.к. предполагается, что необходимый уровень установлен средствами Трек2.
Также не происходит нормализации при перетаскивании/копировании-вставке материала внутри системы между различными модулями Папки/Расписание/МБД и пр.
При внесении материалов извне и автоматической нормализации нужно учитывать специфику добавляемого в систему материала, например, для подложек и других элементов оформления эфира автоматическая нормализация может установить неправильный уровень.