Сегодня 25 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Звук и акустика

Создаем DVD со звуком 5.1!

⇣ Содержание

Сейчас аббревиатуры "5.1" и "DVD" понятны всем пользователям, тогда как несколько лет назад не сходили с уст "стерео" и "CD". В чем мы выиграли с приходом новых технологий? Во-первых, звук стал "пространственным", ставлю в кавычки, потому что мы можем говорить только о горизонтальной плоскости расположения акустических колонок.

Во-вторых, качество звука можно улучшить за счет повышения частоты дискретизации и разрядности по сравнению со стандартом Красной Книги (16 бит/44,1 КГц, стерео). Но это также субъективный фактор, потому как критерии Найквиста или теорема Котельникова доказывают, что принятого ранее стандарта вполне достаточно. Так в чем же мы выигрываем? Прежде всего, в расширении поля для творчества…

Несколько слов о 5.1

На самом деле стандарт Dolby Digital 5.1 (AC3) более универсален, чем кажется. Представьте себе картину, если бы мы заменили все окружающие нас натуральные источники звука на отдельные громкоговорители, качественно им соответствующие. И тем самым соорудили определенную "матрицу" (имеется в виду кинофильм), где человек себя будет чувствовать так же естественно, как и в реальных условиях. Это реально? Очень может быть.

Давайте начнем рассмотрение этого вопроса с обычного стерео. При воспроизведении звука в наушниках мы отчетливо слышим "панорамный центр", хотя там нет громкоговорителя. То же самое происходит и при прослушивании звука в рамках обычной стереосистемы - появляются так называемые "фантомные" громкоговорители или каналы.


Локализация фантомных каналов находится в прямой зависимости от положения головы слушателя относительно оси панорамного центра. Плюс к этому добавляются недостатки современных акустических систем и окружающего мира, где звуковое поле для воспроизводимых средних и низких частот является большим, чем для высоких.


В домашних условиях на небольших стереосистемах этот факт не так значителен как в помещениях кинотеатров. Представьте, что вы сидите близко к правой колонке, и что вы сможете услышать. В результате, центральный фантомный канал было решено сделать реальным. В этой статье мы так и будем называть его "центральным" или обозначать как "C".

Обычно он получается с помощью простого сложения двух стерео-каналов и воспроизводится громче, чем правый и левый для того, чтобы звук локализовывался в первую очередь на нем. На самом деле, в рамках стереосистемы помимо центрального канала, мы воспринимаем еще множество других "фантомных", но они являются менее значительными и более сложны для отделения, поэтому пока и не заменяются на реальные.

Неравномерность АЧХ и другие недостатки современных акустических систем оказали влияние еще на одно новшество, которого раньше не было. Дело в том, что если вы поставите в обычную колонку низкочастотный динамик для воспроизведения мощных спецэффектов, то это окажет огромное влияние на нелинейность ее АЧХ и, очевидна опасность появления большого количества искажений. Поэтому изначально было решено использовать специальные многополосные системы, а потом дошли до того, что мощный низкочастотный громкоговоритель может быть и один - стереовосприятие от этого не пострадает. Как известно, человек не может определять локализацию источников звука в диапазоне примерно до 300 Гц.

Это сразу облегчило ситуацию производителям и удешевило акустические системы.

На данный момент даже большинство студийных мониторов, работающих в стерео, имеют сабвуфер. Таким образом, частотный диапазон сабвуфера (также в рамках многокальных систем его называют каналом LFE (Low Frequency Effect)) составляет примерно от 20 Гц до 200 - 300 Гц. Это является примерно 0,1 от всего частотного диапазона, представленного по логарифмической шкале. Поэтому в обозначениях современных акустических систем добавилась "одна десятая". Говоря, например, "2.1" мы подразумеваем стереосистему и сабвуфер.

Теперь вернемся к нашим "фантомным" каналам. Давным-давно в киноиндустрии помимо основных был предусмотрен специальный канал эффектов (effect channel). Он нес на себе вспомогательные функции, использовался крайне редко и воспроизводил незначительные звуковые данные (чтобы обозначить присутствие чего-либо). Потом его достаточно сильно нагрузили, изобретя системы 4.0 и 4.1. Но вот в чем дело… Есть такое понятие как "псевдостерео", под которым понимается алгоритм создания стереополя для монофонического источника звука. Ничего сложного в его реализации нет - обычная задержка или смещение фазы для одного моно-сигнала направленного на два источника.

А если представить каждую колонку стереосистемы как отдельный моноисточник, то его можно дополнить "псевдостерео"-вариантом. Так и появились полноценные пространственные каналы (далее мы их будем называть surround или S-каналами). Изначально они находились "в унизительном положении" и воспроизводились громкоговорителями, частотный диапазон которых был намного меньше фронтальных колонок. Теперь царит равноправие, и слово "пространственный" или "surround" уже не отображает реальную суть событий, хотя это понятие закрепилась. Лучше, конечно, подходит понятие "тыл" ("rear").

Итак, образно говоря, современный слушатель оказался в центре квадрата, по вершинам которого расположены фронтальные и тыловые каналы, а прямо перед носом - центральный. В результате общего взаимодействия всех колонок нашей многоканальной акустической системы, мы получаем просто огромное количество дополнительных "фантомных" каналов, что сегодня приравнивается к "настоящему "звуку вокруг".

Главная особенность

Dolby Digital 5.1 является первой серьезной цифровой многоканальной системой, получившей широкое распространение. К сожалению, далеко не многие понимают ее преимущества по сравнению с другими технологиями, но я отмечу главное - масштабируемость (схема взята из документации, распространяющейся на сайте www.dolby.com).


Заранее запрограммировав звук в 5.1, вы потом без труда сможете воспроизвести его без потерь в качестве в стерео, квадро и даже моно. Вот именно это и подвигло меня в начале 2000 года начать записывать и сводить свою группу только в 5.1. Результатом я доволен даже сегодня, в 2004-м году.

И еще стоит отметить, что если десять лет назад на серьезных мероприятиях типа съездов Audio Engineering Society (www.aes.org), доклады на данные темы зачитывались как продвижение технологической новинки, то теперь, на этих же мероприятиях просто учат студентов как правильно сводить и делать мастеринг для 5.1. Цифровое телевидение стандарта HDTV уже давно вещает с многоканальным звуком, а все современные крупные шоу записываются только в этом стандарте.

Многие могут заметить, что у Dolby есть и конкуренты, главный из которых - DTS, но все-таки последний представляет пока больше стандарт для кино-производства.

Несколько слов о DVD

DVD - это определенный тип носителя информации. По сравнению с обычным компакт-диском он имеет гораздо большую плотность записи и соответственно, емкость (4,7 Гб вместо 650 Мб). Данный параметр емкости был просто необходим, потому как обычного CD не хватало даже для переноса обычной информации, не говоря уже о видео с аудио.

Существует два различных стандарта для DVD - DVD-Video и DVD-Audio. В принципе, как и с CD данные варианты просто переходные, и, уже сейчас можно наблюдать, что аббревиатура "DVD" теряет суффиксы.

Задачей этой статьи является рассказ о том, как можно сделать многоканальный звук, а не о том как скомпилировать DVD. Причем сейчас на массовый рынок входит новый стандарт Super Audio CD, который также позволяет читать (пока только читать) многоканальное аудио. Поэтому остановимся только на ключевых вопросах звука.

С чего начать?

Это самый главный вопрос, который следует перед собой поставить, после того как вы решили, что не можете без этого жить. Для начала нужно определить первостепенные задачи. Итак…

Задача №1. Правильная расстановка акустической системы


Данная схема также взята из родной документации Dolby. Как видно, реальная расстановка каналов не подразумевает квадрат, а является окружностью. Слушатель находится в центре по оси центрального канала, правый и левый равноудалены от него и смещены относительно центра на 30 градусов. S-каналы, также равноудалены от слушателя, но при этом угол от центральной оси до громкоговорителей составляет 110 градусов. В реальных условиях очень трудно соблюсти догму, но при этом можно воспользоваться задержками между каналами, с помощью чего система настраивается вплоть до идеальной.

Задача №2. Какие программы выбрать?

Вот тут-то и есть основной камень предткновения. Сейчас в моде многоканальные платы и многодоржечные (мультитрековые) программы. Имея интерфейс, например, с 8-ю выходами, вы можете подключить к нему восемь колонок, а в программе оперировать таким же количеством треков, за каждым из которых будет закреплен отдельный выход. Именно так и делались первые многоканальные записи, но они несли больше исследовательский характер, поскольку не имели строгих стандартов.

Dolby 5.1 плотно увязывает определенную акустическую систему, включающую пять колонок и сабвуфер, с алгоритмической моделью - то есть, является строгим стандартом. Вместо простых элементов управления панорамным положением в программах появились двумерные графические элементы, на которых вы можете указать локализацию источника звука в горизонтальной плоскости в рамках 5.1. Данные решения разрабатывались достаточно долго и имеют свою историю. Одними из первых на рынке ПО появились HMI InMotion 5.1 и Sonic Foundry Soft Encode.

Это была своего рода технологическая революция, поскольку в InMotion 5.1 пользователи могли оперировать большим количеством пространственных эффектов, а Soft Encode позволял кодировать звук AC3 (Dolby Digital) программным способом, в то время как аппаратные кодеры имели заоблачные цены.

Возвращаясь в 2004 год можно сказать, что практически все современные мультитрековые программы позволяют производить пространственное сведение звука в 5.1, только далеко не все дают возможность сохранить результат. В частности, знакомая картина, когда после приобретения программы, кодеки MPEG 2/AAC, Dolby Digital (*.ac3) и WMA устанавливаются опционально. То есть требуется определенная доплата. Помимо этого, многие программы под Windows просто не имеют другого выходного многоканального стандарта кроме как WMA, что также может доставлять некоторые неудобства.

Итак, приведу список основных современных программ, позволяющих работать с Dolby 5.1:

  • Sony Pictures Digital (ex-Sonic Foundry) Soft Encode,
  • Sony Pictures Digital (ex-Sonic Foundry) Vegas,
  • Emersys Maven 3D,
  • Steinberg/Pinnacle Nuendo,
  • Steinberg/Pinnacle Cubase.
  • RML Labs SAW Studio.

В этом обзоре мы остановимся на четырех из них.

Задача №3. Постарайтесь ответить на вопрос: что именно вы ждете от результата своей работы.

Несмотря на то, что этот пункт носит большей частью полемический характер, он важен. Если вы хотите делать музыку в 5.1, то рекомендую уделить время прослушиванию того, как это делают профессионалы. В большинстве случаев, многоканальность достигается синтезированным, а не естественным образом. Конечно, сейчас можно встретить записи церковных хоров и т.д., изначально записанных в 5.1 с помощью специальных микрофонных систем. Но это встречается очень редко, поскольку требует наличия нестандартного по современным меркам оборудования. И в данном варианте стоит отметить, что такой подход является чисто музыкальным, поскольку не использует правила, пришедшие к нам из киноиндустрии (акцентирование внимания на главном персонаже и т.п.).

Если стоит вопрос в синтезировании пространственной звуковой картины в музыке, то очень большую часть времени вы будете уделять обработке звука эффектами. Звуковая картина должна быть равномерно заполненной и понятной для слушателя. Если же стоит вопрос об озвучивании видеоряда, то все гораздо проще, поскольку вступают в силу все законы производства звука для кино, и многоканальный трек вы будете собирать из кубиков (моно и стерео-файлов).

Sony Pictures Digital Vegas 4.0 и выше

Мы не будем затрагивать программу Soft Encode от той же торговой марки, поскольку Vegas является следующим витком данного направления ПО. На его примере мы отметим базовые операции по работе с многоканальным звуком, присущие для всех современных программ подобного направления. Также остановимся на некоторых тонкостях, свойственных только Vegas.

С точки зрения 5.1 следует отметить следующие важные характеристики программы:

  • Количество треков - не ограничено.
  • Поддержка 5.1 - полная, стандарты Dolby и DTS.
  • Частота дискретизации - до 192 КГц.
  • Разрядность - до 24 бит.
  • Экспорт - шесть моно файлов (AIFF, WAV, W64 или PCA), а также 5.1 (AC-3, WMA и WMV).
  • Импорт - WAV, AIFF, AVI (отделяет звук от видео), MP3, OGG, WMA, WMV, CDA, MPEG-1, MPEG-2.
  • Видео - в отдельном треке с возможностями редактирования и обработки эффектами. Можно импортировать видео и графические файлы форматов AVI, MPEG 1,2, BMP, PSD, JPEG, PND, TGA, WMV.
  • Звуковые эффекты - DirectX-плагины. С программой поставляется стандартный набор.
  • Вспомогательные программы - любой звуковой редактор, в т.ч. Sony Pictures Digital Sound Forge.

Первым этапом идет указание настроек рабочего проекта, которое доступно из главного меню File > Properties. В закладке Audio мы выбираем вариант 5.1 Surround, частоту дискретизации, разрядность, степень качества ресэмплинга, частоту среза для фильтра LFE-канала и степень качества этой фильтрации. Данное окно показано на рисунке.


Расшифровывая эти пункты стоит отметить, что наиболее приемлемые характеристики качества звука для DVD-стандарта являются 24 бита/96 КГц. Степени качества ресэмплинга и фильтрации зависят от производительности вашего РС, и если ее хватает, то стоит выбирать лучший вариант. Не стоит забывать, что в процессе работы вы достаточно сильно загрузите вычислительную мощность компьютера, используя большое количество треков и подключая модули эффектов.

Что касается обрезного фильтра, то предлагается выбрать один из четырех вариантов:

  • 80 Гц (для обычных пользователей и любителей DVD).
  • 116 Гц (для систем DTS).
  • 120 Гц (профессиональное Dolby для кино).
  • 180 Гц

Мною будет рекомендовано выбирать из первого (80 Гц) и третьего (120 Гц) вариантов. Хотя первый более приемлем, поскольку предусматривает большинство пользовательских систем. При желании данную опцию с выбором частоты среза для LFE-фильтра можно отключить совсем.


На рисунке показан рабочий интерфейс программы с загруженным проектом, в котором решается задача обеспечения звукового оформления для готового видеоряда. Из расшифровки видно, что для каждого аудио-трека есть свой собственный модуль управления панорамным положением в системе 5.1. Изначально оно устанавливается в фиксированном виде. Но в программе реализована возможность изменения панорамного положения в процессе времени, что называется Surround Pan KeyFrames. Таким образом, даже загрузив один моно-файл можно заставить его "летать" в пространстве.

Полезная рекомендация:

Обеспечение звукового ощущения движения объекта имеет ряд особенностей, на которых бы хотелось заострить внимание. Во-первых, добавляются два существенных эффекта - Допплера и реверберации. Помимо этого, для ощущения реализма и яркости можно примешать к основному сигналу шум. И третий важный момент - эквализация. Как известно, высокие частоты быстрее затухают, чем низкие, поэтому при эмуляции удаляющегося движущегося объекта уровень высоких частот необходимо плавно уменьшать.

 
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
«Недостаточно слов, чтобы выразить благодарность за такой подарок»: неофициальная русская озвучка трейлера The Witcher 4 привела фанатов в восторг 19 мин.
ИИ научили генерировать тысячи модификаций вирусов, которые легко обходят антивирусы 2 ч.
В Epic Games Store стартовала новая раздача Control — для тех, кто дважды не успел забрать в 2021 году 2 ч.
За 2024 год в Steam вышло на 30 % больше игр, чем за прошлый — это новый рекорд 3 ч.
«Яндекс» закрыл почти все международные стартапы в сфере ИИ 3 ч.
Создатели Escape from Tarkov приступили к тестированию временного решения проблем с подключением у игроков из России — некоторым уже помогло 4 ч.
Веб-поиск ChatGPT оказался беззащитен перед манипуляциями и обманом 5 ч.
Инвесторы готовы потратить $60 млрд на развитие ИИ в Юго-Восточной Азии, но местным стартапам достанутся крохи от общего пирога 6 ч.
Selectel объявил о спецпредложении на бесплатный перенос IT-инфраструктуры в облачные сервисы 6 ч.
Мошенники придумали, как обманывать нечистых на руку пользователей YouTube 7 ч.