Surround — объемный звук

Dolby Digital и DTS

Сегодня используется несколько разных форматов объемного звучания, и начинающим порой очень трудно понять, чем они отличаются. Для вас самое главное знать, какие форматы имеются и какие поддерживает ваш ресивер. Звуковая дорожка на DVD и Blu-ray дисках часто кодируется в нескольких форматах, наиболее распространенными являются Dolby Digital и DTS. Ваш ресивер должен распознавать такой цифровой поток и преобразовывать его в аналоговые сигналы для воспроизведения через многоканальную систему.

Если не углубляться в детали есть два основных формата:
Dolby Digital 5.1 представляет собой формат, который предусматривает шесть каналов – два спереди, два сзади, один по центру и один для сабвуфера. Полоса пропускания звуковых частот от 20 Гц до 20 кГц. Используется 18-битовое кодирование, так что выходной поток составляет 384 кбит/с. Dolby Digital 5.1 также называют AC-3 (Audio Codeс-3), он используется практически на всех DVD дисках и в телевизионных программах (HD).
DTS также обрабатывает цифровой поток формата 5.1. DTS доступен на 70 процентах Blu-ray и DVD дисков, как правило, совместно с Dolby Digital.
Оба формата сегодня используются практически на всех Blu-ray и DVD дисках, 99 % ресиверов поддерживают такие форматы объемного звучания.

Другие форматы объемного звука

Более новый форматами считаются Dolby Digital Surround EX и DTS ES, которые включают дополнительные тыловые каналы. Формат Dolby Digital Surround EX был представлен в 1999 году. Его особенность в появлении третьего канала за спиной у зрителей. Дополнительный канал вводится в источник звука при кодировании звуковой дорожки фильма.

Форматы Dolby и DTS позволяют озвучивать пять и более каналов даже при воспроизведении стерео записи, создавая при этом имитацию объемного звучания. К подобным форматам относится и Dolby Pro Logic. Но технология Dolby Pro Logic не используется при кодировании фонограммы, при записи DVD и Blu-ray дисков, а является просто настройкой ресивера.
Технология Dolby Pro Logic – система декодирования, разработанная компанией Dolby Laboratories для создания объёмного звучания двухканальной аудиодорожки при прослушивании на аудиосистемах 5.1.

Технология Dolby Pro Logic IIz также относится к ресиверам, но не к источникам звука типа DVD и Blu-ray дисков, и обеспечивает выделение двух дополнительных фронтальных каналов, излучатели которых расположены над основными фронтальными колонками. Воспроизведение звука в такой конфигурации становится более реалистичным, особенно для таких звуковых эффектов, как шум ветра или стук дождя. При этом, единственное, что вам нужно два дополнительных динамика и ресивер, который поддерживает технологию Pro Logic IIz.
Эта технология Dolby способна обогатить аудио, независимо от того, записано ли оно в стерео или в 7.1-канальном варианте. Она позволяет опознать не направленные окружающие шумы и избирательно воспроизвести их через верхние фронтальные каналы.
Звуковые эффекты в кинофильме приобретают трехмерное звучание и кажутся более реалистичными. Концерты оркестров оказывают более мощное воздействие на слушателей, а музыкальные кинофильмы получают эффект присутствия.

HD аудио в домашнем кинотеатре

В эпоху видео высокого разрешения особый интерес представляют такие форматы, как Dolby True HD и DTS-HD Master Audio. Эти два формата являются модернизацией обычных Dolby и DTS. Разница лишь в том, что у них много меньше степень сжатия звука, таким образом, HD форматы можно встретить на Blu-ray, но не на DVD дисках. Вы хотите повысить качество звучания домашнего кинотеатра, тогда нужно иметь Blu-ray плеер и ресивер с возможностью декодирования звуковой дорожки Dolby True HD и DTS-HD Master Audio. Некоторые старые ресиверы могут не иметь таких декодеров.

Обратите внимание, если у вас старый ресивер, но Blu-ray плеер может воспроизводить с диска объемный звук в формате высокого разрешения, вам необходимо будет декодировать сигнал в формат PCM (Pulse Code Modulation). Это, пожалуй, несколько сложнее и придется обратиться к руководству по использованию плеера. Также вы можете купить Blu-ray плеер, который имеет аналоговые аудиовыходы 5,1 (шесть отдельных аудио выходов). Таким образом, с выхода плеера вы сможете отправить аналоговый звук на входы усилителя ресивера.

Более совершенные форматы объемного звучания

Хотя в большинстве домашних театров сегодня используется 5.1 и 7.1-канальные конфигурации излучателей звука, уже давно есть и варианты с использованием дополнительных каналов звука, такие как Audyssey DSX и DTS Neo: X, а на смену им идут совсем недавно появившиеся Dolby Atmos и Auro 3D, которые обещают «непревзойденное, реалистичное звучание» за счет дополнительных, расположенных сверху (над головой зрителя) источников звука. Таким образом, капель дождя по крыше или звук пролетающего на головой самолета становятся максимально приближенными к действительности, когда воспроизводится фонограмма или аудиодорожка из фильма с соответствующим образом закодированным звуком.
Подобная аудиотехника, включая ресиверы и специальные верхние колонки, уже есть в магазинах, некоторые модели старых многоканальных ресиверов могут быть модернизированы до уровня Dolby Atmos и Auro 3D лишь за счет обновления программной прошивки.

Требования THX

Если вы когда-нибудь были в городском кинотеатре, то значит, безусловно, сталкивались с реализацией требований THX на большом киноэкране, но сегодня вы можете найти логотип THX и на задней стороне лучших компонентов домашних кинотеатров. Многие думают, что THX это звуковой формат, также как DTS, Dolby Surround и т.д., но это совсем не так. Сертификация на соответствие требованиям THX является отличительной чертой для аудио и видео высокого качества, от такого авторитета как кинокомпания Lucasfilm.
Данный стандарт был разработан Томлинсоном Холманом для компании Lucasfilm в 1982 году, чтобы обеспечить гарантированную передачу оригинального звукового сопровождению шестой части саги «Звёздные войны» – «Возвращение джедая». Таким образом, THX является неким общепризнанным стандартом качества.

Аудио/техника с логотипом THX является хорошим (но дорогим) и надежным продуктом, который отвечает самым высоким требованиям в отношении достоверности видео и аудио. Конечно, существуют и другие мнения о сегодняшнем реальном значении логотипа, связанные с коммерциализацией и зарабатыванием денег на узнаваемости бренда. И, кроме того, для того, чтобы «звук воспроизводился абсолютно так, как задумал режиссер», необходимо соблюдать и ряд других требований по размещению источников в помещении домашнего театра, где акустические условия могут серьезно отклоняться от идеальных. Очевидно, поэтому появились уровни требований THX с учетом домашней специфики.

THX Select 2 и THX Ultra 2

Для ресиверов и громкоговорителей сертификация THX Select(2) означает, что эти компоненты сертифицированы для работы в домашних кинотеатрах объемом около 56 кубических метров. Более высокий уровень требований предусматривает THX Ultra (2). Этот сертификат дается компонентам, которые могут обеспечить озвучивание помещений объемом до 85 кубических метров. Теоретически ресиверы и громкоговорители THX Select в пространстве 56 кубических метров или менее обеспечивают такие же качественные показатели, как и компоненты с логотипом THX Ultra. Для усилителей, DVD и Blu-ray плееров нет сертификации THX Select. Эти компоненты идентифицируются только по THX.

Технологии Audyssey

Производители акустических систем стремятся к тому, чтобы разрабатываемые ими аудиоколонки воспроизводили звук без искажений и провалов в частотном спектре. Однако, характер звучания любых акустических систем зависит от акустических характеристик среды размещения. Стены, мебель и другие объекты с разной интенсивностью отражают и поглощают определенные частоты звука. Именно поэтому один и тот же комплект аудиотехники может звучать по-разному, в зависимости от акустических характеристик помещения. Это явление учитывают не все производители громкоговорителей. Компания Audyssey (как и некоторые другие) уделяет наиболее серьезное внимание оптимизации звучания в соответствии с акустическими характеристиками любой комнаты. Наличие соответствующего программного обеспечения Audyssey подтверждается логотипом на ресивере.

Audyssey MultEQ
Эта технология Audyssey позволит добиться оптимального звучания от ваших колонок и ресивера (с поддержкой этой технологии) в любом помещении. Каждая аудиоколонка и нагруженный на нее канал усилителя могут быть индивидуально настроены. В комплекте с такой аудиотехникой, как правило, имеется микрофон для настройки системы с помощью установленной на компьютере программы Audyssey MultEQ.

Audyssey Dynamic EQ
Audyssey Dynamic EQ является технологией коррекции громкости, которая решает проблему снижения звукового давления при низких уровнях громкости, с учетом характеристик человеческого слуха и помещения для прослушивания. При создании фильма используется достаточно высокий опорный уровень звука. В обычной гостиной на пониженной громкости пропадают басы и ухудшается общее впечатление от звука. Но Dynaminc EQ позволит представить оригинальный звук на любой громкости. Обратите внимание, что Dynamic EQ работает только в сочетании с MultEQ.

Audyssey Dynamic Volume
Громкость звука в телевизионных программах (даже в рамках одной программы), фильмах и рекламных роликах может серьезно меняться. Это может приводить к тому, что вам приходится порой приглушать звук, к примеру, в рекламных паузах. С Audyssey Dynamic Volume эти различия в уровне громкости устраняются автоматически. Уровень звука постоянно контролируется и в случае необходимости корректируются.

Audyssey DSX (Dynamic Sound Expansion)
Это технология динамического расширения звука, она позволяет добавить больше аудиоканалов для системы объемного звучания, позволяет расширить систему 5.1 до конфигурации 7.1, 9.1 или 11.1. с Audyssey DSX вы можете дополнить левую и правую фронтальные колонки двумя дополнительными боковыми, сможет использовать два дополнительных канала по высоте или добавить еще два задних канала. Audyssey, таким образом, гарантирует более впечатляющее объемное звучание.

Интересная статья на тему "звук вокруг" . История, аппаратура, программное обеспечение, теория, искуственная голова, стерео, квадро, 3D.

Рис. 1. Стереопанорама


Большинство современных дешёвых и не очень звуковоспроизводящих устройств включая звуковые карты для персональных мультимедиа компьютеров позволяют воспроизводить звук в режиме “3D Sound” или “Suround”, что можно перевести как “объёмный звук”.

Что же это такое и для чего это нужно? Системы объёмного воспроизведения звука были разработаны потому, что качество звучания, реализуемое обычной стереофонической системой или головными телефонами, перестало удовлетворять взыскательных слушателей. Хотя стерео системы и создают эффект пространственного звучания за счет синтеза панорамы мнимых источников звука (МИЗ) между двумя громковорителями (рис. 1), все же стереозвучание имеет существенный недостаток. Стереопанорама получается плоской и ограничена углом между направлениями на громкоговорители. Такое звучание в значительной степени лишено естественности, свойственной тому, что достигается в реальном звуковом поле, когда человек способен воспринимать реальные источники практически со всех направлений как в горизонтальной так и в вертикальной плоскостях и оценивать, хотя порой и с ошибками, расстояние до источников звука.

Считается, что восприятие звуков с разных направлений и расстояний имеет важное значение не только как факт их пространственного расположения. Оно создаёт у слушателя ощущение звучащего объёма (трёхмерного звукового поля), существенно обогащает тембры музыкальных инструментов и голосов, восстанавливая реверберационный процесс, свойственный первичному помещению (концерному залу). Обычная стереофония создаёт эффект пространственного звучания в очень ограниченной области перед слушателем, не позволяет в полной мере выявить названные особенности восприятия звуков в реальном звуковом поле и, следовательно, снижает качество звучания.

Квадрофонические системы также не обеспечивают полную имитацию реального звукового поля. Во-первых, при квадрофонии не получается круговая стереопанорама - слушатель ощущает обычную стерео панораму перед собой и заднюю стерео панораму сзади себя. Во-вторых, все мнимые источники звука располагаются в одной плоскости и на линии между динамиками, т.е. нет глубины и нет, собственно, 3-го измерения и трёхмерного объемного звучания (Рис. 2).


Рис. 2. Квадропанорама

Головные стерео телефоны также не позволяют получить естественное звучание воспроизводимой фонограммы. Дело в том, что возникающее при этом впечатление бесконечной ширины стереобазы и четкая локализация звукового изображения внутри головы слушателя не могут удовлетворить требовательных меломанов. Для устранения эффекта локализации звука внутри головы применяются схемы подобные приведенной на Рис. 3.


Рис. 3. Блок схема устройства создания объемного звука для стереотелефонов

Здесь сигналы левого и правого каналов через входные устройства А1 и А2 поступают соответственно на делители напряжения А3 и А6 и на входы перекрестных каналов, состоящих из линий задержки (ЛЗ) А4, А5, согласующих устройств А8, А9 и фильтров нижних частот (ФНЧ) Z1, Z2. С делителей А3, А6 сигналы подаются на корректоры АЧХ А7 и А10 и далее - на один из входов сумматоров, а с них - на входы усилителей мощности для стереотелефонов. Таким образом, на выходе каждого канала формируется сигнал, состоящий из ослабленного и скорректированного сигнала своего канала и задержанного и соответствующим образом скорректированного сигнала другого канала.

Подобными устройствами, выполненными в виде приставок или встроенных устройств в настоящее время оснащены многие музыкальные центры. Интересно, что такие устройства могут быть реализованы и чисто программными методами с использованием цифровой обработки сигналов в реальном времени. Читатели, имеющие персональный компьютер с фулдуплексной звуковой картой (к сожалению программа плохо работает с картами производства сингапурской фирмы Creative Labs.), могут скачать одну из подобных программ из Интернет с сервера www.geocities.com/SunsetStrip/Palladium/2932/v108.zip. Программа с этого сервера кроме того позволяет добавить эффекты реверберации для маленького, среднего и большого помещения, эхо, хорус, флэнжер и имеет довольно неплохой эквалайзер, значительно улучшающий воспроизведение низких (20..60 Гц) частот через стереотелефоны среднего класса качества. Все эффекты работает в реальном времени даже на очень дешевых звуковых картах без DSP процессоров, например на OPTi-931 или Acer S23.

Наиболее совершенный метод имитации реального трёхмерного звукового поля это Бинауральная передача звука. Бинауральный метод состоит в том, что звуковая информация воспринимается микрофонами, размещёнными в ушных раковинах человека или “искусственной головы” - модели, симулирующей слуховое восприятие человека. Сигналы, поступающие с каждого микрофона, усиливаются раздельными усилителями низкой частоты и воспроизводятся стереотелефонами. В идеале такая система позволяет создать полную иллюзию естественного звучания.

Она как бы переносит слушателя из помещения прослушивания в помещение, откуда ведётся передача. Однако полноценно прослушивать её можно только с помощью стереотелефонов и при условии что в качестве образца для создания искусственной головы использовалась именно ваша голова. Читатели могут прослушать бинауральные демонстрационные звуковые WAV файлы, скачав их через Интернет с серверов www.lakedsp.com, www.wа.com.au/lake, www.3daudio.com, www.geocities.com/SiliconValley/Pines/7899, www.geocities.com/SunsetStrip/Palladium/2932/3d_audio.htm

При воспроизведении бинаурального сигнала через звуковые колонки из-за попадания сигнала правого канала в левое ухо слушателя и наоборот возникают перекрёстные искажения, в конечном счёте сводящие на нет все преимущества бинаурального звуковоспроизведения. Указанные недостатки в значительной мере удаётся устранить с помощью специального устройства обработки звуковых сигналов, позволяющего получить бинауральный эффект при прослушивании бинауральной записи через колонки. Такие устройства получили название бифонических процессоров. Запись производится с микрофонов, расположенных в искусственной голове, а воспроизводится после обработки бифоническим процессором, в котором точно рассчитанная величина сфазированного, задержанного и скорректированного по частоте сигнала левого канала вычитается из сигнала правого канала и наоборот. Структурная схема бифонического процессора, впервые разработанного фирмой JVC, показана на рис. 4.


Рис. 4. Блок схема бинаурального процессора

Он состоит из усилителей сигналов левого и правого каналов А1, А2, усиливающих сигналы с микрофонов, установленных в искусственной голове А0, линий задержки D1, D2, фазовращающих устройств U1, U2 и сумматоров Е1, Е2. После обработки бифоническим процессором сигналы, приходящие из колонок в уши слушателя суммируются так, что левое ухо слышит только сигналы левого канала, а правое - правого канала. Таким образом, можно сказать, что бифонический эффект подобен бинауральному и отличается от него только способом воспроизведения бинауральной записи.

И хотя площадь, где он отчётливо проявляется, невелика, зато, находясь в её пределах, слушатель может иметь представление о расстоянии до источников звука и их взаимном расположении в пространстве в момент записи, чего не удаётся достигнуть при стереофоническом звуковоспроизведении, дающем представление только о расположении источников звука на линии между звуковыми колонками. Другое интересное свойство бифонического процессора - это возможность расширения с его помощью стереобазы обычных стереофонических записей.

Именно это обычно и имеется ввиду под “3DSound”. А если сиcтема позволяет увеличить мнимый угол между направлениями на звуковые колонки (Рис.1) до 180 градусов, то такую систему называют “Suround” и создаваемая звуковая панорама для неё будет такой же как при прослушивании на стереотелефоны, но без концентрации мнимых источников звука внутри головы слушателя. Конечно, бифонический процессор может быть реализован чисто программными методами с использованием методов цифровой обработки сигналов в реальном времени.

Читатели, имеющие персональный компьютер с фулдуплексной звуковой картой, могут скачать одну из подобных программ из Интернет.

Термин «3D-звук» использовался настолько часто в разной технике, что сейчас уже сложно понять, что же именно он означает. Это может быть и простой алгоритм расширения стереобазы, и, например, бинауральная запись для наушников. Поэтому компания Auro особо подчеркивает, что в ее понимании 3D-звук - это звук в трех измерениях, когда схема расстановки колонок ведется по трем перпендикулярным осям (x, y, z), а запись и сведение делаются исходя из такой расстановки системы. О том, что творится внутри Auro-дорожек и почему бельгийская компания решила отвоевать себе рынок у Dolby Atmos и DTS:X, и пойдет речь.

История

Все началось с телефонного звонка в марте 2005 года. Немецкий продюсер Том Хапке загорелся идеей сделать микс в аудиоформате 2+2+2 и предложил заняться этим Вильфриду ван Балену (Wilfried Van Baelen), главе бельгийской студии Galaxy. Вильфрид поначалу отнесся к идее скептически: эта конфигурация предполагала квадрофоническую схему с двумя дополнительными каналами, установленными повыше фронтальных, и казалась оправданной в озвучке фильмов, но в чем же выиграет музыка от двух дополнительных фронтальных каналов, он не понимал. Пока не послушал классику в таком формате.

Звук оказался глубже, прозрачнее, объемнее, чем в «плоскостной» конфигурации 5.1, и побудил Вильфрида на эксперименты. Так как альбом необходимо было записать в форматах 2+2+2, 5.1 и 2.0, он взял за отправную точку схему 5.1 и добавил к ней пару фронтальных каналов, однако после ощутил дисбаланс: за фронтальную полусферу отвечали 6 каналов, в то время как за тыловую - всего 2. Его решение было простым - добавить еще больше каналов, и так тылы тоже обзавелись дополнительной парой спикеров, расположенных чуть выше. Конфигурация доросла до формата 9.1, но при этом не утратила обратной совместимости с форматом 5.1.


По словам Вильфрида, то, что он испытал, было сравнимо с его первым знакомством с квадрофоническим звуком. Колонки действительно исчезли, появилось ощущение присутствия на месте, где производилась запись.

Этот эксперимент и положил начало пятилетней истории разработки формата Auro 3D.

От уха до мозга

Вильфрид стал изучать принципы работы слухового аппарата, чтобы понять, почему же от добавления дополнительного звукового измерения у него настолько сильно изменилось восприятие звука и откуда возникло это ощущение погружения. В итоге он узнал, что такое всеобъемлющее впечатление создает диффузное поле за спиной.

Как известно, при сведении в стерео очень часто используется прием перехода звука из одного канала в другой, создающий иллюзию перемещения источника в горизонтальной плоскости. Вильфрид, продолжая эксперименты, захотел добиться похожего эффекта в вертикальной плоскости, но не преуспел. Сначала он считал, что проблема в оборудовании, но все оказалось интереснее: он услышал желаемый эффект, склонив голову набок и подойдя поближе к колонкам.


Суть в том, что диаграмма направленности человеческого слуха больше тяготеет к горизонтальной плоскости, и поскольку у людей нет уха на затылке, вертикальную составляющую мы соответствующим образом обработать не можем. В локализации звука человеку помогает разница в уровне сигналов, разница во времени восприятия сигнала левым и правым ухом и отраженные сигналы. На самом деле 90% звуков, которые воспринимает человеческое ухо - трехмерные отражения исходного сигнала. И находящиеся на уровне головы колонки воспроизводят именно те сигналы, которые впоследствии отражаются от пола.

По каналам, по объектам

Формат Auro-3D, в отличие от конкурирующих Dolby Atmos и DTS:X, не объектно-ориентированный, а поканальный. Для достижения «обволакивающего звука» к двум слоям колонок - классическому и второму, расположенному под углом 30 градусов к горизонту - Вильфрид добавил третий, установленный прямо над слушателем. Этот третий слой акустики получил название «глас Бога» и добавил третье измерение в звук - высоту. Если в стандартных кинотеатральных конфигурациях, даже в Dolby Atmos и DTS:X, слушатель окружен сферическим слоем звука, то в Auro-3D его как бы обволакивает полноценная полусфера.


В объектной технологии звукозаписи каждый источник звука прописывается отдельно, а в поканальной звук распределяется между разными каналами, а потом уже суммируется вместе в колонках. Например, при записи звука оживленной проезжей части в объектно-ориентированном формате не удастся выделить сами движущиеся объекты - машины, велосипеды, людей - для дальнейшего использования, нельзя будет получить отраженный от этих объектов трехмерный звук, равно как и прямой. В поканальной системе эта проблема решена путем упрощения, и именно здесь на сцену выходит вертикальная составляющая.

Третий слой колонок в Auro 3D создает вокруг слушателя «вертикальное стереополе», причем при любой схеме расположения акустики в Auro 3D. Сам по себе третий слой не помогает в локализации - он помогает в воспроизведении пролетающих над головой вертолетов, звездолетов и погодных эффектов, но человеческий слух мало восприимчив к поступающим непосредственно сверху звукам, да и в целом оттуда, с потолка, приходит мало звуковой информации. В этом виновата эволюция: так сложилось, что чаще всего на заре человечества опасность исходила примерно с того же уровня, на котором находился человек, а не сверху, и именно поэтому мозг усиленно обрабатывал отраженные от земли звуки.

Формат Auro 3D даже в сокращенной конфигурации, с меньшим количеством аудиослоев, способен воспроизвести вертикальное позиционирование источников звука, и поэтому прекрасно адаптируется к самым разным помещениям и системам. Кроме того, Auro 3D является единственным форматом 3D-звука на рынке, поддерживающим процесс мастеринга, основанный на смешивании всех каналов, чего не умеют форматы объектной записи. Фактически Auro 3D - единственный формат на рынке для музыки в 3D. При этом в век сжатых фоматов - MP3, AAC и других - Auro 3D имеет качество 24 бит/96 кГц.

На каждом устройстве

Технология Auro-3D Engine включает в себя декодер Auro-Codec и апмиксер Auro-Matic. С помощью этих двух алгоритмов и достигается универсальность системы. Декодер распознает и декодирует нативный звук в формате Auro-3D, в то время как апмиксер использует алгоритм повышающего распределения звука из моно, стерео, 5.1 и 7.1 в Auro-3D, при наличии, конечно, необходимого количества каналов. То есть фильмы, уже записанные на Blu-ray или даже DVD, и музыку, смонтированную в стерео, можно будет оценить в новом, максимально трехмерном формате.


Традиционно технология апмикса использует изменения в эквализации спектра и добавляет алгоритмы отражений. При разработке Auro-Matic инженеры не хотели слышать лишних ревербераций или фазовых неточностей, но хотели передать звук максимально близко к тому, как его слышал и задумывал автор. И разработали алгоритмы, связанные с HRTF (Head Related Transfer Function) - технологией, которая учитывает, как человеческое ухо воспринимает звуки в естественных условиях. Обладатели iPhone и iPad могут оценить работу алгоритма, ознакомившись с приложением Beautifyer (увы, не доступен в России).


В свое время Auro-Technologies столкнулась с интересной проблемой: разработчики оборудования не стремились внедрять технологию Auro-3D из-за того, что не было соответствующего контента, а создатели контента не использовали Auro-3D формат из-за того, что его не на чем было воспроизводить. Поэтому компания решила самостоятельно выпустить ресивер, поддерживающий Auro-3D, и со временем за ней подтянулись и остальные. Сейчас помимо линейки продуктов от компании StormAudio все больше и больше производителей внедрили Auro-3D в свое AV оборудование: среди них Denon, Marantz, Steinway Lyngdorf, Macintosh, Trinnov, Theta Digital, StormAudio, ATI и Datasat.


Интерфейс настроек инсталляции Auro-3D в процессоре Trinnov Altitude 32

Помимо домашних и недомашних кинотеатров и аудиосистем Auro-3D занял место и в автомобильной промышленности. Совместно с компанией Continental разработчики создали в автомобиле уникальную встроенную систему трехмерного звука, и первые автомобили, оборудованные системой Auro-3D, увидят свет в 2017 году. Звуковое поле такого плана меняет атмосферу для водителя, позволяет ему расслабиться и почувствовать себя комфортнее, и даже, по мнению некоторых, будто бы расширяют пространство салона. Как считает Вильфрид, при прослушивании музыки в 3D наш мозг меньше напрягается, чем при обработке стереофонограммы - отсюда и дополнительный комфорт.


Автомобиль Porsche Panamera с установленной системой от Burmester, которая умеет работать с Auro-3D-звуком

Сейчас уже есть порядка 200 альбомов, записанных в формате Auro 9.1, а совсем немного - в формате 10.1, с использованием наивысшего канала. Область использования этого канала достаточно специфична - он нужен для воспроизведения именно тех звуков, которые доносятся непосредственно сверху, а в музыке расположенных над слушателем объектов обычно не бывает. Даже записи живых концертов не нуждаются в «гласе Бога», потому как в концертных залах, как правило, меньше отражений. Среди двух сотен альбомов в формате 9.1 встречаются не только классические композиции, но также и джаз, и рок, и популярные исполнители, и даже танцевальная музыка.


Также формат захватит и мобильные устройства. В сочетании с бинауральной технологией Auro-3D для мобильных устройств сможет создавать трехмерный иммерсивный звук сразу в смартфоне и передавать его в наушники: система способна как декодировать оригинальный Auro-3D контент, так и воспроизвести всю стереофонтеку, фильмы и прочие медиафайлы в звуковом формате Auro-3D при помощи апмикса.


Интерфейс программы Wwise с опциями для работы с Auro-3D-звуком

Особняком стоят видеоигры. Технология Auro-3D позволит создавать звуковые ландшафты, которые подарят игрокам совершенно иные ощущения. Компания заключила партнерство с Audio-Kinetics и внедрила формат в программу Wwise для создания звука для компьютерных игр. Версия AuroWwise поддерживает 3D-звук для интерактивных средств массовой информации и игр, сохраняя при этом все функциональные возможности. Первой игрой в формате Auro-3D станет Get Even, которая выйдет весной 2017 года. С колонками, правда, по мнению Вильфрида, такое звучание все равно не сравнится.

Сколько нужно колонок?

Для домашних кинотеатров минимальная рекомендованная конфигурация - 9.1, оптимальное решение - 11.1, а в особо крупных залах следует воспользоваться Auro 13.1. Места необходимо столько же, сколько и для оптимального размещения систем 5.1 и 7.1. Разработчики протестировали работу Auro-3D в самых разных помещениях - с высоким потолком, низким потолком, в сухой и влажной среде, и поняли, что система оказалась действительно гибкой.


Сейчас уже появился новый формат AuroMax - это гибридный, канальный и объектно-ориентированный формат, который использует конфигурацию от 20.1 до 26.1. Формат AuroMax - совместная разработка компаний Auro-Technologies, Barco и Iosono, и используется в полноценных кинотеатрах. В домашних кинотеатрах, по мнению разработчиков, необходимости в такой максимальной конфигурации нет, но слово заказчика - закон. Правда, места потребуется еще больше, чем на 13.1-канальную версию.

По мнению Вильфрида, даже миллион колонок не сможет воспроизвести окружающий нас мир натурально - наши уши слишком умны для того, чтобы их можно было так обмануть. Поэтому цель Auro-3D - не задействовать как можно больше каналов, а наоборот, добиться максимально обволакивающего звучания с наименьшим числом динамиков. Потому и не стоит пытаться уместить в небольшом кинотеатре 26.1-канальную конфигурацию - в ней просто не будет смысла, эффект от дополнительных каналов не перекроет потраченных на установку сил, нервов и денег. Лучше обойтись 11.1-канальной версией.

Для широкоформатных кинотеатров и киностудий

В 2011 году Вильфрид начал партнерство с бельгийским производителем видеооборудования Barco. Эта фирма стала использовать системы Auro-3D в своем оборудовании для кинотеатров, и в том же году впервые установила систему Auro 11.1. Первым фильмом в таком формате стала лента «Red Tails», снятая Джорджем Лукасом. Сейчас по всему миру системами Auro 11.1 by Barco и AuroMax оборудовано более 550 кинотеатров.


В России на сегодняшний день таким звуком оснащены главный премьерный кинозал «Октябрь» и 27 кинотеатров в Москве и других городах. Оборудование Auro-3D уже установлено в двух студиях - «Пифагор» и «Нева-Фильм». Всего более 100 студий по всему миру создают и дублируют фильмы в формате Auro-11.1 by Barco.

Прежде всего, формат хорош тем, что для студий и кинотеатров обходится дешевле. Официальный сайт Auro-3D указывает такие плюсы:

Отсутствие платы за лицензию

Минимальный объем усилий по распространению

Возможность использовать созданный контент в этом формате на системах Auro- 11.1 by Barco

Удобный переход от DCP к эквивалентному качеству на Blu-ray

Простота последующего преобразования

Возможность записи в формате Auro-11.1 by Barco непосредственно на съемочной площадке

Отсутствие необходимости в дополнительном мастеринге DCP и ключах

Дополнительные каналы кодируются непосредственно в мастер 5.1 (7.1)

Полная совместимость с миксом в 5.1 (7.1)

Не нужно тратить время на дополнительную перезапись в другом формате

Возможность использовать функцию «up mix» для готовых фильмов в формате стерео, 5.1, 7.1 для воспроизведения в Auro-11.1 by Barco

Где контент?

Поначалу, когда формат только зарождался, контента было мало. Но сейчас ситуация изменилась: в формате Auro-3D есть и музыка, и фильмы. Списки фильмов и музыки, а также будущих кинотеатральных релизов, опубликованы на сайте Auro-3D.

У вас есть телевизор, Blu-ray плеер, игровая консоль, но для финальной картины вам не хватает оглушающе объемного звука. Имеет смысл приобрести ресивер, так как подвод всех кабелей может стать сложной задачей, особенно в сравнении с подключением DVD-плеера к вашему телевизору. И это не упоминая о том, что все должно быть размещено правильно, а уровни – корректно установлены. Начните с Шага 1, указанного ниже, для правильной установки в первый раз, и вы сможете вернуться к наслаждению тем, что любите.

Шаги

Часть 1

Расположение динамиков

Количество динамиков, которые вы будете подключать, определяет тип объемного звука, который вы получите в итоге. Самые распространенные схемы: 2.1, 5.1 и 7.1. 2.1 –это два фронтальных динамика и сабвуфер (обозначаемый как.1). 5.1 – это два фронтальных динамика, центральный и два динамика объемного звука и сабвуфер. 7.1 –это два фронтальных, один центральный, два динамика объемного звука, два тыловых и сабвуфер. Следуйте следующим пунктам до правильного расположения доступных вам динамиков.

Часть 2

=Сабвуфер

Часть 3

=Фронтальные динамики

    Расположите фронтальные динамики с обеих сторон от телевизора. Убедитесь в том, что динамики расположены в соответствующих местах, если они маркированы.Фронтальный динамики должны быть расположены на одинаковом расстоянии от телевизора: обычно это расстояние составляет около метра.

    Выберите угол расположения динамиков. Каждый динамик должен быть направлен точно в направлении центра зоны размещения слушателя.

    Поднимите динамики. Для наилучшего качества звука фронтальные динамики должны быть подняты на уровень ушей слушателя. Вы можете использовать стойки для динамиков для домашней стереосистемы.

    • Если вы используете систему типа 2.1, то вы закончили с установкой динамиков и можете перейти к секции Подключение Динамиков.

    Часть 4

    =Центральный канал

    Часть 5

    =Канал объемного звука

    Часть 6

    =Задний канал

    Часть 7

    Подключение динамиков
    1. Разместите ресивер у своего телевизора. Все системы объемного звука проходят через ресивер. Ресивер передает входящий сигнал и посылает аудиосигнал на все присоединенные динамики. Ресивер должен быть расположен возле вашего телевизора, чтобы к нему могли дотянуться кабеля, и вам необходимо пространство вокруг него, чтобы он мог должным образом вентилироваться.

      Выключите всю аппаратуру. При установке динамиков существует возможность удара электротоком. Чтобы быть в безопасности, выключите все и отсоедините от розеток.

      Обследуйте подключение ваших динамиков. Некоторые системы объемного звука имеют порты для каждого динамика, так что вы можете правильно подключить все штекеры. Другие используют соединители для подключения проводов к ресиверу. Если ваша система использует соединители, то вам понадобятся кусачки для провода, которыми можно обнажить контакты от защитной оболочки.

      Начните пропускать кабели. Сделайте все возможное для того, чтобы спрятать проведенные провода. Это не только будет выглядеть лучше, но и обезопасит людей и животных от запутывания в них и повреждения ваших динамиков.

      • Если вы можете, то пропустите провода под ковром или через стены. Это позволит вам добиться наиболее презентабельного внешнего вида вашей системы.
    2. Соедините динамики. Если кабеля ваших динамиков уже имеют разъемы, то просто подключите их в соответствующие порты на задней панели ресивера. Если вы используете стандартные кабели для соединения динамиков с ресивером, вам нужно будет пройти через несколько дополнительных шагов.

      • Отмерьте длину ваших кабелей. Отмерьте нужную вам длину кабеля от катушки. Отмерьте немного большую длину кабеля, чем вы отмерили, чтобы обеспечить себе зазор для того, чтобы спрятать провод и без проблем подключить его.
      • Оголите один конец. Используйте кусачки, чтобы оголить два сантиметра изоляции с кабеля. Вы увидите две раздельных жилы. Убедитесь в том, что вы не сняли слишком много изоляции с провода, иначе вы можете коснуться его или вызвать короткое замыкание.
      • Провода, соединяющие динамики, состоят из двух различных кабелей: положительный и отрицательный. Оба они абсолютно одинаковы, но должны быть присоединены к динамикам и ресиверу. Для примера, если вы подсоедините один из двух проводов к положительно заряженной клемме динамика, то вам необходимо присоединить тот же провод к положительной клемме ресивера.
    3. Присоедините сабвуфер. Большинство сабвуферов присоединяются к ресиверу посредством стандартного RCA-кабеля. Вы можете приобрести дорогие кабели для сабвуфера, но в большинстве случаев вы не услышите разницы в сравнении со стандартным кабелем.

      • Порты на ресивере обычно обозначены как "sub out" или "sub preout".
      • Если ваш сабвуфер не имеет множества входов, присоедините только один, отмеченный как "LFE in" или крайний левый, если обозначений на нем нет.
      • Используя ручки на задней части сабвуфера, установите громкость на половину и выключите фильтр низких частот переводом ручки в верхнее положение.

    Часть 8

    Подключение вашего оборудования

    Постарайтесь избежать установки ваших устройств (DVD-плеера, спутникового ресивера, и.т.д.) одного над другим. Это может привлечь к тому, что все они будут генерировать слишком большую температуру, что может привести к поломке оборудования. Также отметьте, что некоторые старые устройства могут использовать оптическое соединение для передачи объемного звука, в то время как все современные устройства используют протокол подключения HDMI.

    1. Подключите все HDMI-устройства к ресиверу. Большинство современных ресиверов поддерживает вход и выход по протоколу HDMI, что позволяет вам подключать HDMI-совместимые устройства к ресиверу, а затем подключите ресивер к телевизору.

      • Если доступно возможность подключить множество HDMI, то подключайте устройства в том порядке, в котором вы хотите чтобы они отображались в меню ресивера.
      • HDMI передает аудио и видеосигнал, поэтому нет необходимости подключать другие кабели.
    2. Если вы используете старое оборудование,не поддерживающее HDMI, вы можете присоединить его через компонентный кабель. Это кабели с пятью разъемами: три для видео и два для аудио.

      • Подключите три видео разъема соответствующих цветов в устройство, которое вы хотите подключить.
      • Подключите два аудио разъема соответствующих цветов. Убедитесь в том, что они также подключены и к видео выходу, так как в противном случае звук не будет идти вместе с видео.
    3. Присоедините все компонентные устройства. Существуют также старейшие модификации, использующиеся до сих пор: три композитных разъема с одним разъема с одним штекером для видео и двумя для аудио. Это соединение передает сигнал самого низкого качества из тех, которые поддерживают системы объемного звука.

      • Присоедините желтый (видео) штекер к одному из доступных совпадающих входов, а затем присоедините аудио кабеля к соответствующим аудио выходов.
    4. Подключите телевизор к ресиверу. Для получения наилучшего результата используйте HDMI соединение для присоединения телевизора кс выходным портом ресивера. Вы можете использовать и другие типы соединения, но в результате вы получите более низкое качество. Большинство современных телевизоров поддерживают HDMI.

Данная статья основана на моей дипломной работе по теме «Разработка принципов имитации объемного звучания в развлекательной сфере», кафедра информационных технологий, МАИ 2011 год. Для адаптации текста вырезаны сухие статистические данные, язык сделан более живым, вставлены отсылки к книгам и статьям, которые я могу порекомендовать. Затронутые вопросы будут интересны тем, кто еще только изучает механизмы локализации звука. Программная часть в статье не затрагивается. Для дополнительного интереса из статьи не вырезана практическая часть создания бинаурального манекена-микрофона.

Хочу выразить благодарности Борису Климову за создание эксклюзивных иллюстраций, а так же Надежде Гурской за анализ и правки текста.

Введение

Основная цель виртуальной реальности «погрузить» человека в пространство игры, действия на экране (фильм, мультфильм, 5D кинотеатр) настолько, чтобы на время он забыл о реальности мира окружающего.

О понятиях «Immersion», а так же «Suspension of Disbelief» по отношению к звуку и музыке можно прочитать в книге Winifred Phillips – A Composer’s Guide to Game Music.

Объемное звучание – залог того, что человек сможет ощутить эффект «присутствия». Восприятие звукового пространства, очевидно, было востребовано еще задолго до появления средств записи звука: на протяжении веков создавались помещения, такие как храмы, театры, концертные залы, где обеспечивалось «погружение» слушателя в звуковое пространство путем создания естественного акустического эффекта - реверберации. Научные исследования поведения акустики в концертных залах фирмой «Bose» показали, что приблизительно 11% доходит до слушателя напрямую, остальной процент звука приходит в отраженном виде от стен, пола и потолка и других объектов вокруг слушателя, тем самым создавая объем звука. С информативной точки зрения 25% информации об окружающем мире, получаемой человеком, приходится на звук.

Подход к звуку в современных кинотеатрах приучает слушателя к тому, что звук может и должен быть качественным и реалистичным. Профессиональными разработчиками современных игровых приложений работе со звуком отводится до 40 процентов бюджета и временно-людских ресурсов. С другой стороны некоторых разработчиков игр и приложений ещё надо убедить потратить время и средства на реализацию качественного звука.

На тему различных подходов интересно почитать статьи «Озвучивание компьютерных игр» 1 и 2 части от Кристофера (свободно ищется в интернете).

Восприятие звука человеком

Человеческий слух способен воспринимать звук в диапазоне от 16-20 Гц до 15-20 кГц. Звуки с частотой ниже 20-30 Гц (инфразвук) воспринимается не органом слуха, а осязанием, например, через вибрацию поверхностей. Частоты предельных нижних значений слышимого спектра могут восприниматься через резонансы внутренних органов человека. При небольшой интенсивности звук низкой частоты оказывает дополнительное эмоциональное воздействие (например, популярный эффект sub drop).

Уменьшение диапазона слышимых частот связано с изменениями во внутреннем ухе и с развитием возрастной нейросенсорной тугоухости. К 60-и годам слышимый диапазон на верхней границе становится не выше 10-12 кГц. Так как основной контингент развлекательной сферы люди молодые, то воспринимаемый слухом диапазон должен учитываться в полной мере. Но и специалист по звуку должен обладать полноценным слухом, слышать неестественность и неполноту тембра, мочь выявить резонансы. И что не маловажно - беречь слух от перегрузок. Многие люди в музыкальной-звуковой сфере испытывают постоянные нагрузки от звукоусиливающей техники и громких акустических инструментов (как и я сам, за более чем 12 лет игры на ударных инструментах). Современный человек подвержен негативному воздействию окружающих шумов, что снижает его чувствительность, притупляет верхние границы частот раньше естественной тугоухости. Не нужно пренебрегать такими средствами защиты слуха, как беруши. Также негативное влияние могут оказывать звуки низких частот.

Подробно с негативным воздействием звука (в том числе технического) можно ознакомиться в книге Чедд Г. – Звук.

Восприятие звука индивидуально, оно зависит от конфигурации (формы) ушной раковины, физиологических особенностей, возраста и от психологического настроя в конкретный момент. В рассматриваемой сфере восприятия звука также зависит от:
- средств воспроизведения (динамики воспроизводящего устройства, наушники, колонки, многоканальные системы),
- помещения в котором осуществляется прослушивание,
- качества средств преобразования (например, реализация звукового процессора, движка),
- соблюдения принципов создания правильной звуковой картины, если речь идет о саунд-дизайне.

Механизмы локализации источника звука человеческим слухом

Способность человека локализовать источник звука в пространстве строится на принципе бинаурального слуха. Бинауральное (от лат. bini - «два» и auricula - «ухо») строение слуховой системы заключается в различном восприятии звуковых сигналов пришедших на правое и левое ухо. Алгоритм локализации источника звука:
- звуковой сигнал, исходящий от источника звука и переотражений помещения, попадает во внешнюю часть слуховой системы, где конфигурация ушной раковины позволяет передать во внешний слуховой канал уже частотно обработанный сигнал,
- сигнал проходит в барабанную перепонку человека, в силу вступают механизмы внутреннего уха,
- из внутреннего уха информация поступает в отделы головного мозга, где на основе анализа сравнения сигналов, поступивших с каждого из слуховых каналов, делаются выводы о расположении звукового источника.

Человеческий мозг сравнивает информацию, пришедшую из барабанных перепонок, с той информацией, которая уже хранится в памяти.

Рис. 1. Строение внешней части слуховой системы человека

Подробно об устройстве внешнего и внутреннего слуха и о многих другом можно прочитать в книге Ирины Алдошиной и Роя Приттса – Музыкальная Акустика, глава «Восприятие звука. Основы психоакустики»

Для определения месторасположения звукового источника в пространстве слуховая система использует основные механизмы локализации: по разнице во времени, по разнице интенсивности, по разнице амплитудно-частотного спектра. К вспомогательным механизмам относятся отражения звука от туловища и плеч человека, реверберация, окклюзии (звук, прошедший через препятствие), обструкции (звук отфильтрованный препятствием), эффект Доплера, эффект Хааса (эффект предшествования). Не стоит забывать про эффект психологического восприятия: при несоответствии источника в видимом пространстве со звуком или нарушении синхронности качество локализации резко падает.

Определять пространственное положение источника звука приходится при наличии звуковых помех. Существуют естественные механизмы помехоустойчивости слуховой системы. Один из них проявляется в бинауральном освобождении от маскировки. Феномен состоит в том, что локализовать звуковой сигнал на фоне статичных помех (например, шумов окружения) легче.

Пару слов о прозрачности звучания. Приведу известный пример. Представим несколько контурных рисунков животных, наложенных друг на друга. Опознавание совмещенных в пространстве рисунков тем сложнее, чем ближе формы изображенных животных (термин форма имеет тот же смысл, что и в звуковом сигнале). Если же эти рисунки разнести в пространстве, то задача определения животного по форме становится значительно проще.

Локализация по временной разнице (фазовая локализация)

Данный механизм работает на частотах от 300 Гц до 1,5 кГц. За счет разницы между положением левого и правого уха звук, приходящий от источника, расположенного под углом к фронтальному направлению, затрачивает различное время для достижения барабанных перепонок.


Рис. 2. Схематичный пример фазовой локализации

При одинаковом времени, затрачиваемом для достижения сигнала левого и правого уха, данный механизм будет локализовать источник в азимуте 0 и 180 градусов. Различное время достижения барабанных перепонок приводит к появлению фазового сдвига. Слуховая система различает фазовый сдвиг до 10-15 градусов. С повышением частоты, а соответственно, с уменьшением длины звуковой волны, фазовый сдвиг сигналов, пришедших от одного и того же источника к разным ушам, увеличивается. Как только сдвиг достигает значения, близкого к половине длины звуковой волны механизм перестает работать. Человеческий мозг не может однозначно определить, отстает ли звуковой сигнал в одном из слуховых каналов от другого или, наоборот, опережает его.

Максимальная разница во времени, соответствующая полному смещению источника звука вправо или влево, не может быть больше 630 мкс.

Расстояние между правым и левым ухом взрослого человека составляет 0,15 м-0,20 м, если брать среднее значение по полу. При источнике, излучающем звуковую волну с частотой 20 Гц и скорости звука в 340 м/с, длина волны будет составлять 17 м. Соответственно, если человек повернется к источнику одной стороной, то фазовый сдвиг сигналов, пришедших в одно ухо, а затем в другое, будет составлять примерно 1,1 % от всего периода 20 Гц волны (локализации на таких низких частотах невозможна). Физиологически точность локализации зависит от размера головы, то есть расстояния между ушами. Чем больше это расстояние, тем с большей разницей приходят звуковые сигналы в каждое ухо.

При излучении звука источником, расположенным под определенным углом к фронтальному направлению, уровень звукового давления на барабанные перепонки в разных ушах будет различным. Это связано с тем, что одно ухо будет находиться как бы «в тени», которую создает голова, а также с тем, что звуковые волны выше 1000 Гц сравнительно быстро затухают в пространстве.


Рис. 3. Схематичный пример локализация по уровню интенсивности

Данный механизм является достаточно эффективным, но в диапазоне звуковых частотах от 1600 Гц. При длине звуковой волны, сравнимой с диаметром человеческой головы, дальнее от источника ухо перестает находиться в «акустической тени», что обусловлено явлением дифракции звуковой волны на поверхности головы. При этом опытным путем было выявлено, что способность человеческим слухом определения угла между двумя источниками в горизонтальной плоскости в области частот 1500-2000 Гц резко снижается.

Такой механизм способствует определению расстояния до источника звука. Однако уровень звука от слабого, но близко расположенного источника может быть таким же, как от мощного, но удаленного на значительное расстояние. При таких условиях локализации способствует следующий механизм.

Локализация по разнице амплитудно-частотного спектра

Механизм основывается на возможности анализа мозгом АЧ провалов и подъемов определенных частот в сложном сигнале. Звук, приходящий под углом 90°, содержит как низкочастотные, так и высокочастотные составляющие, а в спектре звука, действующего на дальнее ухо, высокочастотных составляющих будет меньше - экранирующее воздействие головы. Кроме того, звуковой сигнал по-разному отражается от участков ушной раковины, происходит усиление и ослабление различных участков звукового спектра.

Данный механизм отвечает за локализацию фронт-тыл и вертикальную плоскость. Изучение фильтрующего действия головы и ушных раковин слушателя позволило ввести понятие пеленговых полос. При локализации человек анализирует не весь спектр приходящего звука, а лишь изменения некоторых частот. Такие полосы сформировались эволюционно, слух выработал собственную систему отслеживания и предупреждения опасности, достаточно точно локализуя откуда исходит угроза.

Изменения в полосах от 16 до 500 Гц и от 2 до 6 кГц отвечают за локализацию передних источников звука. Полоса от 0,7 до 2 кГц - изменение тембра источников, которые могут располагаться сзади.

Сигнал со сложным спектральным составом локализуется лучше, а ощущение направления «фронт-тыл» формируется преимущественно теми полосами направления, в которых сосредоточена большая часть мощности сигнала. Чистые тона, которые, практически не встречаются в природе локализуются хуже сложных сигналов. Так, чистые тона свыше 8000 Гц поддаются локализации с трудом. Невозможно определить и местоположение источников звука низкой частоты - менее 150 Гц.

Локализация в вертикальной плоскости гораздо хуже, чем в горизонтальной. Без психологического, зрительного воздействия практически невозможно создать имитацию объекта, который должен располагаться, например, сверху. Этот звук должен быть как минимум привычный и ожидаемый.

Гибсон Д. в своих книгах и видео выдвигает концепцию о вертикальном расположении инструментов в музыкальном миксе по их звуковысотности (тесситуре) или форманте (область усиленных частичных тонов), так как в вертикальной плоскости звуковоспроизводящая техника построена по такому же принципу. За счет акустического кроссовера с определенными границами сложный сигнал делится на полосы частот. В трехполосной системе снизу расположен woffer предающий НЧ, в средней части mid-driver для СЧ и tweeter в верхней части системы для передачи ВЧ. А sub-woffer передает часть информации через пол. Такой подход интересен, но не подходит для многих систем, например, при использовании наушников или любой другой системы без разделения на полосы.

Подробнее с описанными принципами можно ознакомиться в книге Гибсон Д. - Визуальное руководство по звукозаписи и продюссированию.

Тем не менее уменьшение интенсивности низких частот психоакустически помогает «приподнять» объект, сделать его легче.

Перемещение источника звука

До 1960-х годов изучение способности человека локализовать источник звука в пространстве в основном касалось неподвижных источников звука. После же началось исследование восприятия человеком и движущихся источников звука: определялись основные характеристики восприятия.

В ходе исследований оказалось, что для того, чтобы у человека возникло ощущение движения звука, необходимо определенное время - временное окно. Оно колеблется от 0,08 до 0,12 с. Локализовать же короткий неподвижный звук (например, щелчок длительностью порядка 0,001 с.) достаточно легко.

Так же человек может различать скорость движения источника звука: чем она выше (в определенных пределах), тем тоньше эта способность. Если источник звука движется со скоростью 90°/с (движение по полупериметру перед головой испытуемого), человек различает изменение скорости на 15%; а при скорости движения 360°/с - на 5,5%.

Если источник является неподвижным, то для его локализации человек подсознательно совершает микроперемещения головы, на порядок повышающие точность определения положения источника в пространстве.

Эффекты

Для того чтобы правдоподобно передать звук от движущегося источника, необходимо учитывать (эффект изменения частоты звука от источника при нерадиальном перемещении его относительно слушателя). По субъективному ощущению эффекта звук резко меняет тон - становится более высоким при приближении объекта и более низким при его удалении. В игровой сфере эффект Доплера играет значимую роль. Особенно, если речь идет об авто симуляторах и других приложениях связанных с быстрым перемещением объектов. Эффект Доплера распространённым плагином для секвенсоров, а также, на сколько мне известно, существует во многих звуковых движках.

Одним из основных эффектов создания пространства является эффект реверберации (процесс многократного переотражения звукового сигнала от различных поверхностей с постепенным уменьшением его интенсивности). У моделируемой реверберации существует ряд параметров - время раннего отражения, время позднего отражения, скорость затухания, процентное соотношение «сухого» сигнала с обработанным. Эти параметры указывают на размер помещения и место источника звука в нем относительно слушателя. В работе я использую исключительно конволюционные (сверточные) ревербераторы, применяя к ним импульсы реальных помещений. Не вдаваясь в подробности технологии сам импульс представляет из себя шумовой «слепок» помещения (wav файл), который модулирует исходный звуковой файл, тем самым помещая его в имитируемое пространство. В музыкальной сфере конволюционные технологии давно используются, так в оболочке Kontakt (4,5) от NI конволюционный ревербератор с набором импульсов имеется в списке стандартных эффектов.

Звуковые системы. Бинауральная система

Существует два основных подхода по организации современных звуковых систем в помещении: многоканальные системы и двухканальные системы (в том числе и наушники). В многоканальных системах звук передается из мониторов, размещенных спереди и сзади от слушателя (либо вокруг него).

Подробно с монофоническими, бинауральными, стереофоническими и многоканальными системами и их тонкостями можно ознакомиться в книге Ю. Ковалгина - Стереофоническое радиовещание и звукозапись.

Для усиления пространственного эффекта производители пытаются продвигать концепции систем уже не пяти-, а шести-, семи- и даже девятиканальные. Увеличение количества каналов требует усложнение работы звукорежиссера, увеличения количества акустических систем, коммутационных проводов, применения более сложных усилителей, а, следовательно, позволяет увеличивать доходы с продаж.
Не всем потребителям необходимы многоканальные аудиосистемы. Для кого-то это неприемлемо по экономическим соображениям, кто-то не может выделить под систему домашних развлечений помещение в жилом помещении. Кто-то по очевидным причинам предпочитает пользоваться наушниками (в ночное время суток, при перемещении в транспорте и т.д.).

Всего два уха обеспечивают человека всей необходимой информацией об объекте, это значит, что для ее передачи достаточно всего лишь двух громкоговорителей. При использовании бинауральной записи кажущиеся источники звука в случае применения наушников оказываются вынесенными за пределы головы слушателя в то место, где расположены действительные источники звука. В отличие от этого, при прослушивании через наушники сигналов обычной стереофонии кажущиеся источники звука ощущаются как расположенные внутри головы слушателя.

Появление реверберации затрудняет оценку азимута кажущихся источников звука в тыловой области, где слушатели вместо истинного направления часто указывают соответствующее ему зеркальное фронтальное направление. Данное явление возникает особенно часто, когда время стандартной реверберации в помещении прослушивания превышает 0,3 с.

Правильная передача пространственной информации при воспроизведении с помощью двух мониторов возможна, но даже незначительное (около 9-15 см.) смещение центра головы слушателя влево или вправо от этой точки приводит к тому, что локализация кажущихся источников звука оказывается невозможной вне фокуса осей мониторов.

В оптимальной точке прослушивания бинауральная система обеспечивает звучание, уверенно предпочитаемое обычному стереофоническому. Однако ее применение весьма ограничено: воспроизведение с помощью наушников, переносная аппаратура радиовещания и звуковоспроизведения, компьютерное моделирование. Бинауральная звуковая система мало пригодна для условий коллективного прослушивания.

При воспроизведении бинаурального сигнала через акустическую систему из-за попадания сигнала правого канала в левое ухо слушателя и наоборот возникают перекрестные искажения.

В реалиях игрового саунд дизайна записанные бинауральные аудио файлы не применяются, потому как невозможно изменять их положение в пространстве, нет виртуального источника и виртуального слушателя, это не моделирование.

Алгоритмы

Основной алгоритм, использующий основные механизмы локализации звука человеком, реализован в HRTF (Head Related Transfer Functions - функции перемещения звука относительно слушателя. Количественно HRTF определяются обратным интегральным Фурье преобразованием коэффициентов под названием HRIR (Head Related Impulse Response), которые в первом приближении определяются отношением давлений на барабанную перепонку уха звуковой волны в свободном пространстве (free field) и в реальном пространстве с учётом головы человека, ушных раковин, его корпуса и других препятствий.

HRTF представляет собой сложную функцию с четырьмя переменными: три пространственных координаты и частота. При использовании сферических координат для определения расстояния до источников звука больших, чем один метр, принимается, что источники звука находятся в дальнем поле (far field),значение HRTF уменьшается обратно пропорционально расстоянию. Большинство измерений HRTF производится именно в дальнем поле, при этом количество переменных уменьшается до трёх: азимут (azimuth), высота (elevation) и частота (frequency). Действие HRTF зависит от частотного диапазона обрабатываемого сигнала: только звуки со значениями частотных компонентов в пределах от 3000 Гц до 10000 Гц могут успешно интерпретироваться с помощью функций HRTF. Если сигнал от источника звука не содержит особую частоту, влияющую на разницу между фронтальными и тыловыми HRTF функциями, то такой сигнал никогда будет локализован по направлению фронт-тыл.

HRTF моделировался при помощи манекена KEMAR (Knowless Electronics Manikin for Auditory Research) и специального «цифрового уха» (digital ear), разработанного компанией Sensaura. В ушах манекена размещаются микрофоны, а вокруг манекена - акустические колонки, в результате происходит запись того, что слышит каждое «ухо». Получаемые при таком моделировании результаты используются для пополнения базы данных по HRTF, которые затем могут быть использованы для интерактивного выбора параметров при воспроизведении позиционируемого 3D звука (в базе данных компании Sensaura накоплено более 1100 HRTF). Необходимость в такой базе данных объясняется, во-первых, различием размеров и формы головы и ушных раковин манекена и потенциального слушателя и, во-вторых, определяемых этими параметрами так называемой зоны sweet spot, в которой корректно воссоздаётся эффект звучания в вертикальной плоскости и гарантируется правильное определение местоположения источников звука в пространстве. Чем больше область sweet spot, тем большую свободу действий имеет слушатель. Поэтому разработчики постоянно ищут способы увеличить область действия sweet spot.

Компания QSound при реализации технологий с HRTF опирается не только на математические методы, но и на апробацию слушателями (таких прослушиваний было проведено около 550 тыс.). Специалисты компании Sensaura после серии опытов определили, что HRTF в чистом виде «работает» только при воспроизведении через наушники. Моделирование звука в этом случае тривиальная задача: каждый динамик контролирует соответствующее ему ухо. Однако при воспроизведении того же самого звука через колонки правое ухо слышит также звук, призванный «обманывать» с точки зрения трехмерности левое, и наоборот. Для исключения этого явления требуется добавить в звук дополнительные компенсационные вычисления. Удачные алгоритмы компенсации были разработаны, они получили название Transaural Cross-talk Cancellation (TCC). Решена задача была с помощью другой идеи инженеров Sensaura. Она заключается в том, что функции HRTF действуют только для среднестатистического уха, так как выведены с помощью одного манекена или усредненных показаний большой группы людей. Sensaura разработала цифровую модель уха, в которой можно задавать параметры ушной раковины. С помощью этой цифровой модели сочетанием разных параметров можно воспроизвести форму практически любого уха. Получившийся драйвер цифрового уха работает так: при его установке человек слушает ряд тестовых звуков и настраивает параметры драйвера, чтобы наилучшим образом ощущать трехмерность звука. Индивидуальные параметры слушателя записываются в специальный «профиль», он впоследствии и используется приложениями.