Локализация звука

Трехмерный звук наверняка является одной из самых животрепещущих тем, волнующих почти всех, занимающихся моделированием различных звуковых процессов. Кроме того, это и бурно развивающаяся сфера науки, разработки которой постоянно пытаются войти в наш быт.

Около месяца назад я ознакомился с рядом материалов исследований, проводимых научно-исследовательскими лабораториями и финансируемых NASA. Речь идет о результатах ряда очень интересных экспериментов, аналогов которым я еще не встречал.

Многие из них лишь подтвердили мои мнения насчет очень важных вопросов о звуковых ощущениях человека и дали повод для размышлений. И теперь эту тему я могу осветить с полным знанием дела. То, что было на уровне догадок, получило доказательства.

Ознакомившись с полученной документацией, я заинтересовался рядом графиков и решил применить некоторые данные из них для своих исследований.

Итак, начнем с того, что наши уши - это целый навигационный прибор. Думаю, секрета в этом ни для кого нет. Другой вопрос заключается в том, что левое и правое уши по-разному слышат, в результате чего мы можем более полноценно ориентироваться в пространстве.

 

Причем разность в слышимых частотах возникает на частотах чуть выше 1000 Гц. То есть, если мы слышим звук, то правое и левое уши воспринимают некоторые частоты с разной громкостью. Даже если источник расположен прямо напротив нас, разница существует. Также можно говорить и о разности фаз, возникающих на средних и верхних частотах при ощущениях правого и левого ушей. Именно это и определяет наше восприятие пространственного положения источника звука.

И как не удержаться от опыта. Я использовал стереофайл, образованный из монотрека, в результате у меня был идеальный центровой источник (который воспринимался в центре). После этого взял программу с параметрическим эквалайзером и стал изменять по отдельности параметры каждого из треков. Примеры линий, выставленных мной, можно увидеть на рисунке. В результате я смог позиционировать звук в наушниках благодаря только одному эквалайзеру!

Причем довольно отчетливо было слышно позиционирование на 45, 135, 270 градусов относительно меня, то бишь слушателя.

Сначала, для быстрого эффекта, я стал пользоваться простым графическим эквалайзером. Показалось, что позиционирование идет только за счет уменьшения громкости. Но потом, взяв на вооружение параметрический эквалайзер, я понял, что в моих руках очень мощный 3D инструмент, и в наушниках стало возможным изменять положение источника звука по другим плоскостям. Причем, постоянно изменяя некоторые величины значений амплитуды в спектре частот 6-10 кГц, я получал радикально новые позиции звука.

3D получилось проще пареной репы. Хорошо, но надо идти до конца, и я поставил задачу сфокусировать звук перед собой, что, как мне казалось, самое сложное в данном вопросе. Оказалось, ничуть. Голос Suzanne Vega стал передо мной как вкопанный. Для этого мне было достаточно правый канал поднять на частоте примерно 2400 Гц, а левый - 10000 и выше. Вы можете сами попробовать сделать примерно то же самое и понять, что применяя одни и те же действия, но меняя при этом каналы, вы получаете различные ощущения. Теперь перейдем непосредственно к рисункам. Это иллюстрации результатов опытов, проводимых в университете штата Висконсин в 1988 году. Здесь отражены ощущения человека правым и левым ушами в зависимости от локализации источника. Каждый рисунок отражает четыре различных позиции (0, 45, 135 и 270 градусов по часовой стрелке).

Какие выгоды можно из этого извлечь? Просто попробуйте выставить эквалайзеры по тем линиям, что нарисованы. Установки для правых и левых каналов должны отличаться соответственно линиям амплитуды, показанным на рисунках.

К сожалению, в моем инструментарии не нашлось Offset'а, который бы делал фазировку по частотам. Но я поступил следующим образом - сделал много треков и поработал с ними эквалайзером так, чтобы от звука остались только определенные спектры частот, начиная от средних и заканчивая высокими, причем каждый диапазон соответствовал отдельному треку. В результате, в моем эксперименте было задействовано по 24 трека на каждый канал. Каждому треку я присвоил определенное значение фазы, соответственно рисункам. Для правого и левого они, конечно, отличались. Картина стала впечатлять именно своей большей реалистичностью расположения источника звука.

Надо идти дальше. Но расчеты стали намного сложнее, поскольку с фазой изменилась амплитуда. В результате, пришлось попотеть и поругаться на себя нецензурно за то, что взял 48 треков.

Итак, картина получилась потрясающей. Звук стоял ровно в той позиции, которую я ему задавал.

После этого я привнес некоторые изменения. У меня ведь присутствовали только средние и высокие частоты. Для этого я взял исходный файл и вырезал эквалайзером вышеназванные частоты. В результате остались одни "низы". И, действительно, панорамное положение "низкого" трека не меняло картины существенно. Положение источника звука оставалось неизменным.

Мои же выводы из данных опытов таковы: локализация источников звуков не зависима от низких частот, и на базе современного РС можно создавать виртуальные источники звука с заданными положениями в пространстве.

За сим оставляю Вас с размышлениями.

Кристофер М. ИХИХО,
chris@tm.minsk.by

Версия для печатиВерсия для печати

Номер: 

25 за 1999 год

Рубрика: 

Multimedia
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!