М. А. Гурылёва
ХУДОЖЕСТВЕННО-ЭСТЕТИЧЕСКИЙ АСПЕКТ ВОПРОСОВ ПАНОРАМИРОВАНИЯ ЗВУКОВЫХ ИСТОЧНИКОВ В СОЗДАНИИ СТЕРЕООБРАЗОВ
Работа представлена кафедрой режиссуры мультимедиа Санкт-Петербургского гуманитарного университета профсоюзов.
Научный руководитель - доктор технических наук, профессор И. А. Алдошина
В статье представлен анализ основных художественно-эстетических особенностей, возникающих в панорамировании звуковых источников при создании стереообразов, особенности переноса пространственных характеристик звукового поля в стереосистемах, панорамирование звукового источника, вопросы обеспечения точной локализации, методы, используемые в процессе стереопа-норамирования, математические закономерности.
Ключевые слова: стереофония, панорамирование, локализация.
M. Gurylyova
ARTISTIC AND AESTHETIC ASPECT OF SOUND SOURCES' PANNING IN CREATION OF STEREO IMAGES
The author of the paper analyses the main artistic and aesthetic features emerging in panning of sound sources during stereo images' creation. The paper is focused on the peculiarities of transferring the spatial characteristics of a sound field in stereosystems, problems of accurate localisation provision, methods used in the stereo panning process and mathematical regularities.
Key words: stereophonics, panning, localisation.
С момента появления возможности звукозаписи и с выявлением новых специфических средств художественной выразительности возник вопрос о художественно-эстетических
Музыкальное выражение - это разновидность символического выражения, предназначенная для восприятия на слух, в ходе которой, независимо от того, движется объект или нет, он не копируется и не изображается, а воспроизводится в воображении, причем совершенно особым и каким-то непостижимым способом, поскольку здесь едва ли можно найти какую-нибудь связь между означаемым и означающим.
Гете в письме к Целтеру 6.03.1810
особенностях панорамирования звуковых источников в пространственной звуковой картине.
Цель данной статьи - анализ основных художественно-эстетических особенностей,
возникающих в панорамировании звуковых источников при создании стереообразов.
Процесс создания звуковой картины, будь она самостоятельной аудиофонограммой или звуковым оформлением видеоматериала, заключается в синтезе художественных, творческих и технических особенностей. Построение звуковой композиции требует: учета особенностей зрительно-слухового пространственного восприятия; философско-психологического обоснования творческой идеи, решения художественно-эстетических задач звукового построения общей картины, а также применения специальных технических средств, необходимых для реализации поставленной задачи.
Опыт переноса пространственных характеристик звукового поля был впервые реализован в звуковых системах, получивших название «стереофония», о которых было заявлено в 30-е гг. ХХ в. С 1950-х гг. стереозвук занял ведущее место при создании аудиотехники, а передовым звеном в использовании пространственного звука стала киноиндустрия. Уже к концу 1960-х гг. исследования в области улучшения стереообраза привели к таким новшествам, как запись многоканальной звуковой информации на кинопленку, применение добавочного центрального громкоговорителя для расширения зоны стереоэффекта, воспроизведение звука через несколько громкоговорителей.
Термин «стереофония» может быть обозначен следующим образом: стереофония или стереозвук (от др.-греч. «стереорос» - твердый, пространственный и «фон» - звук) - это запись, передача или воспроизведение звука, при которых сохраняется звуковая информация о расположении источника посредством распределения звука через два независимых аудиоканала [5].
Стереовпечатление слушателя зависит от многих факторов: общей акустической атмосферы, точности локализации звуковых источников, ширины звуковой панорамы, баланса и пр. Благодаря стереофонии у специалистов впервые появилась возможность воспроизводить звучание первичной звуковой картины во вторичном помещении с наименьшими потерями звуковой информации.
В. В. Фурдуев в своей работе «Стереофония и многоканальные звуковые системы» [3] пишет: «Стереофоническая передача объективно отличается от монофонической сохранением некоторой части информации о положении и размещении первичных источников звука. При воспроизведении музыки эта информация сама по себе быть может и не представляет эстетической ценности; однако ее наличие влечет за собой такое новое качество звучания, которое, хотя и не поддается однозначному объективному описанию, тем не менее обеспечивает стереофонии бесспорное предпочтение по сравнению с монофонической передачей тех же самых музыкальных произведений».
Важную роль в создании пространственной звуковой картины играет процесс панорамирования звукового источника, определяющий направление, расположение и перемещение звукового образа в общей звуковой картине.
Панорамирование (в стерео) - это распределение и локализация положений кажущихся источников звука по стереопанораме [5].
Процесс панорамирования базируется как на психоакустических особенностях восприятия звука, таких как появление фантомного образа и его локализация, так и на технических возможностях звукозаписи.
Вопрос обеспечения точной локализации является весьма важным при создании пространственного образа как в стереофонии, так и в современных пространственных системах Surround Sound (Surround Sound - системы, обеспечивающие трехмерный звуковой образ, 360° в горизонтальной плоскости).
Способность локализовать звуковой источник в пространстве складывается из использования различных слуховых механизмов в горизонтальной, вертикальной и глубинной плоскостях.
Локализация в горизонтальной плоскости происходит благодаря способности слуховой системы дифференцировать угловые координаты источника по сдвигу времени прихода сигналов на левое и правое ухо (ITD) в области частот до 1,5 кГц. В области более высоких частот определяющим является разница уровней звукового давления на разных ушах за счет эффекта дифракции (IID), а также
различия в спектральном составе сигналов. Минимальная угловая разрешающая способность составляет 3°.
В вертикальной плоскости локализация происходит за счет эффектов дифракции на ушных раковинах, точность локализации достигает 15°.
Локализация по глубине происходит за счет изменения уровня звукового давления при удалении источника (уменьшения громкости), изменения спектра за счет затухания высоких частот и изменения соотношения энергии прямого звука и отраженных сигналов в помещении [1].
В настоящее время при создании полноценных пространственных звуковых образов существует несколько способов и возможностей для организации определенного распределения звуковых источников в общей пространственно-временной картине. Каждому способу распределения соответствуют свои характерные особенности, определяющие художественно-музыкальную смысловую нагрузку, качество звучания и возможность восприятия звуковых источников в общей пространственной звуковой картине.
Учитывая свойства бинаурального слуха, звукорежиссеры могут использовать в своей практике определенные законы панорамирования.
На сегодняшний день есть несколько методов, используемых в процессе стереопа-норамирования, таких как корреляционный, ассоциативный, а также интенсивностное и временное панорамирование [2; 4].
В корреляционной модели входные сигналы разделяются на критические полосы слуха, затем вычисляются корреляционные функции* для пар полосных сигналов. Локализация осуществляется по месту расположения пиков корреляционных функций. Ассоциативная модель относится к субъективной оценке звукозаписи и включает в себя два последовательных этапа обработки информации: 1) ассоциация местоположения реального источника в пространстве и 2) ассоциация формы источника.
Данные методы связаны между собой, иногда взаимозаменяют, иногда дополняют друг друга, но все направлены на достижение
главной цели - создание полноценной пространственно-временной звуковой картины.
В звукорежиссерской практике чаще всего используются методы временного и амплитудного панорамирования.
1. Временное панорамирование: на один громкоговоритель подается сигнал без искажений, на другой - сигнал с постоянной задержкой. В том случае, если слушатель находится симметрично относительно двух громкоговорителей, а разница по интенсивности сигналов равна нулю (ДЬ = 0), то при введении временной задержки в одном из каналов (т. е. когда ДТ ф 0) возникает ощущение смещения сигнала в ту сторону, где преобладает прямой сигнал.
Сейчас отдельно временное панорамирование, без совмещения с какими-либо другими способами, используется в основном для создания специальных эффектов.
2. Интенсивное панорамирование: на два громкоговорителя подаются сигналы разные по интенсивности. Если слушатель находится симметрично относительно двух громкоговорителей и разница по времени равна нулю (ДТ = 0), то в случае изменения интенсивности сигналов (ДЬ ф 0) происходит смещение фантомного образа в сторону канала с большей интенсивностью.
Для регулировки направления на звуковые источники в процессе создания стереокарти-ны были созданы специальные панорамные регуляторы, которые действуют по принципу интенсивного панорамирования: когда происходит усиление в одном канале, автоматически сигнал уменьшается в другом канале (для каждого трека отдельно) и, соответственно, изменяется локализация кажущегося источника звука.
Это позволяет изменять ширину стереоба-зы, создавать и смещать фантомные звуковые образы (правда, только во фронтальной горизонтальной плоскости). Расширить возможности панорамирования смогли разработанные позднее системы Surround Sound.
3. Смешанное панорамирование: сочетание временной и интенсивной стереофонии. В том случае, если слушатель находится симметрично относительно двух громкоговорите-
леи, а разница по времени и интенсивности не равна нулю (ДГ ф 0 и ДЬ ф 0), то, применяя временное запаздывание, а затем увеличивая интенсивность этого же громкоговорителя, можно создать выравнивание (компенсацию смещения) звукового сигнала для слухового восприятия. Однако взаимозаменяемость временного сдвига интенсивным возможна, только если А Г < ДГ", где ДГ" - пороговое значение временного сдвига [2]. Так, например:
Сигнал AT мс AT мс
Речь мужская 50 5...7
Большой барабан 50 6
Скрипка 100 9.12
Виолончель 100 21.30
Рояль 1000 16.20
[3].
4. Ассиметричное панорамирование.
В случае если слушатель находится несимметрично относительно двух громкоговорителей и разница по времени и интенсивности также не равна нулю (ATx,y ф 0 и AL x,y Ф 0), то появляются дополнительные временные и интенсивностные составляющие звуковых сигналов. Фантомный образ смещается к ближайшему громкоговорителю.
На первых этапах развития стереопанора-мирования усиления в каналах подбирали в основном эмпирическим путем, в настоящее время используются более точные математические закономерности, примеры которых приведены ниже.
Закон синуса
Финский ученый Ville Pulkki [4] предлагает трактовать закон синусов при панорамировании звуковых источников таким образом:
_ g1 - g2 Б^о = g1 + g2 '
где Qs - угол панорамирования виртуального источника (т. е. угол между централь-ноИ осью (ВС) и направлением на точку
расположения фантомного o6pa3jd), Qo - угол между центральной осью и сигналом, поступающим с громкоговорителя (A), g1,2 - коэффициент усиления соответственно одного и второго громкоговорителя, при этом
Sin Qo = b/c,
где Qo - угол между центральной осью и сигналом, поступающим с громкоговорителя (A) к слушателю, b - расстояние между громкоговорителем (А) и центральной точкой фантомного образа (С), c - расстояние от громкоговорителя до слушателя (В).
Разновидностью вышеуказанного закона является Закон косинуса
cos(п /2 - Qs) _g1 - g2 cos(п /2 - Qo) g1 + g2
, при этом cos Qo = a/c,
где a - расстояние между слушателем в центральной точке «sweet spot» (В) (наилучшая точка для прослушивания) и центральной точкой фантомного образа (С); c - расстояние между громкоговорителем и слушателем.
В своей работе исследователи J. C. Bennett, K. Barker, F. O. Edeko «Новый подход в оценке стереофонических систем» [4] предложили свой вариант расчетов, основанный на Законе тангенса:
tgQs = gl - g2 tgQo gl + g2 '
при этом tg Qo = b/a, где значения a и b указаны выше.
Еще одну закономерность предложил Chowning [4]. Данный закон применим в том случае, если слушатель находится вне центральной точки прослушивания.
{
g,
gm
= Qm - Qg Qm — Qn
= Qn — Qg ' Qn — Qm
n = 1, m = 2,
A
B
где gn и gm - коэффициент усиления соответствующих громкоговорителей; Qn и Qm - углы между громкоговорителями
D
B
S
и центральной точкой фантомного образа, Qg - угол между сигналом, поступающим с громкоговорителя (D) к слушателю (S) и фантомным образом f
5. В связи с развитием технологий на сегодняшний день существует также бинаураль-ный способ панорамирования с помощью стереотелефонов. В данном способе учитывается и горизонтальная, и вертикальная, и глубинная локализации.
Бинауральная стереофония основывается на формировании двух сигналов, поступающих на правое и левое ухо, обработанных передаточными функциями ушных раковин и головы (HRTF - Head Related Transfer Function - передаточная функция головы и BRIR -Binaural Room Impulse Response - импульсные функции головы).
При использовании стереотелефонов звуковой сигнал может быть размещен практически в любой точке звуковой картины.
Сравнительная характеристика обозначенных методов сведена в табл. 1.
Все эти методы и законы направлены на улучшение, обогащение, расширение и насыщенность звукового произведения, будь то аудиозапись или саундтрек к видеоматериалу. Такие важные составляющие полноценной звуковой картины, как музыка, музыкальный фон, шумы, речь, являются взаимодополняющими факторами художественной, аудио- или аудиовизуальной картины. Трансформируя звуковое пространство на стадии создания звукового образа, специалисты приближали при прослушивании человека к реальности восприятия, переносили его в ту атмосферу, которая была задумана.
В самом начале создания пространственной звуковой картины стало ясно, что звуковой образ воздействует на эмоциональную сферу слушателя, вызывая ассоциативное мышление, которое позволяет создавать простран-
Таблица 1
Сравнительная характеристика методов панорамирования
Панорамирование Достоинства Недостатки
Временное Существует возможность перемещать мнимые (фантомные) звуковые источники по всему пространству не только по ширине, но и по глубине стереобазы, в случае если сигналы находятся на одной оси Возможно ухудшение локализации, вплоть до разрыва фантомного образа при сильном увеличении временного сдвига
Интенсивное Четкая локализация при перемещении источников только в горизонтальном положении, по плоскости При слишком большой разнице по интенсивности наступает ухудшение локализации, вплоть до разрыва фантомного образа (возникает снижение корреляции между сигналами) [2]
Смешанное Четко сформированные звуковые сигналы и распределение звуковой информации по всей стереобазе. При сдвиге слушателя от центра локализация ухудшается.
Смешанное асимметричное Распределение звуковых сигналов по всей стереобазе, создание ярких звуковых эффектов Требует большого количества громкоговорителей
Законы синуса, косинуса и тангенса Увеличивает точность локализации источников Применение законов тангенсов обеспечивает более естественное звучание по сравнению со звучанием, где применялись законы синуса и косинуса [4]
Бинауральное По точности воссоздания первичного пространственного звукового образа бинаураль-ная система имеет существенные преимущества перед любыми стереофоническими системами Четкая локализация возможна только при воспроизведении через стереотелефоны
ственно-временные представления в рождении нового художественного звукового образа. Уже в процессе развития стереофонии перед звукорежиссерами стали открываться новые технические и художественно-эстетические возможности, поскольку сразу было замечено, что стереофоническое воспроизведение улучшает качество звучания, создавая более естественную звуковую картину.
Одну из основных смысловых нагрузок при прослушивании звуковой картины берет на себя процесс распознавания образов. И здесь задействованы такие явления, как «слуховой опыт», бинауральные процессы**, умение моделировать звуковой фантомный образ и пр. Для слушателя создание и определение местонахождения звукового образа - явление весьма субъективное, опирающееся на собственный личный опыт. Существует два варианта определения звукового образа: конкретный и абстрактный; и два варианта распознавания: перцептивный*** и концептуальный (опыт системного исследования). А также два метода распознавания образов. Первый основан на понятии пространства звуковых признаков и обработки звуковой информации в этом пространстве. Второй на исследовании «конструкции» рассматриваемых образов [3].
Можно сделать вывод, что любое направление, расположение, локализация, т. е. собственно панорамирование звукового источника в пространстве звуковой, картины напрямую зависит от опыта и психоакустических особенностей специалистов на стадии создания и жизненного опыта слушателя при прослушивании музыкального материала. Отсюда становится понятно, что художественно-эстетические критерии весьма субъективны и требуют особого анализа. Однако именно с внедрением в мировую аудиовизуальную практику стереофонии перед слушателями открылись новые горизонты насыщенности звукового пространства. Работая со стереосигналами, звукорежиссеры и на сегодняшний день сталкиваются с такими вопросами, как изменение первичного нахождения источника по отношению к вторичному, проблемы с перемещением источника, маскировка. Стереофонические записи, в отличие от монофониче-
ских, обогащают звуковую картину в горизонтальном, вертикальном и глубинном планах. Создавая стереопанораму, стереокартину, специалисты могут с помощью технических средств создавать полноценное звучание как отдельных немногочисленных ансамблей, так и насыщенные музыкальной тканью звуковые и звукоизобразительные произведения. Все это формирует художественно-эстетические взгляды современных специалистов и просто слушателей.
Стереовоспроизведение позволило более точно распределять звуковые источники в общей звуковой картине, передавать их перемещение (движение), имитировать процесс реверберации. С появлением стереофонии художественно-эстетическое, творческое решение вышло на первый план в реализации проектов звукозаписи. Новые технологии также были вовлечены в создание пространственного стереообраза и повлияли на воплощение звуковой картины. Стереоформат привнес некоторую свободу в видении и слышании звуковой панорамы. Многие режиссеры, драматурги, звукоинженеры, звукорежиссеры, искусствоведы (М. И. Ромм, А. П. Довженко, А. А. Тарковский, Г. Я. Франк, Ю. А. Ковалгин, П. К. Кондрашин, Ю. А. Лотман, М. М. Бахтин, В. И. Мартынов и др.) стали отмечать значительное обогащение звуковой палитры, звукового содержания с появлением возможности пространственного звучания.
Однако насколько важно имитировать реальное пространственное звучание и какие новые средства художественной выразительности появляются в процессе создания пространственной звуковой картины в связи с развитием технологий - вопрос открытый.
Художественно-эстетическое, творческое решение выходило на первый план в решении любого творческого проекта. Техническое оснащение все еще занимало важное место при создании звукового образа, так как новые технологии, которые были вовлечены в создание пространственного стереообраза, влияли на воплощение и качество звуковой картины. Стереоформат привнес некоторую свободу в видении и слышании звуковой картины.
С появлением стереоформата произошел прорыв в формировании звукового образа с точки зрения эстетического осмысления. С помощью звука стало возможно «виртуально» формировать изображение так же, как ранее изображение формировало звук, теперь «звук можно увидеть, а изображение можно услышать».
Благодаря стереофонии перед звукорежиссерами открылись новые возможности
передачи звукового передвижения источника. Создавая стереопанораму, стереокартину, специалисты могут с помощью технических средств создавать полноценное звучание как отдельных немногочисленных ансамблей, так и насыщенные музыкальной тканью звуковые и звукоизобразительные произведения. Все эти особенности влияют и формируют художественно-эстетические взгляды современных специалистов, зрителей и слушателей.
ПРИМЕЧАНИЯ
* Критические полосы слуха - «обработка сигнала полосовыми ("слуховыми") фильтрами. Ширина критических полос примерно соответствует ширине полосы пропускания слуховых фильтров и меняется в зависимости от частоты» [1, с. 126]. Коррелированные сигналы - сигналы, связанные между собой функциональной зависимостью.
** «Слуховой опыт» - это моделирование и запоминание звуковых и шумовых сигналов человеком в процессе коммуникации и восприятия окружающего мира. Бинауральный эффект - это способность человеческого слуха определять направление источника благодаря временным и интенсивностным изменениям. Бинаураль-ные процессы - природная способность человека воспринимать (слышать) пространственно-звуковой мир с помощью двух приемников. Фантомный образ - кажущийся источник звука.
*** Перцептивные действия - основные структурные единицы процесса восприятия, обеспечивающие построение предметного образа. Перцептивные действия, служащие для построения единого перцептивного образа, могут реализоваться с помощью различных наборов перцептивных операций. Перцептивное время (от лат. percept - воспринимать) - время восприятия.
СПИСОК ЛИТЕРАТУРЫ
1. Алдошина И. А., Приттс Р. Музыкальная акустика. СПб., 2006.
2. Ковалгин Ю. А. Стереофония. М.: Радио и связь, 1989.
3 ФурдуевВ. В. Стереофония и многоканальные звуковые системы. М.: Энергия, 1973.
4. Pulkki V. Spatial sound génération and perception by amplitude panning techniques. Helsinki University of Technology Laboratory of Acoustics and Audio Signal Processing, 2001.
5. URL: http://ru.wikipedia.org