WebSound.ru Home
    Главная | Комментарии | Архив выпусков | Форум и чат | AudioTag.info | Музоблог | reTracked | Авторский блог  



  Поиск:

Поиск по WebSound.Ru:
Поиск в Интернете:
Powered by




  Партнеры, реклама:




Audio watermarking
TrustedAudio.com



 

Основы психоакустики

(c)Ирина Алдошина, 1999
(перепечатка с сайта http://www.625-net.ru)

Все права в отношении данного документа принадлежат его автору.

Природа дала нам ноги и руки, чтобы спасаться и защищаться - а мы изобрели спорт. Природа дала нам ощущение высоты, чтобы сортировать звуки окружающего мира - а мы изобрели музыку".

В. Хартман

 

З адача звукорежиссера - вместе с композитором и исполнителем - создать звуковой образ и передать его слушателю с помощью звукозаписи, звукоусиления, радиовещания, звукового сопровождения кино и телевидения и др..

Проблемами возникновения, передачи и восприятия звуков занимаются различные направления современной акустики, одним из которых является музыкальная акустика, которая изучает создание музыкальных звуков (акустика музыкальных инструментов, акустика речи и пения, электроакустика); передачу звуков (архитектурная акустика, звукозапись, усиление и вещание и др.) и восприятие звука (психоакустика - акустика слуха).

В конце 20 века именно психоакустика вышла на первый план. Научно-техническая революция открыла принципиально новые возможности работы со звуком, в том числе с помощью компьютерных музыкальных технологий. Она послужила базой для мощного развития аудиоиндустрии, создав новые средства передачи пространственной звуковой информации: цифровое радиовещание, телевидение, звукозапись и т.д. В настоящее время достигнут принципиальный прогресс в том, как надо делать аппаратуру записи, передачи и воспроизведения звука. Однако конечным судьей этого процесса остается слуховая система, а принципы распознавания ею слухового образа еще до конца не изучены. Именно поэтому на эту науку сейчас обращены основное внимание и средства.

Основные задачи психоакустики - понять, как слуховая система расшифровывает звуковой образ, установить основные соответствия между физическими стимулами и слуховыми ощущениями, и выявить, какие именно параметры звукового сигнала являются наиболее значимыми для передачи семантической (смысловой) и эстетической (эмоциональной) информации.

Это принципиально важно как для дальнейшего развития аудиотехники, так и для музыкального искусства в целом (исполнительского творчества, совершенствования музыкальных инструментов, развития компьютерного музыкального синтеза и т.д.) и особенно для звукорежиссеров, поскольку понимание процессов формирования субъективного "слухового пространства" является необходимой базой их творчества.

1. Механизм работы слуховой системы 

Звуковой сигнал любой природы может быть описан определенным набором физических характеристик: частота, интенсивность, длительность, временная структура, спектр и др. (Рис. 1). Им соответствуют определенные субъективные ощущения, возникающие при восприятии звуков слуховой системой: громкость, высота, тембр, биения, консонансы-диссонансы, маскировка, локализация-стереоэффект и т.п.

 

Слуховые ощущения связаны с физическими характеристиками неоднозначно и нелинейно, например, громкость зависит от интенсивности звука, от его частоты, от спектра и т.п.

Еще в прошлом веке был установлен закон Фехнера, подтвердивший, что эта связь нелинейна: "Ощущения пропорциональны отношению логарифмов стимула". Например, ощущения изменения громкости в первую очередь связаны с изменением логарифма интенсивности, высоты - с изменением логарифма частоты и т.д.

Всю звуковую информацию, которую человек получает из внешнего мира (она составляет примерно 25% от общей), он распознает с помощью слуховой системы и работы высших отделов мозга, переводит в мир своих ощущений, и принимает решения, как надо на нее реагировать.

Прежде чем приступить к изучению проблемы, как слуховая система воспринимает высоту тона, коротко остановимся на механизме работы слуховой системы. В этом направлении сейчас получено много новых и очень интересных результатов.

Слуховая система является своеобразным приемником информации и состоит из периферической части и высших отделов слуховой системы. Наиболее изучены процессы преобразования звуковых сигналов в периферической части слухового анализатора.

Периферическая часть

- это акустическая антенна, принимающая, локализующая, фокусирующая и усиливающая звуковой сигнал;
- микрофон;
- частотный и временной анализатор;
- аналого-цифровой преобразователь, преобразующий аналоговый сигнал в двоичные нервные импульсы - электрические разряды.

Общий вид периферической слуховой системы показан на рисунке 2. Обычно периферическую слуховую систему делят на три части: внешнее, среднее, и внутреннее ухо.

Внешнее ухо состоит из ушной раковины и слухового канала, заканчивающегося тонкой мембраной, называемой барабанной перепонкой. Внешние уши и голова - это компоненты внешней акустической антенны, которая соединяет (согласовывает) барабанную перепонку с внешним звуковым полем. Основные функции внешних ушей - бинауральное (пространственное) восприятие, локализация звукового источника и усиление звуковой энергии, особенно в области средних и высоких частот. Слуховой канал представляет собой изогнутую цилиндрическую трубку длиной 22,5 мм, которая имеет первую резонансную частоту порядка 2,6 кГц, поэтому в этой области частот он существенно усиливает звуковой сигнал, и именно здесь находится область максимальной чувствительности слуха. Барабанная перепонка - тонкая пленка толщиной 74 мкм, имеет вид конуса, обращенного острием в сторону среднего уха. На низких частотах она движется как поршень, на более высоких - на ней образуется сложная система узловых линий, что также имеет значение для усиления звука.

Среднее ухо - заполненная воздухом полость, соединенная с носоглоткой евстахиевой трубой для выравнивания атмосферного давления. При изменении атмосферного давления воздух может входить или выходить из среднего уха, поэтому барабанная перепонка не реагирует на медленные изменения статического давления - спуск-подъем и т.п. В среднем ухе находятся три маленькие слуховые косточки: молоточек, наковальня и стремечко. Молоточек прикреплен к барабанной перепонке одним концом, вторым он соприкасается с наковальней, которая при помощи маленькой связки соединена со стремечком. Основание стремечка соединено с овальным окном во внутреннее ухо.

Среднее ухо выполняет следующие функции: согласование импеданса воздушной среды с жидкой средой улитки внутреннего уха; защита от громких звуков (акустический рефлекс); усиление (рычаговый механизм), за счет которого звуковое давление передаваемое во внутреннее ухо, усиливается почти на 38 дБ по сравнению с тем, которое попадает на барабанную перепонку.

Внутреннее ухо находится в лабиринте каналов в височной кости, и включает в себя орган равновесия (вестибулярный аппарат) и улитку.

Улитка (cochlea) играет основную роль в слуховом восприятии. Она представляет собой трубку переменного сечения, свернутую три раза подобно хвосту змеи. В развернутом состоянии она имеет длину 3,5 см. Внутри улитка имеет чрезвычайно сложную структуру. По всей длине она разделена двумя мембранами на три полости: лестница преддверия, срединная полость и барабанная лестница (Рис. 3). Сверху срединная полость закрыта мембраной Рейсснера, снизу - базилярной мембраной. Все полости заполнены жидкостью. Верхняя и нижняя полости соединены через отверстие у вершины улитки (геликотрему). В верхней полости находится овальное окно, через которое стремечко передает колебания во внутреннее ухо, в нижней полости находится круглое окно, выходящее обратно в среднее ухо. Базилярная мембрана состоит из нескольких тысяч поперечных волокон: длина 32 мм, ширина у стремечка - 0,05 мм (этот конец узкий, легкий и жесткий), у геликотремы - ширина 0,5 мм (этот конец толще и мягче). На внутренней стороне базилярной мембраны находится орган Корти, а в нем - специализированные слуховые рецепторы - волосковые клетки. В поперечном направлении орган Корти состоит из одного ряда внутренних волосковых клеток и трех рядов наружных волосковых клеток. Между ними образуется тоннель. Волокна слухового нерва пересекают тоннель и контактируют с волосковыми клетками.

Слуховой нерв представляет собой перекрученный ствол, сердцевина которого состоит из волокон, отходящих от верхушки улитки, а наружные слои - от нижних ее участков. Войдя в ствол мозга, нейроны взаимодействуют с клетками различных уровней, поднимаясь к коре и перекрещиваясь по пути так, что слуховая информация от левого уха поступает в основном в правое полушарие, где происходит главным образом обработка эмоциональной информации, а от правого уха в левое полушарие, где в основном обрабатывается смысловая информация. В коре основные зоны слуха находятся в височной области, между обоими полушариями имеется постоянное взаимодействие.

Общий механизм передачи звука упрощенно может быть представлен следующим образом: звуковые волны проходят звуковой канал и возбуждают колебания барабанной перепонки. Эти колебания через систему косточек среднего уха передаются овальному окну, которое толкает жидкость в верхнем отделе улитки (лестнице преддверия), в ней возникает импульс давления, который заставляет жидкость переливаться из верхней половины в нижнюю через барабанную лестницу и геликотрему и оказывает давление на перепонку круглого окна, вызывая при этом его смещение в сторону, противоположную движению стремечка. Движение жидкости вызывает колебания базилярной мембраны (бегущая волна) (Рис. 4). Преобразование механических колебаний мембраны в дискретные электрические импульсы нервных волокон происходят в органе Корти. Когда базилярная мембрана вибрирует, реснички на волосковых клетках изгибаются, и это генерирует электрический потенциал, что вызывает поток электрических нервных импульсов, несущих всю необходимую информацию о поступившем звуковом сигнале в мозг для дальнейшей переработки и реагирования.

Высшие отделы слуховой системы (включая слуховые зоны коры), можно рассматривать как логический процессор, который выделяет (декодирует) полезные звуковые сигналы на фоне шумов, группирует их по определенным признакам, сравнивает с имеющимися в памяти образами, определяет их информационную ценность и принимает решение об ответных действиях.

2. Определение высоты звука 

Nx fo(-1) (Гц) 2Гц 3Гц 4Гц 5Гц 6Гц 7Гц 8Гц 9Гц 10Гц
100 50 33,33 25 20 16,67 14,29 12,50 11,11 10
200 100 66,67 50 40 33,33 28,57 25 22,22 20
300 150 100 75 60 50 42,86 37,30 33,33 30
400 200 133,3 100 80 66,67 57,14 50 44,44 40
500 250 166,7 125 100 83,33 71,43 62,50 55,56 50
600 300 200 150 120 100 85,71 75 66,67 60
700 350 233,3 175 140 116,7 100 87,50 77,78 70
800 400 266,7 200 160 133,3 114,3 100 88,89 80
900 450 300 225 180 150 128,6 112,5 100
90
1000 500 333,3 250 200 166,7 142,9 125 111,1 100

 

Важнейшим свойством слуховой системы является возможность определения высоты звука. Это свойство имеет огромное значение для выделения и классификации звуков в окружающем звуковом пространстве, эта же способность слуховой системы лежит в основе восприятия интонационного аспекта музыки, то есть мелодии и гармонии.

В соответствии с международным стандартом ANSI- 1994 "Высота (Pitch) - это атрибут слухового ощущения в терминах, в которых звуки можно расположить по шкале от низких к высоким. Высота зависит главным образом от частоты звукового стимула, но она также зависит от звукового давления и от формы волны".

Таким образом, высота - это линейная классификация звуковых сигналов, в отличие от громкости, о которой можно сказать больше-меньше, т.е. это - относительная классификация.

Прежде всего, необходимо отметить, что слуховая система способна различать высоту звука только у периодических сигналов. Если это простое гармоническое колебание, например, синусоидальный сигнал от генератора, то период колебаний T определяет частоту f = 1/T, поэтому определяющим параметром для различения высоты является частота сигнала.

Если это сложный звук, то высоту слуховая система может присвоить по его основному тону, но только если он имеет периодическую структуру, т.е. спектр его состоит из гармоник (обертонов, частоты которых находятся в целочисленных отношениях). Если это условие не выполняется, то высоту тона определить слуховая система не может. Например, звуки таких инструментов как тарелки, гонги и др. не имеют определенной высоты.

Высота простых тонов

Изучение связи частоты звука и воспринимаемой высоты предпринималось еще Пифагором, а также многими известными физиками: Галилеем, Гельмгольцем, Омом и др. В настоящее время на основе тщательных экспериментов, в процессе которых слушателю предъявлялись два звука разной частоты с просьбой расположить их по высоте, установлена зависимость высоты тона от частоты сигнала, показанная на рисунке 5. Значения высоты отложено в специальных единицах - мелах. Один мел равен ощущаемой высоте звука частотой 1000 Гц при уровне 40 дБ (иногда для оценки высоты тона используется другая единица, барк = 100 мел). Как видно из рисунка, эта связь нелинейна - при увеличении частоты, например, в три раза (от 1000 до 3000 Гц), высота повышается только в два раза (от 1000 до 2000 мел). Нелинейность связи особенно выражена на низких и высоких частотах, в определенных пределах изменение высоты тона в мелах пропорционально логарифму частоты.

Многочисленные исследования были посвящены порогам различимости по высоте двух разных тонов, отличающихся по частоте. Результаты современных исследований представлены на рис.6, на котором видно, как слуховая система может различить по высоте два звука, отличающихся по частоте всего на 0,2%. Такая тонкая разрешающая способность слуха позволила установить, что ниже частоты 500 Гц можно выделить примерно 140 градаций высоты тона, в диапазоне от 500 Гц до 16 кГц - примерно 480 градаций высоты тона (всего 620 градаций). В европейской музыке инструменты с равномерно темперированной шкалой используют порядка 100 градаций высоты тонов. Но возможности слуховой системы гораздо больше - 620 градаций высоты, и это основа для развития современной микротоновой и спектральной музыки, то особенно продвинулось в связи с появлением компьютерных технологий.

Ощущение высоты чистого тона (одной частоты) связано не только с частотой, но и с интенсивностью звука и его длительностью. Как показали различные исследования, при повышении интенсивности звука громкие низкие звуки кажутся еще ниже, а высокие звуки с повышением громкости кажутся слегка выше (зависимость показана на рисунке 7), для средних частот 1-2 кГц влияние интенсивности незаметно. Следует отметить, что эта зависимость незначительна, а для сложных музыкальных звуков почти незаметна. Это великое счастье для музыки, т.к. иначе при переходе от pp к ff звуковысотные отношения (мелодия и гармония) были бы нарушены.

Ощущение высоты тона зависит и от его длительности: короткие звуки воспринимаются как сухой щелчок, но при удлинении звука щелчок начинает давать ощущение высоты тона. Время, требуемое для перехода от щелчка к тону, зависит от частоты: для низких частот требуется для распознания высоты тона примерно 60 мс, для частот от 1 до 2 кГц - 15 мс. Для сложных звуков это время увеличивается, для звуков речи оно может составлять 20-30 мс.

Высота сложных звуков

В музыке простые синусоидальные тоны практически не используются, каждый музыкальный тон имеет сложную структуру и состоит из основного тона и гармоник (пример ноты до на скрипке показан на рисунке 1).

Однако можно установить соответствие по высоте музыкального тона, например ноты ля первой октавы и чистого синусоидального сигнала с частотой 440 Гц. Высоты этих двух звуков будут одинаковыми, но тембры - разными. Это свидетельствует о том, что для сложных периодических сигналов высота присваивается по частоте основного тона - именно он имеет частоту 440 Гц.

В музыке используются другие шкалы для оценки высоты тона - музыкальные: полутоны, тоны, октавы и другие музыкальные интервалы. Следует отметить, что связь с психофизической шкалой высоты тона, построенной для чистых тонов, неоднозначна. До частоты примерно 5000 Гц увеличение высоты тона на октаву связано с удвоением частоты. Например, переход от ноты ля первой октавы к ноте ля второй октавы соответствует увеличению частоты от 440 до 880 Гц. Но выше частоты 5000 Гц это соответствие нарушается - чтобы получить ощущение увеличения высоты на октаву, надо увеличить соотношение частот почти в 10 раз, что следует иметь в виду при создании компьютерных композиций. Это дало основание некоторым ученым предложить две размерности высоты тона: психофизическую в мелах, пропорциональную в некоторых пределах логарифму частоты, установленную для чистых тонов (pitch height) и музыкальную, соответствующую названию нот (pitch chroma), которая может быть определена примерно до 5000 Гц. Следует отметить, что даже музыканты с абсолютным музыкальным слухом затрудняются в определении нот для звуков с частотой выше 5000 Гц. Это говорит о том, что механизмы восприятия высоты тона до 5000 Гц и выше - различны.

Для объяснения механизма восприятия высоты как простых, так и сложных звуков используются две теории: "теория места" и "временная теория".

3. Теория места 

Теория места при восприятии высоты основана на способности базилярной мембраны выполнять частотный анализ сложного звука, т.е. действовать как спектральный анализатор. Базилярная мембрана организована тонотопически, т.е. каждый тон имеет свою топографию размещения. Как уже было указано выше, звуковой сигнал вызывает появление на мембране бегущей волны (Рис. 4), но специфика возбуждения состоит в том, что максимум смещения этой бегущей волны располагается в разных местах базилярной мембраны - низкие частоты имеют максимум смещения вблизи вершины мембраны, высокие - вблизи овального окна. Каждая частота имеет свое место максимума возбуждения на мембране (Рис. 8). В зависимости от спектрального состава на базилярной мембране возбуждаются различные участки. Возбуждаются волосковые клетки, находящиеся на этом месте, и их электрическая активность сообщает мозгу, какие частоты присутствуют в спектре. Таким образом, частота тона представлена в коде, основанном на том, нейроны каких участков активны, а каких - молчат. Физиологические исследования показывают, что тонотопическая организация нейронов сохраняется во всех отделах мозга, вплоть до отделов слуховой коры. Логично допустить, что распознавание частоты и распознавание высоты есть результат тонотопического кодирования - в этом и заключается теория места.

При действии синусоидального сигнала в слуховом нерве формируется "образец возбуждения" - скорость разрядов нейронов как функция места на базилярной мембране. При этом пик этого образца движется вдоль мембраны при изменении частоты. Интересно отметить, что для того, чтобы слух различил два тона по высоте, необходимо, чтобы на базилярной мембране максимум смещения, соответствующий данным частотам, сместился всего на 52 мкм (если выразить в мелах, то одна градация высоты равна 3,9 мела).

 

Таким образом, можно считать, что периферическая слуховая система содержит банк полосовых фильтров ("слуховых фильтров") с перекрывающимися полосами (Рис. 8). Их ширина свыше 1кГц составляет примерно 10-17% от центральной частоты (например, на частоте 1000 Гц ширина полосы составляет 160 Гц). С шириной слуховых фильтров связано известное понятие "критической полосы" - внутри этой полосы звуковая информация интегрируется слухом; при выходе за пределы этой полосы происходит скачкообразное изменение слуховых ощущений, и это подтверждается экспериментами по маскировке, громкости, фазовой чувствительности и др.

При восприятии музыкального звука в соответствии с теорией места для слуховой системы существуют три возможности определения высоты:

Метод 1: локализовать место фундаментальной частоты и по нему определить высоту тона;

Метод 2: найти минимальную частотную разницу между соседними гармониками, которая равна фундаментальной частоте: [(n+1)f0)-(nf0)]=(nf0)+(1f0)-(nf0)=f0, где n =1,2,3: и принять ее за основу при распознавании высоты;

Метод 3: найти общий наибольший сомножитель, который получается при делении всех гармоник на последовательные целые числа, и использовать его как базу для определения частоты. Первой была предложена теория, по которой ощущаемая высота соответствует частоте только в том случае, если в звуковой волне присутствует энергия на этой частоте (второй закон Ома). Отсюда следовало, что присутствие фундаментальной частоты является обязательным для определения высоты звука. Первые сомнения в этой теории появились, когда стало возможным электрическим путем синтезировать спектры сложных звуков. В 1940 Шутен продемонстрировал, что ощущение высоты тона (сложной периодической волны) не изменится, если вырезать в музыкальном тоне фундаментальную частоту (Рис. 9).

Из этого следовало:

- присутствие фундаментальной частоты не обязательно для восприятия высоты;
- низшая частота не всегда является основой определения высоты.

Этот эксперимент получил название "феномен пропущенной фундаментальной" и доказал, что метод 1 не может служить единственной базой для определения высоты сложного тона, хотя он работает для большинства музыкальных, в том числе вокальных звуков.

Метод 2 дает возможность определить высоту тона по определению позиции соседних гармоник, даже если фундаментальная частота отсутствует. Для большинства музыкальных звуков соседние гармоники обычно присутствуют. Слуховая система, оценивая положение их максимумов на базилярной мембране, вычисляет частотную разницу между ними и по ней определяет высоту. Однако с помощью современных технических средств можно создать ситуацию, которую объяснить с помощью этого метода невозможно. Например, подаем звук, в котором присутствуют только нечетные гармоники 1f0, 3f0, 5f0, 7f0, например, 100, 300, 500, 700 Гц и др. Если фундаментальная частота есть в спектре, то слух определяет высоту по ней f0 = 100 Гц. Если ее вырезать, то расстояние между гармониками останется 2 f0, но слух продолжает определять высоту тона, равную фундаментальной f0=100 Гц.

Метод 3 позволяет объяснить и пропущенную фундаментальную и наличие только нечетных гармоник, т.к. от отсутствия каких-то гармоник общий наибольший сомножитель 100 Гц не меняется (см. таблицу). Этот метод позволяет также объяснить восприятие слабого ощущения высоты тона у колоколов и других источников квазипериодических тонов.

Механизм места разворачивает данную гармонику, если критическая полоса ее слухового фильтра, построенного на ней как на срединной частоте, достаточна узкая и соседние гармоники внутрь этого фильтра не попадают. Если гармоники находятся настолько близко по частоте друг от друга, что внутрь одного слухового фильтра попадает несколько гармоник, то они не разворачиваются. Какой бы ни была фундаментальная частота, слуховой механизм разворачивает только первые 6-7 гармоник - именно они и являются определяющими при определении высоты звука. Теория места создает базис для понимания того, как можно определить высоту путем анализа гармонического ряда, но эта теория не может объяснить ряд проблем, например, очень высокая точность определения высоты звука для тонов, чьи частотные компоненты не разворачиваются (т.е. звуки с гармониками выше седьмой).

4. Временная теория  

Временная теория восприятия высоты базируется на анализе временной структуры звуковой волны (теория места на ее спектральном анализе). Эта теория использует синхронизацию разрядов нейронов органа Корти с фазой колебания базилярной мембраны (эффект запирания фазы). При смещениях определенной точки мембраны в сторону расположения волосковых клеток в них возникает электрический потенциал, при смещении в противоположную сторону - потенциал отсутствует. Благодаря фазовому запиранию время между импульсами в любом отдельном волокне будет равно целому числу 1, 2, 3... умноженному на период в основной звуковой волне. Нервные волокна кооперируются, чтобы кодировать частоты выше 300 Гц.

Основа временной теории - анализ формы волны в различных частях базилярной мембраны. Если рассматривать механизм частотного анализа на базилярной мембране как работу линейки фильтров различной ширины, то форма волны звукового сигнала, выходящего из этого набора фильтров, должна иметь вид, показанный на рисунке 10а. Например, если анализируется музыкальный тон с основной частотой 200 Гц, то выход из фильтра с центральной частотой 200 Гц имеет форму синусоидальной волны, т.к. эта гармоника разворачивается анализирующим фильтром. Аналогично разворачиваются этими фильтрами и все гармоники до пятой (около 1300 Гц). На выходе они имеют синусоидальную волну. Шестая гармоника (около 1560 Гц) имеет уже вариации амплитуды, но индивидуальные циклы еще видны. Волновая форма выходного сигнала для фильтра, центральная частота которого (в данном примере) выше шестой, не синусоидальная, т.к. гармоники не разворачиваются индивидуально, демонстрируя, что частотный диапазон полосового фильтра шире, чем расстояния между ними. По меньшей мере две гармоники комбинируются на выходе этого фильтра. Известно, что если две частоты находятся достаточно близко друг от друга, между ними возникают биения, т.е. одно колебание со средней частотой, равной разности частот. В данном случае, когда взаимодействуют две гармоники, этот период определяется фундаментальной частотой T=1/f0. Таким образом, период всех волн, выходящих после фильтров с центральной частотой выше шестой гармоники и состоящих из соседних гармоник, будет одинаковым и равным 1/f0.

Минимальное время между импульсами от различных мест на базилярной мембране определяется периодом волны, выходящей от соответствующего фильтра. Для мест, которые соответствуют частотам от основной до шестой гармоники, минимальное время равно периоду данной гармоники. Для мест, соответствующих более высоким гармоникам, промежутки между импульсами равны периоду огибающей, т.е. основному тону (Рис. 10б). Таким образом, выше шестой гармоники разряды нейронов синхронизированы с формой огибающей, и период разрядов совпадает с периодом для фундаментальной частоты. Иными словами, для всех гармоник периоды разрядов или равны, или отличаются в целое число раз от частоты основного тона.

Это основа временной теории восприятия высоты тона: мозг определяет периодичность разрядов и по ним восстанавливает частоту основного тона.

Восприятие музыкальной высоты связано с оценкой временной формы звукового сигнала (за счет использования эффекта "фазового запирания").

Временная теория позволяет понять, как найти фундаментальную частоту на основе анализа временных интервалов между нервными импульсами от различных мест на базилярной мембране и по ней определить высоту тона. Однако, временная теория не объясняет восприятия высоты тона на частотах выше 5000 Гц, т.к. эффект фазового запирания не срабатывает на этих частотах. Вероятно, в этой области частот меняется механизм восприятия высоты тона.

Необходимо отметить, что на частотах выше 5 кГц в слуховой диапазон (до 20 кГц) попадают только две-три слышимых гармоники, этого слишком мало для слуха, поэтому, как уже было показано выше, восприятие высоты тона существенно обедняется и практически заканчивается восприятие музыкальной высоты (chroma pitch) тона (интонации). Вероятно, по этой причине, которая была интуитивно известна музыкантам, на большинстве музыкальных инструментов (рояль и др.) клавиатура заканчивается в области 5 кГц. На органе есть трубы, которые дают тон 8 кГц, но они употребляются только вместе с другими.

5. Современная теория восприятия высоты тона  

Согласно современным теориям мозг принимает информацию от периферийной слуховой системы как за счет индикации места (частотный анализ), так и за счет информации о форме звуковой волны (временной анализ). Самостоятельно каждая теория, по-видимому, не может объяснить восприятие высоты полностью, т.к. та и другая информация передается по одним и тем же нервным волокнам.

Современная модель для восприятия высоты тона, объединяющая оба метода, показана на рисунке 11: сначала идет фильтрация сигнала по частоте с помощью развертки по месту, затем - анализ по межимпульсным интервалам (до шестой-седьмой гармоники они соответствуют периоду каждой гармоники), выше - по периоду огибающей. Поскольку период огибающей равен периоду основной частоты, то здесь различие высоты тона определяется только по месту возбуждения. Так определяется общий период, и по нему данному звуку присваивается определенная высота. Таким образом, обе теории дополняют друг друга.

Анализ восприятия высоты музыкального тона с помощью предложенной модели позволил получить ряд интересных результатов:

а) для музыкальных тонов с основной частотой от 100 до 400 Гц (с уровнем звукового давления не менее 50 дБ) основную роль в определении высоты тона играют первые пять-шесть гармоник (если их уровень превышает 10 дБ), т.е. те гармоники, которые разворачиваются слуховыми фильтрами;

б) звуковые сигналы, содержащие только очень высокие гармоники (свыше двадцатой), не вызывают ощущения высоты тона;

в) музыкальные сигналы, содержащие очень низкие частоты (с основной частотой ниже 50 Гц, например, звуки органа) вызывают ощущение высоты тона только по гармоникам, т.к. такие низкие частоты не вызывают смещений базилярной мембраны - они на ней не размещаются, им не хватает места. При этом наиболее существенную роль играют пятые-шестые гармоники;

г) основная частота звука, если она выше 1000 Гц, является доминантной компонентой в определении высоты тона;

д) музыкальные звуки, содержащие только неразвернутые гармоники (свыше шестой) могут дать ощущение высоты тона по огибающей, при этом слух дает достаточно тонкую дифференциацию сдвига максимума огибающей, т.е. точно чувствует высоту.

е) фазовые соотношения различных гармоник в музыкальном сигнале оказывают влияние на восприятие высоты, т.к. их изменение приводит к изменению структуры огибающей для высших неразвернутых гармоник. Для музыкальных сигналов, содержащих много низких и высоких гармоник, изменение фазовых соотношений может привести к улучшению четкости восприятия высоты, не вызывая ее сдвига (т.к. они не влияют на оценку низших развернутых гармоник). Для сигналов, содержащих в основном высокие гармоники, изменение их фазы может вызвать сдвиг высоты тона и изменение его четкости, т.к. может привести к сдвигу пиков в огибающей, по которым и определяется высота тона.

Таким образом, фазовые соотношения в музыкальном сигнале оказывают существенное влияние на звуковысотные отношения, что особенно важно учитывать в звукорежиссерской практике.

6. Высота тона и центральный процессор  

Восприятие высоты тона для сложных музыкальных сигналов, как указано выше, начинается с анализа в периферической слуховой системе, где производится их частотный и временной анализ, а затем полученная информация передается в высшие отделы мозга - "центральный слуховой процессор", где полученная информация определенным образом группируется и осмысливается.

Мозг группирует несколько тонов (гармоник) с одинаковым частотным интервалом в одно ощущение высоты тона. Это принципиальное свойство слухового процессора (высших отделов коры головного мозга): из сложного внешнего звукового мира он выделяет звуки и группирует их по определенным признакам: по месту, по времени начала и конца, по периодичности повторений и т.п. Это связано с тем, что кратковременная память оперирует только шестью-семью символами и без группировки мозг не может принимать быстрых решений.

Современная психология утверждает, что мозг мыслит образами. По-видимому, музыкальные звуки также запоминаются в виде некоторых гармонических эталонов (шаблонов - template), которые формируются в детстве, аналогично звукам речи.

В настоящее время принята гипотеза, что центральный процессор, получив информацию от периферической слуховой системы о наличии компонент с кратными периодами в музыкальном звуке, группирует их и сравнивает с гармоническим шаблоном, в котором имеются все последовательные гармоники. Для каждого входного сигнала подбирается по фундаментальной частоте гармонический шаблон, который ему лучше подходит. В соответствии с этой моделью наиболее соответствующая фундаментальная частота подобранного шаблона и будет воспринимаемой высотой тона. Если два шаблона с разными фундаментальными частотами подходят к данному сигналу, можно ожидать услышать или неопределенную высоту или две высоты. В случае отсутствия фундаментальной частоты, сравнение производится по отдельным гармоникам. Если удается подобрать хотя бы несколько гармоник, которые подходят под эталон, то по повторяющемуся интервалу между ними присваивается высота тона (виртуальная высота тона слышится, например, в звуке колоколов). Наиболее важными для синтеза ощущения высоты тона являются первые три - шесть развернутых гармоник. Компоненты сигнала, которые ведут себя аномально (например, одна гармоника включается-выключается или резко отличается от шаблона), выделяются центральным процессором и им присваивается отдельная высота.

Имеется много доказательств в поддержку данной гипотезы: например, при подаче разных гармоник в разные уши через телефоны (600 Гц в одно ухо и 800 Гц в другое), отчетливо слышен разностный тон высотой, соответствующей частоте 200 Гц, т.е. центральная система синтезирует высоту из гармоник в разных ушах. Другое доказательство, когда гармоники предъявляются неодновременно: при последовательном включении третьей, четвертой и пятой гармоники по 40 мс с интервалом10 мс, отчетливо слышался низкий тон с фундаментальной частотой и т.п.

Таким образом, в соответствии с этой моделью, гармоники собираются вместе, сравниваются центральным процессором с гармоническим эталоном (шаблоном) и по нему синтезируется высота музыкального тона.

Говоря о высоте комплексного тона, можно сказать, что "высота - великий консолидатор". Начиная с большого количества гармоник, процессор высоты объединяет их вместе в одно ощущение высоты. Слуховая организация определения высоты - основная часть осмысления звуков окружающего мира.

Важность определения высоты для слуховой системы не случайна и, вероятно, вовсе не результат стремления всего человечества сочинять музыку. Восприятие высоты играет центральную роль в определении индивидуальных объектов в акустическом мире и отделении их друг от друга. Окружающий мир наполнен конкурирующими звуками: интересными, угрожающими, шумовыми и др., все смешано вместе и слуховая система несет ответственность за их выделение и идентификацию. Высота есть главный идентификатор, позволяющий отделять данный звук от других объектов.