Статьи:Основы психоакустики (продолжение)

начало статьи

4. Временная теория

Временная теория восприятия высоты базируется на анализе временной структуры звуковой волны (теория места на ее спектральном анализе). Эта теория использует синхронизацию разрядов нейронов органа Корти с фазой колебания базилярной мембраны (эффект запирания фазы). При смещениях определенной точки мембраны в сторону расположения волосковых клеток в них возникает электрический потенциал, при смещении в противоположную сторону - потенциал отсутствует. Благодаря фазовому запиранию время между импульсами в любом отдельном волокне будет равно целому числу 1, 2, 3... умноженному на период в основной звуковой волне. Нервные волокна кооперируются, чтобы кодировать частоты выше 300 Гц.

Основа временной теории - анализ формы волны в различных частях базилярной мембраны. Если рассматривать механизм частотного анализа на базилярной мембране как работу линейки фильтров различной ширины, то форма волны звукового сигнала, выходящего из этого набора фильтров, должна иметь вид, показанный на рисунке 10а. Например, если анализируется музыкальный тон с основной частотой 200 Гц, то выход из фильтра с центральной частотой 200 Гц имеет форму синусоидальной волны, т.к. эта гармоника разворачивается анализирующим фильтром. Аналогично разворачиваются этими фильтрами и все гармоники до пятой (около 1300 Гц). На выходе они имеют синусоидальную волну. Шестая гармоника (около 1560 Гц) имеет уже вариации амплитуды, но индивидуальные циклы еще видны. Волновая форма выходного сигнала для фильтра, центральная частота которого (в данном примере) выше шестой, не синусоидальная, т.к. гармоники не разворачиваются индивидуально, демонстрируя, что частотный диапазон полосового фильтра шире, чем расстояния между ними. По меньшей мере две гармоники комбинируются на выходе этого фильтра. Известно, что если две частоты находятся достаточно близко друг от друга, между ними возникают биения, т.е. одно колебание со средней частотой, равной разности частот. В данном случае, когда взаимодействуют две гармоники, этот период определяется фундаментальной частотой T=1/f0. Таким образом, период всех волн, выходящих после фильтров с центральной частотой выше шестой гармоники и состоящих из соседних гармоник, будет одинаковым и равным 1/f0.

Минимальное время между импульсами от различных мест на базилярной мембране определяется периодом волны, выходящей от соответствующего фильтра. Для мест, которые соответствуют частотам от основной до шестой гармоники, минимальное время равно периоду данной гармоники. Для мест, соответствующих более высоким гармоникам, промежутки между импульсами равны периоду огибающей, т.е. основному тону (Рис. 10б). Таким образом, выше шестой гармоники разряды нейронов синхронизированы с формой огибающей, и период разрядов совпадает с периодом для фундаментальной частоты. Иными словами, для всех гармоник периоды разрядов или равны, или отличаются в целое число раз от частоты основного тона.

Это основа временной теории восприятия высоты тона: мозг определяет периодичность разрядов и по ним восстанавливает частоту основного тона.

Восприятие музыкальной высоты связано с оценкой временной формы звукового сигнала (за счет использования эффекта "фазового запирания").

Временная теория позволяет понять, как найти фундаментальную частоту на основе анализа временных интервалов между нервными импульсами от различных мест на базилярной мембране и по ней определить высоту тона. Однако, временная теория не объясняет восприятия высоты тона на частотах выше 5000 Гц, т.к. эффект фазового запирания не срабатывает на этих частотах. Вероятно, в этой области частот меняется механизм восприятия высоты тона.

Необходимо отметить, что на частотах выше 5 кГц в слуховой диапазон (до 20 кГц) попадают только две-три слышимых гармоники, этого слишком мало для слуха, поэтому, как уже было показано выше, восприятие высоты тона существенно обедняется и практически заканчивается восприятие музыкальной высоты (chroma pitch) тона (интонации). Вероятно, по этой причине, которая была интуитивно известна музыкантам, на большинстве музыкальных инструментов (рояль и др.) клавиатура заканчивается в области 5 кГц. На органе есть трубы, которые дают тон 8 кГц, но они употребляются только вместе с другими.

5. Современная теория восприятия высоты тона

Согласно современным теориям мозг принимает информацию от периферийной слуховой системы как за счет индикации места (частотный анализ), так и за счет информации о форме звуковой волны (временной анализ). Самостоятельно каждая теория, по-видимому, не может объяснить восприятие высоты полностью, т.к. та и другая информация передается по одним и тем же нервным волокнам.

Современная модель для восприятия высоты тона, объединяющая оба метода, показана на рисунке 11: сначала идет фильтрация сигнала по частоте с помощью развертки по месту, затем - анализ по межимпульсным интервалам (до шестой-седьмой гармоники они соответствуют периоду каждой гармоники), выше - по периоду огибающей. Поскольку период огибающей равен периоду основной частоты, то здесь различие высоты тона определяется только по месту возбуждения. Так определяется общий период, и по нему данному звуку присваивается определенная высота. Таким образом, обе теории дополняют друг друга.

Анализ восприятия высоты музыкального тона с помощью предложенной модели позволил получить ряд интересных результатов:

а) для музыкальных тонов с основной частотой от 100 до 400 Гц (с уровнем звукового давления не менее 50 дБ) основную роль в определении высоты тона играют первые пять-шесть гармоник (если их уровень превышает 10 дБ), т.е. те гармоники, которые разворачиваются слуховыми фильтрами;

б) звуковые сигналы, содержащие только очень высокие гармоники (свыше двадцатой), не вызывают ощущения высоты тона;

в) музыкальные сигналы, содержащие очень низкие частоты (с основной частотой ниже 50 Гц, например, звуки органа) вызывают ощущение высоты тона только по гармоникам, т.к. такие низкие частоты не вызывают смещений базилярной мембраны - они на ней не размещаются, им не хватает места. При этом наиболее существенную роль играют пятые-шестые гармоники;

г) основная частота звука, если она выше 1000 Гц, является доминантной компонентой в определении высоты тона;

д) музыкальные звуки, содержащие только неразвернутые гармоники (свыше шестой) могут дать ощущение высоты тона по огибающей, при этом слух дает достаточно тонкую дифференциацию сдвига максимума огибающей, т.е. точно чувствует высоту.

е) фазовые соотношения различных гармоник в музыкальном сигнале оказывают влияние на восприятие высоты, т.к. их изменение приводит к изменению структуры огибающей для высших неразвернутых гармоник. Для музыкальных сигналов, содержащих много низких и высоких гармоник, изменение фазовых соотношений может привести к улучшению четкости восприятия высоты, не вызывая ее сдвига (т.к. они не влияют на оценку низших развернутых гармоник). Для сигналов, содержащих в основном высокие гармоники, изменение их фазы может вызвать сдвиг высоты тона и изменение его четкости, т.к. может привести к сдвигу пиков в огибающей, по которым и определяется высота тона.

Таким образом, фазовые соотношения в музыкальном сигнале оказывают существенное влияние на звуковысотные отношения, что особенно важно учитывать в звукорежиссерской практике.

6. Высота тона и центральный процессор

Восприятие высоты тона для сложных музыкальных сигналов, как указано выше, начинается с анализа в периферической слуховой системе, где производится их частотный и временной анализ, а затем полученная информация передается в высшие отделы мозга - "центральный слуховой процессор", где полученная информация определенным образом группируется и осмысливается.

Мозг группирует несколько тонов (гармоник) с одинаковым частотным интервалом в одно ощущение высоты тона. Это принципиальное свойство слухового процессора (высших отделов коры головного мозга): из сложного внешнего звукового мира он выделяет звуки и группирует их по определенным признакам: по месту, по времени начала и конца, по периодичности повторений и т.п. Это связано с тем, что кратковременная память оперирует только шестью-семью символами и без группировки мозг не может принимать быстрых решений.

Современная психология утверждает, что мозг мыслит образами. По-видимому, музыкальные звуки также запоминаются в виде некоторых гармонических эталонов (шаблонов - template), которые формируются в детстве, аналогично звукам речи.

В настоящее время принята гипотеза, что центральный процессор, получив информацию от периферической слуховой системы о наличии компонент с кратными периодами в музыкальном звуке, группирует их и сравнивает с гармоническим шаблоном, в котором имеются все последовательные гармоники. Для каждого входного сигнала подбирается по фундаментальной частоте гармонический шаблон, который ему лучше подходит. В соответствии с этой моделью наиболее соответствующая фундаментальная частота подобранного шаблона и будет воспринимаемой высотой тона. Если два шаблона с разными фундаментальными частотами подходят к данному сигналу, можно ожидать услышать или неопределенную высоту или две высоты. В случае отсутствия фундаментальной частоты, сравнение производится по отдельным гармоникам. Если удается подобрать хотя бы несколько гармоник, которые подходят под эталон, то по повторяющемуся интервалу между ними присваивается высота тона (виртуальная высота тона слышится, например, в звуке колоколов). Наиболее важными для синтеза ощущения высоты тона являются первые три - шесть развернутых гармоник. Компоненты сигнала, которые ведут себя аномально (например, одна гармоника включается-выключается или резко отличается от шаблона), выделяются центральным процессором и им присваивается отдельная высота.

Имеется много доказательств в поддержку данной гипотезы: например, при подаче разных гармоник в разные уши через телефоны (600 Гц в одно ухо и 800 Гц в другое), отчетливо слышен разностный тон высотой, соответствующей частоте 200 Гц, т.е. центральная система синтезирует высоту из гармоник в разных ушах. Другое доказательство, когда гармоники предъявляются неодновременно: при последовательном включении третьей, четвертой и пятой гармоники по 40 мс с интервалом10 мс, отчетливо слышался низкий тон с фундаментальной частотой и т.п.

Таким образом, в соответствии с этой моделью, гармоники собираются вместе, сравниваются центральным процессором с гармоническим эталоном (шаблоном) и по нему синтезируется высота музыкального тона.

Говоря о высоте комплексного тона, можно сказать, что "высота - великий консолидатор". Начиная с большого количества гармоник, процессор высоты объединяет их вместе в одно ощущение высоты. Слуховая организация определения высоты - основная часть осмысления звуков окружающего мира.

Важность определения высоты для слуховой системы не случайна и, вероятно, вовсе не результат стремления всего человечества сочинять музыку. Восприятие высоты играет центральную роль в определении индивидуальных объектов в акустическом мире и отделении их друг от друга. Окружающий мир наполнен конкурирующими звуками: интересными, угрожающими, шумовыми и др., все смешано вместе и слуховая система несет ответственность за их выделение и идентификацию. Высота есть главный идентификатор, позволяющий отделять данный звук от других объектов.

Ирина Алдошина