Статьи:Громкость сложных звуков

Как было показано в первой части статьи, посвященной субъективному восприятию громкости звука , ощущение громкости, как меры распределения звуков от тихих до громких по определенной шкале, зависит от таких объективных параметров, как интенсивность звука (звуковое давление), частота, длительность, спектр, маскирующее действие других звуков и др. Зависимость уровня громкости (выраженного в фонах) от частоты была представлена в виде кривых равной громкости. Там же была рассмотрена для простых тональных звуков зависимость громкости (в сонах) от уровня громкости, от длительности сигнала и пр.

Перейдем теперь к анализу восприятия громкости для сложных звуков, т.е. рассмотрим зависимость ощущения громкости от спектрального состава различных сигналов (речевых, музыкальных, шумовых и др.), что особенно важно учитывать на практике при записи, монтаже и других видах работ со звуковым материалом.

Известно из практики, что широкополосные сигналы кажутся громче, чем узкополосные сигналы с таким же уровнем звукового давления. Пример зависимости уровня громкости от ширины полосы шумового сигнала показан на рисунке 1 для уровня звукового давления 60 дБ и центральной частоты 1 кГц. Воспринимаемый уровень громкости при расширении полосы шума до определенного значения (в данном случае 150 Гц) практически остается неизменным, а когда ширина полосы становится шире 150 Гц, уровень громкости резко возрастает. Граница, где происходит изменение ощущения уровня громкости, называется критической полосой слуха. Различие механизмов обработки сигнала внутри и вне критических полос имеет принципиальное значение для определения громкости сложных звуков (так же, как их высоты, тембра и др.).

Рис. 1. Зависимость уровня громкости от ширины полосы сигнала

Механизм ощущения громкости продолжает оставаться предметом многочисленных исследований психоакустиков, однако расшифровка этого процесса по-прежнему представляет значительные трудности.

Одна из самых последних компьютерных моделей слухового анализа громкости сигналов, выполненная учеными Кембриджского Университета (Б. Мур, Б. Гласберг и др.), включает в себя следующие последовательные этапы обработки звукового сигнала в процессе формирования ощущения громкости:

- фильтрация сигнала внешним ухом (ушной раковиной и слуховым каналом);
- фильтрация сигнала средним ухом;
- фильтрация с помощью линейки полосовых фильтров на базилярной мембране;
- преобразование возбуждения на базилярной мембране в кривые распределения удельной громкости;
- интегрирование площади под кривыми удельной громкости.

Поговорим об этих этапах подробнее.

Рис. 2. АЧХ сигнала на барабанной перепонке после фильтрации внешним ухом

Как уже было сказано в предыдущих статьях о бинауральном слухе, внешнее ухо производит обработку звукового сигнала в зависимости от направления прихода звука, увеличивая уровень сигнала в области 3 кГц за счет дифракции на ушной раковине и резонансов в наружном слуховом канале. Равномерная форма АЧХ сигнала после фильтрации внешним ухом приобретает при осевом падении звукового сигнала вид, показанный на рис.2.

Как уже было показано в статье по определению высоты тона, во внутреннем ухе происходит спектральный анализ поступившего слухового сигнала, при этом каждой частоте соответствует свое место максимального смещения базилярной мембраны, что аналогично механизму обработки сигнала линейкой полосовых ("слуховых") фильтров. Ширина критических полос примерно соответствует ширине полосы пропускания слуховых фильтров и меняется в зависимости от частоты в соответствии с кривой на рисунке 3 (для сравнения приведено изменение ширины полосы, соответствующей третьоктавной полосе и целому музыкальному тону).

Рис. 3. Изменение ширины критических полос как функции частоты

Если совместить критические полосы в один ряд, то в слышимом диапазоне их оказывается 24, каждой из них соответствует расстояние на базилярной мембране, равное 1,3 мм. Переход от одной критической полосы к другой соответствует изменению высоты в 100 мел или в 1 барк. Форма передаточной функции каждого из этих слуховых фильтров, и ее изменение с увеличением амплитуды сигнала показаны на рисунке 4 (по горизонтальной оси отложено число критических полос). Как видно из рисунка, возбуждение мембраны становится все более несимметричным, и площадь под кривой расширяется.

При колебаниях базилярной мембраны, в волосковых клетках органа Корти (находящегося на мембране) генерируется электрический потенциал, и возбуждаются потоки импульсов в нервных клетках. При увеличении интенсивности сигнала скорость импульсов увеличивается в единичном нерве, соответствующем данному месту на мембране, и доходит до насыщения (порог - 1000 импульсов в секунду), затем начинает возникать возбуждение в соседних нервных волокнах в соответствии с увеличением площади под кривой возбуждения (Рис. 4).

Рис. 4. Изменение формы АЧХ слухового фильтра с изменением интенсивности сигнала

Ощущение громкости кодируется увеличением числа разрядов в единичном нерве и увеличением количества нервных волокон, в которых возникает возбуждение, в соответствии с изменением площади под кривой возбуждения.

На основании проведенных экспериментов была высказана гипотеза, что слуховая система производит интегрирование площади под кривой возбуждения на базилярной мембране с учетом распределения нервной активности.

В упомянутой ранее компьютерной модели слуховой оценки громкости были предложены количественные соотношения между энергией подводимого сигнала, распределением ее по критическим полосам слуха, и возникающим при этом субъективным ощущением удельной громкости в сонах. Под "удельной" понимается оцениваемая громкость внутри критической полосы.

Таким образом, внутри каждой критической частоты происходит интеграция энергии независимо от вида звукового сигнала. Фрагмент спектра шума (или тональные сигналы), если они находятся внутри критической полосы и имеют одинаковый уровень интенсивности (звукового давления), создают одинаковый уровень громкости.

Поэтому, когда звуковой сигнал имеет сложный спектральный состав или одновременно звучат несколько сигналов, определение их суммарной громкости происходит тремя различными способами, в зависимости от соотношения их частот или обертонов:

- если сигналы близки по частоте, т.е. находятся внутри критической полосы, то для определения создаваемой им суммарной громкости необходимо сложить их интенсивности I =I1+I2+I3….и по суммарному значению уровня звукового давления, соответствующего этой суммарной интенсивности, определить из кривых равной громкости уровень громкости (в фонах), а затем пересчитать в значение громкости в сонах.

Рис. 5. Кривые равной громкости

Например, если на скрипке исполняется определенная нота с уровнем звукового давления L1 = 60 дБ с частотой 880 Гц (Ля второй октавы), это, как следует из кривых равной громкости (Рис. 5), соответствует уровню громкости Ls = 60 фон. Для определения громкости этого звука можно воспользоваться стандартным соотношением, рекомендованным международными стандартами ISO: S=2(Ls-40)/10(1), откуда громкость S равна четырем сонам.

Если теперь будут вместе играть десять скрипок, то создаваемая ими громкость определяется следующим образом: интенсивность звука одной скрипки I1, интенсивность звука десяти скрипок Iсум = 10I1 (интенсивности складываются).

При этом суммарный уровень интенсивности равен:

10lgIсум/I0 = 10lg 10I1/I0 = 10lgI1/I0 + 10lg10 = 10lgI1/I0 + 10 дБ(2).

Если теперь учесть, что интенсивность звука пропорциональна квадрату звукового давления, то получим: 10 lg Iсум/I0 = 10lg p2/p02 = 20 lg pсум/p0.

Из соотношения (2) получается: 20lg pсум/р0 = 20lg p1/p0 + 10 дБ, т.е. суммарный уровень звукового давления увеличится на 10 дБ: Lp=L1+10 дБ.

Поскольку начальный уровень звукового давления был 60 дБ, то суммарный уровень звукового давления будет 70 дБ, что соответствует уровню громкости 70 фон (рисунок 5), отсюда по формуле (1) можно рассчитать громкость, она равна 8 сон.

Следовательно, когда вместо одной скрипки (или любого другого источника сигнала) будут играть десять скрипок, громкость вырастет только в два раза (от 4 сон до 8 сон), что очень важно учитывать в технологии звукозаписи.

Это правило можно сформулировать иначе: при увеличении общего уровня звукового давления на 10 дБ воспринимаемая громкость удваивается.

Аналогично рассчитывается общая громкость, если имеется два узкополосных шума с близкими частотами (например, внутри критической полосы около1000 Гц ее ширина равна 150 Гц). Если уровень каждого из шумов 60 дБ, то при сложении интенсивностей суммарный уровень будет 63 дБ, и громкость вырастет от 4 сон до 4,92 сона.

- если сигналы имеют разность частот шире критической полосы и их взаимным маскированием можно пренебречь, тогда действует другое правило: суммарная громкость равна сумме громкостей каждой из составляющих.

Отсюда получается, что при звучании сигналов с частотами, разнесенными шире критической полосы, суммарная громкость будет больше. Например, если два узкополосных шума имеют громкость по 4 сона, но частоты их разнесены (600 и 1200 Гц), то суммарная громкость будет 8 сон (а не 4,92 сона, как в предыдущем примере), что соответствует уровню громкости 70 фон.

- если частоты различных сигналов разнесены по частоте друг от друга достаточно далеко, то определение суммарной громкости значительно усложняется: слушатель обычно фокусирует свое внимание на каком-то одном компоненте (или самом громком, или одним из самых высоких), воспринимая общую громкость суммарного сигнала, примерно равной этому компоненту.

Для определения громкости сложного многокомпонентного звука в Международных рекомендациях ISO №532А рекомендуется использование следующей методики:

Рис. 6. Номограммы для расчета индексов громкости

с помощью стандартных октавных или третьоктавных анализаторов измеряется уровень звукового давления внутри каждой октавной (или третьоктавной) полосы. Затем с помощью графика (Рис. 6) определяется индекс громкости Si (по оси ординат отложено значение центральной частоты), по оси абсцисс - значение уровня звукового давления в каждой полосе. Полученные значения индексов громкости Si для каждой октавной полосы суммируются следующим образом:

S=Smax+0,3(сигма)Si , где Smax - индекс самого громкого звука, (сигма)Si - сумма индексов громкости во всех остальных полосах. Таким образом, суммарная громкость в сонах получается от суммирования 100% индекса громкости самого громкого звука и 30% от суммы всех остальных.

Значительно более сложный метод для оценки громкости реальных звуковых сигналов (шума, музыки и т.д.) был разработан Цвиккером. Он позволяет оценить громкость комплексного сигнала с учетом взаимной маскировки его составляющих.

Этот метод введен в стандарты ISO532B и ANSI 3.4-1980. На его основе разработаны компьютерные методики расчета громкости и современные цифровые анализаторы громкости типа Zwicker Loudness Analysis Type 7704 со специальным программным обеспечением PULSE, что позволяет выполнять расчет громкости сложных стационарных сигналов в соответствии с международными стандартами, анализ громкости многоканальных нестационарных сигналов с учетом временных характеристик слуха, а также анализ спектрального распределения громкости и др.

Итак, ощущаемая громкость сложного звука зависит не только от его уровня интенсивности (уровня звукового давления), но и от его спектрального состава, что очень важно учитывать при создании музыкальных композиций. Например, звучание инструмента можно сделать более громким при сохранении того же уровня звукового давления за счет изменения его спектра (при этом, правда, произойдет и изменение тембра, так что все нужно делать в разумных пределах).

Интересно также посмотреть, как меняется уровень громкости при сложении основного и запаздывающего сигналов, что может привести (при прослушивании записей в сильно реверберирующем помещении) к существенному изменению баланса громкостей в звуковом материале.

При сложении основного и запаздывающего (например, отраженного) сигналов происходит приращение уровня громкости, при этом оно происходит по-разному в зависимости от общего уровня сигнала. Если сигнал слабый (тихая речь - уровень громкости до 55 фон), то при величине задержки отраженного сигнала в 20…40 мс происходит увеличение уровня громкости на 3 фона, при дальнейшем увеличении времени задержки прирост уровня громкости снижается, т.к. сигналы начинают восприниматься раздельно (эхо). При уровнях громкости больше 55 фон увеличение общего уровня громкости происходит иначе - оно достигает 5 фон при задержке 50 мс, и затем также начинает снижаться.

В заключение приведу данные по уровням громкости (фон) и громкости (сон) для наиболее употребительных шумов и звуков, что может оказаться полезным для практической работы:

Источник звука или шума
Уровень громкости, фон
Громкость, сон
Шум в кабине самолета
128…130
875…1400
Средний шум на улице
55…60
3,08…4,35
Шум на улице с интенсивным движением транспорта
75…80
11,4…17,1
Звук оркестра
80…100
17,1….88
Шум аплодисментов
60…75
4,35…11,4
Разговор на расстоянии 1м:
громкий
65…70
5,87…7,95
обычный
55…60
3,08…4,35
Шум в тихой комнате
25…30
0,2…0,36
Шепот на 1 м
20
0,1
Звук в радиостудии при исполнении соло
40…50
0,98…2,2
Шумное собрание
65…70
5,87…7,95

В музыкальной практике приняты, как известно, другие градации громкости. Их соответствие приведенным выше количественным оценкам громкости и уровням громкости приблизительно следующее:

Обозначение
Наименование
Уровень громкости,фон
Громкость, сон
fff
Форте-фортиссимо - самое громкое
100
88
ff
Фортиссимо - очень громкое
90
38
f
Форте - громкое
80
17,1
p
Пиано - тихое
50
2,2
pp
Пианиссимо - очень тихое
40
0,98
ppp
Пиано-пианиссимо - самое тихое
30
0,36

При создании компьютерных композиций, когда программно можно задавать большое число градаций громкости, полезно учесть, какие из них соответствуют значениям, принятым в музыкальной практике.

 

Ирина Алдошина