Меню
Поиск



рефераты скачать Разработка анализатора спектра речи

т. е.

                                                                                                               (1.7)

где В — коэффициент, зависящий от типа резонатора    и   близкий к единице.


    В анализаторах последовательного действия при измерении периодических сигналов переходные процессы возникают вследствие .непрерывного изменения возбуждающей резонатор частоты, опре­деляемой скоростью изменения частоты ∆ƒ генератора качающейся  частоты; 

    На рис.1.6 6 показаны статическая / и динамическая 2 харак­теристики резонатора в виде зависимости квадрата коэффициента -передачи   резонатора /Сот   параметра   обобщенной   расстройки: х = 2(ω-ω0)/dω0, где ωо — резонансная частота,  d — затухание резонатора, Искажения характеристик резонатора определяются следующими отношениями:  S=8Vf/d2ω20 — смещение максимума; ∆С = 16тv2/dω2 — уменьшение высоты максимума:

8v2f-S2—S1=A(16v2f/d2ω04) - приращение относительной ширины полосы пропускания, где А зависит от типа резонатора. Время анализа для анализаторов одновременного действия при­мерно равно времени установления резонаторов. Имея в виду уравнение (6.40), получим

                                                             (1.8)

Скорость анализа определяется отношением рабочего диапазона частот анализатора tр

(рис.6.38а) к времени анализа Tодн:

                                                                      (1.9)

Обозначим fp=k∆ƒ, где ∆ƒp—разрешающая способность резонатора; определяемая уравнением (6.39). После замены ∆ƒф = ∆ƒр/q получим
скорость одновременного анализа νодн(k/qB)∆ƒ2p.

   Скорость последовательного анализа определяется уравнением vпосл = fр/ty или с учетом (6.39) и (6.40) vпосл = ∆ƒp2/q  В. Время анализа в этом случае будет равно

                                                                                 (1.10)

     Из ур-ний (1.8) и (1.10) следует, что время последовательного анализа примерно в А раз больше времени, необходимого для одно­временного анализа.

Промежуточная частота выбирается так, чтобы при минималь­ной длительности исследуемого импульса т изображение спектра, получаемое по зеркальному каналу, не накладывалось на спектро­грамму основного канала (рис. 1.7). В большинстве случаев при исследовании спектра ограничиваются измерением основного и трех боковых лепестков спектра. Ширина основного лепестка прямо­угольного импульса равна 2 т, а боковых лепестков — 1/t. Таким об­разом, для устранения возможности перекрытия необходимо, чтобы fпр>4/t.

Рис. 1.7. Прямое и зеркальное изобра­жения спектра

  

    Диапазон качания частоты гетеродина определяется шириной исследуемого спектра. Для измерения основного и трех боковых ле­пестков диапазон качания должен быть равен (рис.6.39) fг.макс — fг.мин≥8t. Частота развертки определяет число циклов качания частоты гетеродина в секунду. Минимальный период развертки ха­рактеризуется временем последовательного анализа Тпосл. При анализе спектра периодических импульсных сигналов период развертки Тр связан с-периодом следования сигналов Тс соотношением

TTр = тТ ≥ Тпосл, где т — число линий спектра, наблюдаемых па экране трубки.





















                                                     Спектр речи

Речевой сигнал с точки зрения его интенсивности есть величина переменная во времени. Однако средние значения уровня интенсивно­сти за достаточно длительное время наблюдения довольно устойчивы, хотя и разные в различных частотных полосах.

Интенсивность звука (I, Вт/м')— количество энергии, переноси­мой через площадку 1 м2. расположенную перпендикулярно направле­нию распространения звуковой волны за 1 с.

Звуковое давление (Р, Па) — давление звукового поля в данной точке среды, являющееся избыточным по отношению к атмосферно­му давлению:

Pmin — 2 - 10~5 Па — едва слышимый звук;

Рmax = 20 Па — максимально громкий звук;

Рср = 1,5 Па — среднее значение звука для естественной речи.

Для характеристики интенсивности речи обычно пользуются поня­тием спектрального уровня речи, который определяется выражением

Вр = 1016(/1//о),

где /1— интенсивность, отнесенная к полосе частот шириной 1 Гц; /о = 10~12 Вт/м2 — интенсивность, соответствующая абсолютному ну­левому уровню.

Так как I1/Iо  =  (P1/Р0)2,  то


ВР = 20lg (P1/Р2),

где Р1 — звуковое давление, отнесенное к полосе шириной 1 Гц, Па; ро - звуковое давление, соответствующее абсолютно нулевому уров­ню (2 - 1СГ5 Па).

Спектр речи — зависимость среднего в течение длительного време­ни наблюдения спектрального уровня речи от частоты; Вр(f). Спектр Русской речи, усредненный для мужских и женских голосов, представлен на рис. 2.1. Как следует из рис.2.1, основная энергия в спектра речи сосредоточена в области низких частот.


70   100   150200       400 600    1000       2000     4000 5000   Гц

      Рис.  2.1  Спектр русской речи.


      Если рассматривать раздельно спектры мужских и женских голосов, то в спектре мужских максимум незначительно сместится в область низких частот, в спектре женских — в область высоких частот.

                                        

                            Распределение формантных частот


Каждому звуку речи соответствует свое распределение энергии по частотному диапазону, называемое формантным рисунком.

Области частотного диапазона, где происходит увеличение ампли­туд спектральных составляющих, называются форматными областями, а частоты, на которых происходит максимальное увеличение амплиту­ды, — формантными частотами.

Спектральный состав звуков речи различен. Например, для глас­ных и звонких согласных (вокализованных звуков речи) энергетический спектр (формантный рисунок) имеет вид, представленный на рис. 2.2, для невокализованных звуков — на рис. 2.3

Форманта характеризуется амплитудой Аi, частотой Р± и шириной полосы ∆F, или добротностью Qi. Ширина i-й форманты ∆Fi; определяется на уровне 0,707Ai- и связана для гласных звуков с добротно­стью соотношением ∆Fi= Fi/Qi.

Различные звуки имеют разное число формант: гласные — до че­тырех формант, глухие согласные до 5-6 формант.

Первые две форманты называются основными, остальные — вспо­могательными. Основные форманты определяют произносимый звук речи, а вспомогательные характеризуют индивидуальную для каждого

Вр, дБ А


0.707A3,



                                             Спектральный анализ


При дискретизации аналогового сигнала его спектр становится периодическим с периодом повторения, равным частоте дискретиза­ции. Однако одного только этого соотношения оказывается недостаточно для ре­шения всех практических задач спектрального анализа. Во-первых, в качестве исходных данных выступает именно последовательность дискретных отсчетов, а не аналоговый сигнал. Во-вторых, в большинстве случаев анализируемые сиг­налы являются случайными процессами, что требует выполнения какого-либо усреднения при расчете их спектров. Кроме того, в ряде случаев нам известна некоторая дополнительная информация об анализируемом сигнале, и эту инфор­мацию желательно учесть в спектральном анализе.

Обо всех этих аспектах спектрального анализа и пойдет речь в данной главе. Прежде всего мы рассмотрим дискретное преобразование Фурье (ДПФ) - разновидность преобразования Фурье, специально предназначенную для работы с дискретными сигналами. Далее обсудим идеи, лежащие в основе алгоритмов быстрого преобразования Фурье, позволяющих значительно ускорить вычисления.

Дискретное преобразование Фурье, по возможности вычисляемое быстрыми мето­дами, лежит в основе различных технологий спектрального анализа, предназначенных для исследования случайных процессов. Дело в том, что если анализи­руемый сигнал представляет собой случайный процесс, то простое вычисление его ДПФ обычно не представляет большого интереса, так как в результате полу­чается лишь спектр единственной реализации процесса. Поэтому для спектраль­ного анализа случайных сигналов необходимо использовать усреднение спектра. Такие методы, в которых используется только информация, извлеченная из са­мого входного сигнала, называются непараметрическими (попрагате1пс). Другой класс методов предполагает наличие некоторой статистической модели случайного сигнала. Процесс спектрального анализа в данном случае включая себя определение параметров этой модели, и потому такие методы называются параметрическими. Используется также термин «модельный спек­тральный анализ*.


Рис,  2.2. формантный рисунок вокализованных звуков: А2-А3 — амплитуды формант; F1-Гз — частоты формант; ∆F1 — ширина первой форманты

В„.  дБ

Рис.   2.3.   Формантный рисунок невокализованных звуков;  А1 - А5 - амплитуды формант;  F1-F5  — частоты формант.




                                Дискретное преобразование Фурье


В разделе «Спектр дискретного сигнала» главы 3 мы проанализировали явле­ния, происходящие со спектром при дискретизации сигнала. Рассмотрим теперь, что представляет собой спектр дискретного периодического сигнала. Итак, пусть последовательность отсчетов {x(k)} является периодической с перио­дом N:

x(k+ N) = x(k) для любого k.


Такая последовательность полностью описывается конечным набором чисел, в ка­честве которого можно взять произвольный фрагмент длиной N. например {х(к),

k - 0, 1…….            N - 1}. Поставленный в соответствие этой последовательности сигнал

из смещенных по времени дельта-функции:

                                                                                                                          (1)

также, разумеется, будет периодическим с минимальным периодом ЛТ. Так как сигнал (5.1) является дискретным, его спектр должен быть периоди­ческим с периодом 2л/7'. Так как этот сигнал является также и периодическим, его спектр должен быть дискретным с расстоянием между гармониками, рав­ным 2л/(МГ).

Итак, периодический дискретный сигнал имеет периодический дискретный спектр, который также описывается конечным набором из N чисел (один период спектра содержит 2πT/2πNT = N гармоник).

Рассмотрим процедуру вычисления спектра периодического дискретного сигна­ла. Так как сигнал периодический, будем раскладывать его в ряд Фурье. Коэф­фициенты f(л) этого ряда, согласно общей формуле (1.9), равны


                                                                                                                            (2)


  Это приводит к частичному или даже полному заглушению пере­даваемого звука, называемому маскировкой.

Можно сказать,  что маскировка эквивалентна повышению порога слышимости.  Количественно ее можно определить как разность:

М = β-βо,

где β - порог слышимости при воздействии помех; β0 - порог слы­шимости  в тишине.

                                             Разборчивость речи и ее мера


В последние годы широкое развитие получили цифровые сети ин­тегрального обслуживания, в которых все виды информации, в том чи­сле речь, передаются в цифровом виде. При реализации цифровых преобразований речевых сигналов возникают специфические искаже­ния, влияющие на качество речи. Одним из критериев качества речи является ее разборчивость.

   Разборчивость — это объективная количественная величина, харак­теризующая способность тракта телефонной связи передать содержа­щуюся в речи смысловую информацию в данных конкретных условиях акустической среды. Эта величина является объективной в том смы­сле, что зависит от физических параметров тракта телефонной свя­зи, а также от среды, в которой ведется телефонный разговор, и не зависит от субъективных свойств конкретных, измеряющих разборчи­вость операторов.


 Современная измерительная аппаратура давно срослась с цифровыми и процессорными средствами управления и обработки информации. Стрелочные указатели уже становятся нонсенсом даже в дешевых бытовых приборах. Аналитическое оборудование все чаще подключается к обычным ПК через специальные платы-адаптеры. Таким образом, используются интерфейсы и возможности программ приложений, которые можно модернизировать и наращивать без замены основных измерительных блоков, плюс вычислительная мощь настольного компьютера.


Кроме того, и расширение возможностей обычного компьютера возможно за счет разнообразных программно-аппаратных средств, — специальных плат расширения, содержащих измерительные АЦП (аналого-цифровой преобразователь) и ЦАП (цифро-аналоговый преобразователь). И компьютер очень легко превращается в аналитический прибор, к примеру, — спектроанализатор, осциллограф, частотомер… , как и во многое другое. Подобные средства для модернизации компьютеров выпускаются многими фирмами. Однако цена и узконаправленная специфика не делают это оборудование распространенным в наших условиях.


Но зачем далеко ходить? Оказывается, простой ПК в своей конструкции уже содержит средства, которые с некоторыми ограничениями способны превратить его в тот же осциллограф, спектроанализатор, частотомер или генератор импульсов. Согласитесь, уже немало. К тому же делаются все эти превращения только с помощью специальных программ, которые к тому же совершенно бесплатны и каждый желающий может их скачать в Интернете.


 Можно задаться логичным вопросом — как же в измерениях можно обойтись без АЦП и ЦАП? Никак нельзя. Но ведь и то и другое присутствует почти в каждом компьютере, правда, называется по-другому — звуковая карта. А чем не АЦП/ЦАП, скажите, пожалуйста? Это уже давно поняли те, кто написал для нее массу программ, не имеющих никакого отношения к воспроизведению музыки. Ведь обычная звуковая плата ПК способна воспринимать и преобразовывать сигнал сложной формы в пределах звуковой частоты и амплитудой до 2В в цифровую форму со входа LINE-IN или же с микрофона. Возможно и обратное преобразование, — на выход LINE-OUT (Speakers). Таким образом, вы можете работать с любым сигналом до 20 кГц, а то и выше, в зависимости от звуковой платы. Максимальный предел уровня входного напряжения 0,5-2 В тоже не составляет проблемы, — примитивный делитель напряжения на резисторах собирается и калибруется за 15 минут. Вот на таких-то нехитрых принципах и строятся программное обеспечение: осциллографы, осциллоскопы, спектроанализаторы, частотомеры и, наконец, генераторы импульсов всевозможной формы. Такие программы эмулируют на экране компьютера работу привычных для нас приборов, естественно со своей спецификой и в пределах частотного диапазона вашей звуковой платы.


Как это работает? Для пользователя все выглядит очень просто. Запускаем программу, в большинстве случаев такое ПО не нужно даже инсталлировать. На экране монитора появляется изображение осциллографа: с характерным для этих приборов экраном с координатной сеткой, тут же и панель управления с кнопками, движками и регуляторами, тоже часто копирующими вид и форму таковых с настоящих — аппаратных осциллографов. Кроме того, в программных осциллографах могут присутствовать дополнительные возможности, как, например, возможность сохранения исследуемого спектра в памяти, плавное и автоматическое масштабирование изображения сигнала и т.д. Но, конечно же, есть и свои недостатки.


Насчет программных спектроанализаторов стоит оговорится отдельно. Об амплитуде сигналов в спектре здесь мы можем судить лишь относительно, ведь звуковые платы, ввиду своей специфики, не имеют средств определения абсолютной величины амплитуды поступающего на них сигнала. Программы же, использующие уже оцифрованный сигнал со звуковой карты, тем более не в состоянии определить его действительный уровень. Но на практике от них этого и не требуется, обычно уровень сигнала спектра наглядно изображается на шкале в относительных единицах.


Spectrogram v5.0.5 — представитель программ-спектроанализаторов с удобным интерфейсом и довольно-таки продвинутыми возможностями. Анализ сигнала возможен как из файла, так и по входу звуковой карты. Последнее, в принципе, нас больше всего и интересует. В анализаторе предусмотрены гибкие возможности для настройки.

Страницы: 1, 2, 3, 4




Новости
Мои настройки


   рефераты скачать  Наверх  рефераты скачать  

© 2009 Все права защищены.