|
Е.Г. Жиляков, А.С. Белов, С.П. Белов, А.А. Медведева "Обнаружение пауз между словными фрагментами записей речевых сигналов" |
|
Аннотация.
В работе рассматривается задача сегментации записей речевых сигналов на отрезки, порождаемые в присутствии речи (словные отрезки), и паузы между ними. Такая сегментация является важным этапом идентификации речевых компонент на основе некоторых признаков. Предполагается, что отрезки речевого сигнала в паузах речи являются выборками из стационарной последовательности отсчетов, (шумы в паузах). В качестве основной характеристики шумов в паузах предлагается использовать оценки по обучающей выборке математических ожиданий частей энергий их отрезков некоторой конечной длительности в заранее определенных частотных полосах (субполосный анализ). Показано, что использование максимального из отношений частей энергий текущего анализируемого отрезка к соответствующим математическим ожиданиям частей энергий отрезков шумов позволяет в максимальной степени учесть возможное присутствие речевой компоненты. Этот эффект равносилен максимизации отношения сигнал/шум, то есть предлагаемая решающая функция в этом смысле является оптимальной.
Ключевые слова:
сегментация записей речевых сигналов, субполосный анализ, оптимальная решающая функция.
Стр. 40-46.
DOI 10.14357/20718632220105 Литература
1. Компоненты Google и Yndex Алиса: голосовой помощник от компании Яндекс [Электронный ресурс] Корпоративный блок компании Яндекс, Режим доступа: https://yandex.ru/blog/company/alisa (10 октября 2017 г) 2. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи. М.: Радио и связь, 2000. 456. 3. Аграновский А.В., Леднов Д.А. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов. М. : Радио и связь, 2004. 164 с. 4. Дворкович В.П., Дворкович А.В. Цифровые видеоинформационные системы : (теория и практика): практическое пособие. М.: Техносфера, 2012. 1008 с. 5. Рихтер С.Г. Кодирование и передача речи в цифровых системах. М.: Горячая Линия – Телеком, 2011. 304 с. 6. Питмен Э. Основы теории статистических выводов. М.: Мир, 1986. 104 с. 7. Горелик А.Л., Скрипкин В.А. Методы распознавания. М.: Высшая школа, 2004. 260 с. 8. Хургин Я.И., Яковлев В.П. Финитные функции в физике и технике. М.: Наука, 1971. 408 с. 9. Жиляков Е. Г. Оптимальные субполосные методы анализа и синтеза сигналов конечной длительности //Автомат. и телемех. 2015, № 4, 51–66; Autom. Remote Control, 76:4 (2015), 589–602 10. Гантмахер Ф.Р. Теория матриц. М.: Наука, 1966. 576
|