ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ И СЕТИ
ОБРАБОТКА ИНФОРМАЦИИ И АНАЛИЗ ДАННЫХ
Е.Г. Жиляков, А.С. Белов, С.П. Белов, А.А. Медведева "Обнаружение пауз между словными фрагментами записей речевых сигналов"
УПРАВЛЕНИЕ И ПРИНЯТИЕ РЕШЕНИЙ
ПРОГРАММНАЯ ИНЖЕНЕРИЯ
Е.Г. Жиляков, А.С. Белов, С.П. Белов, А.А. Медведева "Обнаружение пауз между словными фрагментами записей речевых сигналов"
Аннотация. 

В работе рассматривается задача сегментации записей речевых сигналов на отрезки, порождаемые в присутствии речи (словные отрезки), и паузы между ними. Такая сегментация является важным этапом идентификации речевых компонент на основе некоторых признаков. Предполагается, что отрезки речевого сигнала в паузах речи являются выборками из стационарной последовательности отсчетов, (шумы в паузах). В качестве основной характеристики шумов в паузах  предлагается использовать оценки по обучающей выборке математических ожиданий частей энергий их отрезков некоторой конечной длительности в заранее определенных частотных полосах (субполосный анализ). Показано, что использование максимального из отношений частей энергий текущего анализируемого отрезка к соответствующим математическим ожиданиям частей энергий отрезков шумов позволяет в максимальной степени учесть возможное присутствие речевой компоненты. Этот эффект равносилен максимизации отношения сигнал/шум, то есть предлагаемая решающая функция в этом смысле является оптимальной. 

Ключевые слова: 

сегментация записей речевых сигналов, субполосный анализ, оптимальная решающая функция. 

Стр. 40-46.

DOI 10.14357/20718632220105 
 
 
Литература

1. Компоненты Google и Yndex Алиса: голосовой помощник от компании Яндекс [Электронный ресурс] Корпоративный блок компании Яндекс, Режим доступа:
https://yandex.ru/blog/company/alisa (10 октября 2017 г)
2. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи. М.: Радио и связь, 2000. 456.
3. Аграновский А.В., Леднов Д.А. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов. М. : Радио и связь, 2004. 164 с.
4. Дворкович В.П., Дворкович А.В. Цифровые видеоинформационные системы : (теория и практика): практическое пособие. М.: Техносфера, 2012. 1008 с.
5. Рихтер С.Г. Кодирование и передача речи в цифровых системах. М.: Горячая Линия – Телеком, 2011. 304 с.
6. Питмен Э. Основы теории статистических выводов. М.: Мир, 1986. 104 с.
7. Горелик А.Л., Скрипкин В.А. Методы распознавания. М.: Высшая школа, 2004. 260 с.
8. Хургин Я.И., Яковлев В.П. Финитные функции в физике и технике. М.: Наука, 1971. 408 с.
9. Жиляков Е. Г. Оптимальные субполосные методы анализа и синтеза сигналов конечной длительности //Автомат. и телемех. 2015, № 4, 51–66; Autom. Remote Control, 76:4 (2015), 589–602
10. Гантмахер Ф.Р. Теория матриц. М.: Наука, 1966. 576
 

2024 / 03
2024 / 02
2024 / 01
2023 / 04

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".