Перейти к основному содержанию
x
Описание

Цифровой голосовой портрет личности (ЦГПЛ) представляет собой совокупность значений параметров различных математических моделей, которые с заданной степенью точности в компактной и унифицированной форме описывают индивидуальные речевые и голосовые характеристики определённого человека. Идентификация оптимальных значений параметров моделей будет осуществляться алгоритмическим способом с использованием цифровой записи естественного речевого сигнала произнесённого данным человеком. Критериями оптимальности будут служить результаты алгоритмических оценок различных мер сходства между исходным и синтезированным с использованием ЦГПЛ речевыми сигналами. За счет использования ЦГПЛ, который позволит более точно учитывать индивидуальные голосовые характеристики пользователей, будет достигаться значительное улучшение качественных характеристик при решении задач в области компьютерного синтеза и распознавания речи, а также идентификации личности по голосу. Также важным свойством ЦГПЛ является стандартизация и унификация данных об индивидуальных речевых и голосовых характеристиках определённой личности, что позволит использовать единый и унифицированный набор данных при решении всех вышеперечисленных задач.

Потенциально ЦГПЛ может приобрести социальную функцию аналогичную функции цифровой фотографии: пользователи смогут сохранять в электронном виде голосовые портреты близких для себя людей, память о которых им очень важна с тем, чтобы иметь возможность озвучивать произвольную текстовую информацию их голосом. Потенциально реализация технологии создания цифрового голосового портрета личности способна сформировать новый отдельный рынок товаров и услуг основанных на данной технологии в международном масштабе.

Цель и задачи проекта

Основной целью данного проекта является разработка новой открытой технологии для автоматического формирования цифрового голосового портрета личности и решения на её основе следующих задач: компьютерного речевого синтеза, распознавания слитной речи,   идентификации личности по голосу (три основные задачи в области речевых технологий).

Ключевые слова

Цифровой голосовой портрет личности, клонирование речи, речевой синтез, идентификация диктора.