Контрактная разработка электроники / Библиотека / Техническое решение: Распознавание голоса

Техническое решение: Распознавание голоса

Программная реализация верификации человека по голосу – библиотека VAPI (Verification Application Programming Interface) – основана на кепстральном описании речевого сигнала и применении векторного квантования для построения кодовых книг, являющихся по сути отпечатком индивидуальных характеристик голоса говорящего. Как и любая другая биометрическая система, VAPI выдает вероятностное решение. Величина ошибки распознавания (Error Rate) составляет 0.0164 при использовании алгоритма дихотомии и 0.0158 при использовании алгоритма векторного квантования.

Готовые алгоритмы

  • Распознавание голоса
  • Распознавание фонем
  • Компрессия речевых сигналов
  • Разделение слов в слитном речевом потоке
  • Шумоподавление в речевом потоке