Модераторы: Snowy, Alexeis, MetalFan
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> распознавание слов 
:(
    Опции темы
bald
Дата 10.1.2011, 06:42 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 4
Регистрация: 21.2.2008
Где: Украина, Хмельниц кий

Репутация: нет
Всего: нет



Вечер добрый, господа! 

Хотел бы проконсультироваться по поводу задачи, суть которой такова :
  •  есть несколько wav-файлов, на которых записаны разные слова (далее эталоны);
  •  некто произносит слово, оно так же записывается в wav-файл (далее образец);
  •  необходимо провести сравнительный анализ образца с эталонами и сказать, какое слово было произнесенно
  •  визуализировать эталонное слово и образец
Интересуют варианты того, как это можно реализовать.

Предполагаю, что нужно распарсить wav-файл (это уже сделал), получить данные (также меня интересует, что за данные я оттуда получаю?) и уже используя некие математические алгоритмы (возможно сравнение независимо от амплитуды (нормализованное), сравнение формы огибающей, Kepstrum, или разбитие на фонемы ) определить, какое слово было произнесено.




PM MAIL ICQ Skype   Вверх
Alexeis
Дата 10.1.2011, 10:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Амеба
Group Icon


Профиль
Группа: Админ
Сообщений: 11743
Регистрация: 12.10.2005
Где: Зеленоград

Репутация: 55
Всего: 459



Цитата(bald @  10.1.2011,  07:42 Найти цитируемый пост)
получить данные (также меня интересует, что за данные я оттуда получаю?) 

Подробно тут http://forum.vingrad.ru/topic-89826.html

Цитата(bald @  10.1.2011,  07:42 Найти цитируемый пост)
 и уже используя некие математические алгоритмы (возможно сравнение независимо от амплитуды (нормализованное), сравнение формы огибающей, Kepstrum, или разбитие на фонемы ) определить, какое слово было произнесено.

  Алгоритм свертки определяет степень подобия сигналов. Правда похожие на слух слова могут слишком отличаться (например по длительности произношения слова, тембру)


--------------------
Vit вечная память.

Обсуждение действий администрации форума производятся только в этом форуме

гениальность идеи состоит в том, что ее невозможно придумать
PM ICQ Skype   Вверх
bald
Дата 10.1.2011, 16:30 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 4
Регистрация: 21.2.2008
Где: Украина, Хмельниц кий

Репутация: нет
Всего: нет



Цитата(Alexeis @ 10.1.2011,  10:41)
Подробно тут http://forum.vingrad.ru/topic-89826.html

благодарю. мое предположение подтвердилось, в wav-файле содержатся амплитуды

Это сообщение отредактировал(а) bald - 10.1.2011, 16:34
PM MAIL ICQ Skype   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Delphi: Звук, графика и видео"
Girder
Snowy
Alexeis

Запрещено:

1. Публиковать ссылки на вскрытые компоненты

2. Обсуждать взлом компонентов и делится вскрытыми компонентами

  • Литературу по Дельфи обсуждаем здесь
  • Действия модераторов можно обсудить здесь
  • С просьбами о написании курсовой, реферата и т.п. обращаться сюда
  • Вопросы по реализации алгоритмов рассматриваются здесь
  • 90% ответов на свои вопросы можно найти в DRKB (Delphi Russian Knowledge Base) - крупнейшем в рунете сборнике материалов по Дельфи
  • По вопросам разработки игр стоит заглянуть сюда

FAQ раздела лежит здесь!


Если Вам помогли и атмосфера форума Вам понравилась, то заходите к нам чаще! С уважением, Girder, Snowy.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Delphi: Звук, графика и видео | Следующая тема »


 




[ Время генерации скрипта: 0.0879 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.