Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Распознавание речи, Алгоритмы распознавания речи 
:(
    Опции темы
chaos
Дата 4.11.2004, 12:28 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Серийный программист
****


Профиль
Группа: Завсегдатай
Сообщений: 2979
Регистрация: 7.7.2004
Где: Екатеринбург

Репутация: нет
Всего: 44



Цитата(Interpretation @ 4.11.2004, 11:20)
Спасибо Podval, спасибо Chaos!!!
Воспользуюсь вашими советами...

Почитаю математику, посмотрю сайты по распознаванию речи и зайду сюда с новыми возникшими у меня вопросами...

есть книга так и называется: Преобразования Лапласа, Фурье, Хаара, там рассматривается мат аппарат для распознования, генерации речи, обработка графики и тд
Авторов не помню (я думаю в любой библиотеке вузов она есть, тк там я ее нашел)
PM WWW   Вверх
Realist
Дата 21.4.2005, 14:33 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 5
Регистрация: 23.3.2005

Репутация: нет
Всего: нет



Есть какие ссылки на рабочие исходники ?
Добавлено @ 14:34
Как записать файл в массив, чтобы выполнить над ним БПФ ?

PM MAIL   Вверх
podval
Дата 22.4.2005, 09:22 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 18
Всего: 62



Realist
Модератор: Пожалуйста, один топик - один вопрос.
Начните другую тему.


PM WWW ICQ   Вверх
grisania
Дата 23.4.2006, 13:11 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 2
Регистрация: 21.4.2006

Репутация: нет
Всего: нет



Цитата(podval @  15.1.2003,  07:05 Найти цитируемый пост)
Самый известный случай - базис Фурье. конечно, для распознавания речи этот базис слабоват. Сейчас известно большое количество примеров использования других базисов. У нас довольно популярны были различные частотно-временные распределения, вейвлеты. Кстати говоря, вейвлеты, на мой взгляд, в плане возможностей по анализу тонкой структуры сигналов выглядят более предпочтительно.
Но и здесь надо долго выбирать, какой конкретно вейвлет (Добеши, Морлет и т.д. и т.п.) выбрать, сколько уровней разложения взять. Но все эти мучения окупятся. Здесь чисто экспериментальная работа.


Есть базис Карунена-Лоева, первые компоненты которго хавают максимум энергии случайного сигнала. Базис Карунена-Лоева это тоже самое что главные компаненты.
Есть статья амеров, где они применяют метод главных компанент для распознвания фонем.
"ROBUST PHONEME DISCRIMINATION USING ACOUSTIC WAVEFORMS"
http://www.uv.es/~balbelo/CBB_icassp02.pdf

ссылка на патент http://www.uv.es/~balbelo/patents.html
Год издания: http://intl.ieeexplore.ieee.org/xpl/abs_fr...rNumber=1005740
This paper appears in: Acoustics, Speech, and Signal Processing, 2002. Proceedings. (ICASSP '02). IEEE International Conference on
Publication Date: 2002
Volume: 1, On page(s): I-317- I-320 vol.1
Meeting Date: 05/13/2002 - 05/17/2002
Location: Orlando, FL, USA 


 
PM MAIL   Вверх
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Алгоритмы"

maxim1000

Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Алгоритмы | Следующая тема »


 




[ Время генерации скрипта: 0.1197 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.