Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Распознавание речи, Алгоритмы распознавания речи 
:(
    Опции темы
podval
Дата 5.2.2003, 05:53 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 18
Всего: 62



Так что же непонятно? Формулу что ли подсказать?
PM WWW ICQ   Вверх
podval
Дата 5.2.2003, 06:05 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 18
Всего: 62



Цитата
Какие параметры (эталоны) нам дают вейвлеты?

Они дадут основные различия в "деталях" того или иного сигнала. Разложив сигнал по вейвлет-коэффициентам, мы увидим, в каких областях вейвлет-спектра концентрируется основная энергия сигнала. Соответственно, основным классификационным признаком становятся эти самые коэффициенты.
PM WWW ICQ   Вверх
val
Дата 6.2.2003, 00:06 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Program developer
**


Профиль
Группа: Участник Клуба
Сообщений: 992
Регистрация: 14.1.2003
Где: г. Киев

Репутация: 1
Всего: 7



Цитата
Так что же непонятно? Формулу что ли подсказать?


Да


--------------------
Терпимость - величайшее благо человечества...
Ярчайший признак интеллекта – постоянно хорошее настроение…
PM MAIL ICQ   Вверх
podval
Дата 6.2.2003, 01:42 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 18
Всего: 62



D = (X1 - X2)'*S*(X1 - X2)

X1 и Х2 - центроиды классов 1 и 2 - не что иное, как математические ожидания или их статистический аналог, т.е. выборочные средние;
' - символ транспонирования (предполагается, что X1 и Х2 - это векторы);
* - символ матричного умножения;
S - матрица, обратная к обобщенной ковариационной матрице для X1 и Х2.
PM WWW ICQ   Вверх
val
Дата 6.2.2003, 02:46 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Program developer
**


Профиль
Группа: Участник Клуба
Сообщений: 992
Регистрация: 14.1.2003
Где: г. Киев

Репутация: 1
Всего: 7



Цитата
S - матрица, обратная к обобщенной ковариационной матрице для X1 и Х2.


Прокомментируйте пожалуйста...




--------------------
Терпимость - величайшее благо человечества...
Ярчайший признак интеллекта – постоянно хорошее настроение…
PM MAIL ICQ   Вверх
podval
Дата 6.2.2003, 07:04 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 18
Всего: 62



ОК. Пишу сразу в матричном виде. Найдем сначала ковариационные матрицы (точнее, их оценки) для выборок А1 и А2. Соответствующие им векторы средних Х1 и Х2 мы уже имеем.
1. Центрирование:
В1 = А1 - Х1 - из каждого столбца матрицы А1 надо вычесть вектор средних Х1. То же делаем для А2:
В2 = А2 - Х2.

2. Определяем ковариационные матрицы

Cov1 = В1'*В1 - это значит умножить В1 транспонированную на В1 (по правилам умножения матриц!) Соответственно
Cov2 = В2'*В2.

Лирическое отступление: строго говоря, чтобы получились действительно ковариационные матрицы, надо поделить Соv1/(n1 - 1) и Соv1/(n2 - 1) , где n1 и n2 - длины векторов Х1 и Х2. Но это сейчас не понадобится.

3. Вычисляем объединенную (пардон, выше сделал очепятку smile.gif) матрицу:

Cov12 = (Cov1 + Cov2)/(n1 + n2 - 2)

А для вычисления расстояния Махаланобиса Cov12 надо обратить.
PM WWW ICQ   Вверх
val
Дата 7.2.2003, 02:51 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Program developer
**


Профиль
Группа: Участник Клуба
Сообщений: 992
Регистрация: 14.1.2003
Где: г. Киев

Репутация: 1
Всего: 7



Является ли предложенный вариант распознавателя дикторонезависимым?


--------------------
Терпимость - величайшее благо человечества...
Ярчайший признак интеллекта – постоянно хорошее настроение…
PM MAIL ICQ   Вверх
podval
Дата 7.2.2003, 03:09 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 18
Всего: 62



Я такой вопрос не исследовал. Распознать, кому из дикторов принадлежит голос, реально.
Но насчет дикторонезависимости я очень сомневаюсь.
Я думаю, что в таком случае надо воевать с фонемами, формантами и т.п.
Надо поковырять, конечно, попробуй.
PM WWW ICQ   Вверх
val
Дата 17.2.2003, 23:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Program developer
**


Профиль
Группа: Участник Клуба
Сообщений: 992
Регистрация: 14.1.2003
Где: г. Киев

Репутация: 1
Всего: 7



К данной тематике немного отвлеченный вопрос... Пусть есть 2 реализации одного и того же слова, сказанного одним и тем же человеком. Давайте попробуем определиться с тем, что отличного в этих сигналов. Начну я...
1. Разная амплитуда
2. Разная длина за счет различной длины произнесенных гласных


--------------------
Терпимость - величайшее благо человечества...
Ярчайший признак интеллекта – постоянно хорошее настроение…
PM MAIL ICQ   Вверх
podval
Дата 19.2.2003, 06:39 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 18
Всего: 62



Тембр может отличаться.
PM WWW ICQ   Вверх
78125
Дата 22.2.2003, 00:38 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 198
Регистрация: 20.1.2003
Где: Санкт-Петербург

Репутация: нет
Всего: нет



Все намного проще!

Первое в етом деле (распознавании) это длинна фразы!
--------------------
купим подпись
PM MAIL   Вверх
Vladgul
Дата 23.2.2003, 04:52 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Уважаемый podval. Вы обмолвились что можете привести участки кода реализации алгоритма с помощью вейвлетов и расстояния Махаланобиса распознавания принадлежности голоса тому или иному человеку.
Я был бы очень признателен, если Вы их привели здесь или выслали мне на mail [email protected]
Мне интересен сам подход к идентификации человека по голосу, т.е. почитав этот форум и конкретно Ваши сообщения у меня возникла идея о распознавании членов моей семьи (ошибки распознавания не критичны, а кстати, насколько четко отрабатывала Ваша программа?)
  Вверх
Crait
Дата 23.2.2003, 07:48 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 244
Регистрация: 20.2.2003

Репутация: 1
Всего: 1



 Мне тоже были бы интересны процедуры вейвлет-преобразования и вычисления расстояния Махаланобиса. 
Кроме того, нельзя ли рассказать о том, как строилась ковариационная 
матрица ?


Это сообщение отредактировал(а) Crait - 4.6.2008, 17:14
PM MAIL   Вверх
val
Дата 25.2.2003, 03:00 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Program developer
**


Профиль
Группа: Участник Клуба
Сообщений: 992
Регистрация: 14.1.2003
Где: г. Киев

Репутация: 1
Всего: 7



Если уж раскрывать исходный код, то тогда не в частном порядке, а выложить это на форум... Возможно вместе мы сможем как-то усовершенствовать метод...


--------------------
Терпимость - величайшее благо человечества...
Ярчайший признак интеллекта – постоянно хорошее настроение…
PM MAIL ICQ   Вверх
podval
Дата 25.2.2003, 18:44 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 18
Всего: 62



Мне надо хорошо поковыряться в своих исходниках. И не только в них. То, что вы просите, изобретал не я один. А мы вдвоем smile.gif
Так что немного времени. Вопрос научной этики надо решить.
PM WWW ICQ   Вверх
Страницы: (5) Все 1 2 [3] 4 5 
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Алгоритмы"

maxim1000

Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Алгоритмы | Следующая тема »


 




[ Время генерации скрипта: 0.0872 ]   [ Использовано запросов: 20 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.