Модераторы: Rickert, Alexeis, BorisVorontsov
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Нужен движок распознавания речевых команд! 
:(
    Опции темы
earman
Дата 21.11.2004, 16:26 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 3
Регистрация: 21.11.2004

Репутация: нет
Всего: нет



Всем привет!

У меня возникла следующая проблема. Мне необходимо написать прогу (пишу на Visual C++) с речевым интерфейсом (в обе стороны - синтез голосовых сообщений и распознавание голосовых команд). Так вот, если с первой половиной (синтезом) проблем никаких: существуют замечательные русские движки Digalo, L&H и др. (а англоязычных и того больше), то вот с распознаванием проблема...

Задача - не распознавать полноценный текст, а различать где-то пару десятков команд. Все что мне пока удалось откопать - это VoiceCom Центра Речевых Технологий. Они просят за свои продукты бабки, причем на запрос прайс-листа пока не ответили smile... А демку скачать нельзя...

В общем, у кого есть некоторый опыт в разработке речевых программ - подскажите, плз, какой-нибудь движок командного распознавания, желательно - бесплатный (ну или крякнутый на худой конец smile), совместимый с Microsoft SAPI. Буду крайне благодарен!

PM MAIL   Вверх
timson
Дата 23.11.2004, 10:39 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 11
Регистрация: 29.10.2004
Где: уфа

Репутация: нет
Всего: нет



напиши сам. страшного здесь ни чего нет. задача распознавания образов.
простая нейросеть, обучаешь ее,.. и все, пользуешься ей...
только информацию на вход ей надо обрабатывать, высокое качество не надо, и еще учесть громкость, и скорость..
PM MAIL   Вверх
DENNN
Дата 23.11.2004, 17:56 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Участник Клуба
Сообщений: 3878
Регистрация: 27.3.2002
Где: Москва

Репутация: 2
Всего: 43



И я когда в аспирантуру поступал, тоже так думал: "Вот возьму сейчас нейронную сеть, и буду распознавать образы. А эти .... сидят со своими формулами, только время тратят".
Оказалось, что не все в жизни так совсем уж просто и нейронные сети в жизненных задачах сами по себе умеют совсем не так много, как о них говорят. smile

Это сообщение отредактировал(а) DENNN - 23.11.2004, 17:57
PM ICQ   Вверх
earman
Дата 28.11.2004, 20:12 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 3
Регистрация: 21.11.2004

Репутация: нет
Всего: нет



Timson, это чересчур, учитывая, что сделать нужно к январю smile

DENNN, я вот тоже так думаю (хотя такого опыта, как у Вас, не имею)... Изучал я в МИФИ эти нейронные сети в прошлом семестре... И как-то совсем нет энтузиазма с этим возиться smile

Поэтому ищу готовых решений smile
PM MAIL   Вверх
sergejzr
Дата 28.11.2004, 20:16 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Un salsero
Group Icon


Профиль
Группа: Админ
Сообщений: 13285
Регистрация: 10.2.2004
Где: Германия г .Ганновер

Репутация: нет
Всего: 360



Так ведь разве в Microsoft SAPI движка распознавания нет?


--------------------
PM WWW IM ICQ Skype GTalk Jabber AOL YIM MSN   Вверх
earman
Дата 12.12.2004, 23:31 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 3
Регистрация: 21.11.2004

Репутация: нет
Всего: нет



SAPI - только интерфейс, движки устанавливаются отдельно. В поставку SAPI SDK 5.1 входит движок распознавания, но только английский (ну и еще упрощенный китайский smilesmile, да и то посредственного качества smile
PM MAIL   Вверх
atavinta
Дата 31.1.2008, 09:21 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 47
Регистрация: 31.1.2008
Где: Москва

Репутация: нет
Всего: нет



Первая нейронная сеть возникла задолго до динозавров. Это был живой мозг. Самая соврешенная нейросеть - мозг человека. Мозг собаки проще, но голосовые команды понимает. Слдовательно для распознавания голосовых команд нейронные сети как раз подходят, вопрос лишь в том, сможешь ли ты создать сеть требуемой сложности. При распознавании зрительных образов сложность обычно запредельна не только для девелопера, но и технологически, поэтому в ситемах распознавания текста и технического зрения нейронные сети не панацея, но звук проще.
PM MAIL WWW   Вверх
bronislav
Дата 1.2.2008, 18:48 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 334
Регистрация: 29.1.2008
Где: Украина::Донецк

Репутация: нет
Всего: 3



Цитата(atavinta @ 31.1.2008,  09:21)
Первая нейронная сеть возникла задолго до динозавров. Это был живой мозг. Самая соврешенная нейросеть - мозг человека. Мозг собаки проще, но голосовые команды понимает. Слдовательно для распознавания голосовых команд нейронные сети как раз подходят, вопрос лишь в том, сможешь ли ты создать сеть требуемой сложности. При распознавании зрительных образов сложность обычно запредельна не только для девелопера, но и технологически, поэтому в ситемах распознавания текста и технического зрения нейронные сети не панацея, но звук проще.

На данный момент структура разработанных нейронных сетей находится примерно на уровне нервной системы таракана, ну или может уже чуть лучше. А они мне кажется голосовые команды не понимают.

ЗЫ. Я это сказал, не для того чтобы раскритиковать нейронные сети. Мне препод в универе демонстрировал сеть которая распознавала речевые команды, но это была его собственная разработка и делится  он ее не желал(


--------------------
user posted image
иногда проще и быстрей обойти лужу, даже если кажется что она мелкая и путь напрямик короче - ведь она может скрывать открытый люк (с) mes
PM MAIL   Вверх
atavinta
Дата 9.2.2008, 07:20 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 47
Регистрация: 31.1.2008
Где: Москва

Репутация: нет
Всего: нет



"На данный момент структура разработанных нейронных сетей находится примерно на уровне нервной системы таракана, ну или может уже чуть лучше. А они мне кажется голосовые команды не понимают." Требуется на понимание, а распознавание. Это проще. В простейшем случае распознавания звуковых сигналов для этого сгодится слуховой центр сверчка, чей мозг от мозга таракана отличается мало. Просто таракан не понимает, что надораспознавать команды и подчиняться им. Однако, в зависимости от сложности самой команды может потребоваться и целиком мозг обезьяны. Исходя из специфики задачи распознавания изображений (требуется не  идентификация 1-го образа, а разбор с координатами) требуется именно понимание, а для этого с учётом сложности самих изображений, нужен мозг человека и тоже целиком. Кстати, помогите разобратьлся с форумом. Как здесь пользоваться кнопкой "цитата"?
PM MAIL WWW   Вверх
Ruzzz
Дата 8.3.2008, 10:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 20
Регистрация: 8.3.2008

Репутация: нет
Всего: 1



Нужна помощь! Очень!

Задача внедрить в интерфейс программы систему распознавания голосовых команд. С чего начать? Какой библиотекой пользоваться? Есть ли бесплатные?

Нужно не распознавание речи, а именно пару десятков комманд. Как я понимаю для этого нужно использовать Microsoft SAPI. SAPI - только интерфейс, движки устанавливаются отдельно. В поставку SAPI SDK 5.1 входит движок распознавания английского языка. Можна ли этот движок заставить распознавать ЛЮБЫЕ команды, то есть даже те что не являются словами англ. языка? Подскажите более менее нормальные источники - как программировать SAPI. Может подскажите какие движки, для которых нет разницы какой язык.

Даже примерно не знаю как сформулировать запрос для поисковиков, чтобы искать по теме  "Распознавание речи" - приводит либо на обзор платных движков, либо на теорию этого самого распознавания, а мне бы пример работы с какой-либо доступной библиотекой для распознавания голосовых команд(не речь какого-либо языка!).

Выручите други!
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Вы можете найти полезным что...
Alexeis
Rickert
  • Английская документация по DirectX лежит где-то здесь.
  • Английская документация по OpenGL лежит где-то там.
  • Гейм-дев у нас обсуждают где-то тут

Ждём вас! С уважением, Alexeis, Rickert.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | C/C++: Мультимедия, OpenGL/DirectX | Следующая тема »


 




[ Время генерации скрипта: 0.0775 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.