![]() |
Модераторы: Rickert, Alexeis, BorisVorontsov |
![]() ![]() ![]() |
|
earman |
|
|||
Новичок Профиль Группа: Участник Сообщений: 3 Регистрация: 21.11.2004 Репутация: нет Всего: нет |
Всем привет!
У меня возникла следующая проблема. Мне необходимо написать прогу (пишу на Visual C++) с речевым интерфейсом (в обе стороны - синтез голосовых сообщений и распознавание голосовых команд). Так вот, если с первой половиной (синтезом) проблем никаких: существуют замечательные русские движки Digalo, L&H и др. (а англоязычных и того больше), то вот с распознаванием проблема... Задача - не распознавать полноценный текст, а различать где-то пару десятков команд. Все что мне пока удалось откопать - это VoiceCom Центра Речевых Технологий. Они просят за свои продукты бабки, причем на запрос прайс-листа пока не ответили ![]() В общем, у кого есть некоторый опыт в разработке речевых программ - подскажите, плз, какой-нибудь движок командного распознавания, желательно - бесплатный (ну или крякнутый на худой конец ![]() |
|||
|
||||
timson |
|
|||
Новичок Профиль Группа: Участник Сообщений: 11 Регистрация: 29.10.2004 Где: уфа Репутация: нет Всего: нет |
напиши сам. страшного здесь ни чего нет. задача распознавания образов.
простая нейросеть, обучаешь ее,.. и все, пользуешься ей... только информацию на вход ей надо обрабатывать, высокое качество не надо, и еще учесть громкость, и скорость.. |
|||
|
||||
DENNN |
|
|||
Эксперт ![]() ![]() ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 3878 Регистрация: 27.3.2002 Где: Москва Репутация: 2 Всего: 43 |
И я когда в аспирантуру поступал, тоже так думал: "Вот возьму сейчас нейронную сеть, и буду распознавать образы. А эти .... сидят со своими формулами, только время тратят".
Оказалось, что не все в жизни так совсем уж просто и нейронные сети в жизненных задачах сами по себе умеют совсем не так много, как о них говорят. ![]() Это сообщение отредактировал(а) DENNN - 23.11.2004, 17:57 |
|||
|
||||
earman |
|
|||
Новичок Профиль Группа: Участник Сообщений: 3 Регистрация: 21.11.2004 Репутация: нет Всего: нет |
Timson, это чересчур, учитывая, что сделать нужно к январю
![]() DENNN, я вот тоже так думаю (хотя такого опыта, как у Вас, не имею)... Изучал я в МИФИ эти нейронные сети в прошлом семестре... И как-то совсем нет энтузиазма с этим возиться ![]() Поэтому ищу готовых решений ![]() |
|||
|
||||
sergejzr |
|
|||
![]() Un salsero ![]() Профиль Группа: Админ Сообщений: 13285 Регистрация: 10.2.2004 Где: Германия г .Ганновер Репутация: нет Всего: 360 |
Так ведь разве в Microsoft SAPI движка распознавания нет?
|
|||
|
||||
earman |
|
|||
Новичок Профиль Группа: Участник Сообщений: 3 Регистрация: 21.11.2004 Репутация: нет Всего: нет |
SAPI - только интерфейс, движки устанавливаются отдельно. В поставку SAPI SDK 5.1 входит движок распознавания, но только английский (ну и еще упрощенный китайский
![]() ![]() ![]() |
|||
|
||||
atavinta |
|
|||
Новичок Профиль Группа: Участник Сообщений: 47 Регистрация: 31.1.2008 Где: Москва Репутация: нет Всего: нет |
Первая нейронная сеть возникла задолго до динозавров. Это был живой мозг. Самая соврешенная нейросеть - мозг человека. Мозг собаки проще, но голосовые команды понимает. Слдовательно для распознавания голосовых команд нейронные сети как раз подходят, вопрос лишь в том, сможешь ли ты создать сеть требуемой сложности. При распознавании зрительных образов сложность обычно запредельна не только для девелопера, но и технологически, поэтому в ситемах распознавания текста и технического зрения нейронные сети не панацея, но звук проще.
|
|||
|
||||
bronislav |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 334 Регистрация: 29.1.2008 Где: Украина::Донецк Репутация: нет Всего: 3 |
На данный момент структура разработанных нейронных сетей находится примерно на уровне нервной системы таракана, ну или может уже чуть лучше. А они мне кажется голосовые команды не понимают. ЗЫ. Я это сказал, не для того чтобы раскритиковать нейронные сети. Мне препод в универе демонстрировал сеть которая распознавала речевые команды, но это была его собственная разработка и делится он ее не желал( -------------------- ![]() иногда проще и быстрей обойти лужу, даже если кажется что она мелкая и путь напрямик короче - ведь она может скрывать открытый люк (с) mes |
|||
|
||||
atavinta |
|
|||
Новичок Профиль Группа: Участник Сообщений: 47 Регистрация: 31.1.2008 Где: Москва Репутация: нет Всего: нет |
"На данный момент структура разработанных нейронных сетей находится примерно на уровне нервной системы таракана, ну или может уже чуть лучше. А они мне кажется голосовые команды не понимают." Требуется на понимание, а распознавание. Это проще. В простейшем случае распознавания звуковых сигналов для этого сгодится слуховой центр сверчка, чей мозг от мозга таракана отличается мало. Просто таракан не понимает, что надораспознавать команды и подчиняться им. Однако, в зависимости от сложности самой команды может потребоваться и целиком мозг обезьяны. Исходя из специфики задачи распознавания изображений (требуется не идентификация 1-го образа, а разбор с координатами) требуется именно понимание, а для этого с учётом сложности самих изображений, нужен мозг человека и тоже целиком. Кстати, помогите разобратьлся с форумом. Как здесь пользоваться кнопкой "цитата"?
|
|||
|
||||
Ruzzz |
|
|||
Новичок Профиль Группа: Участник Сообщений: 20 Регистрация: 8.3.2008 Репутация: нет Всего: 1 |
Нужна помощь! Очень!
Задача внедрить в интерфейс программы систему распознавания голосовых команд. С чего начать? Какой библиотекой пользоваться? Есть ли бесплатные? Нужно не распознавание речи, а именно пару десятков комманд. Как я понимаю для этого нужно использовать Microsoft SAPI. SAPI - только интерфейс, движки устанавливаются отдельно. В поставку SAPI SDK 5.1 входит движок распознавания английского языка. Можна ли этот движок заставить распознавать ЛЮБЫЕ команды, то есть даже те что не являются словами англ. языка? Подскажите более менее нормальные источники - как программировать SAPI. Может подскажите какие движки, для которых нет разницы какой язык. Даже примерно не знаю как сформулировать запрос для поисковиков, чтобы искать по теме "Распознавание речи" - приводит либо на обзор платных движков, либо на теорию этого самого распознавания, а мне бы пример работы с какой-либо доступной библиотекой для распознавания голосовых команд(не речь какого-либо языка!). Выручите други! |
|||
|
||||
![]() ![]() ![]() |
Вы можете найти полезным что... | |
|
|
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | C/C++: Мультимедия, OpenGL/DirectX | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |