|
Модераторы: Snowy, Alexeis, MetalFan |
|
RinOSpro |
|
|||
Unregistered |
Есть идея создать речевой синтезатор. Хотелось бы узнать ваше мнение, послушать советы!
Знаю уже есть созданные но их качество оставляет желать лучшего особенно для русского языка. в русском алфавите есть 33 буквы напимер человек вводит букву программа берет wav файл и проигрывает его вроде все просто что стоит записать 33 звука. ха но не так все просто мы то с вами знаем что речь состоит из фонем, а сколько их и их сочетаний ХЗ. например буква Р в сочетании с другими буквами будет звучать по другому например. РА, РО, РУ, РЫ, РИ, и т.д. Дальше думайте сами и советуйте. Может я несу бред поправте меня. |
|||
|
||||
Alexeis |
|
|||
Амеба Профиль Группа: Админ Сообщений: 11743 Регистрация: 12.10.2005 Где: Зеленоград Репутация: 55 Всего: 459 |
В худшем случае это < 33 * 33 = 1089, а вообще это скорее всего будет < 23 * 10 * 2 = 460 (т.е. сочетания гласных и согласных) , что совсем не так уж много, еще есть сочетания из 3х букв. На эту темку должны быть учебники. -------------------- Vit вечная память. Обсуждение действий администрации форума производятся только в этом форуме гениальность идеи состоит в том, что ее невозможно придумать |
|||
|
||||
RinOSpro |
|
|||
Unregistered |
||||
|
||||
Bitter |
|
|||
Опытный лентяй Профиль Группа: Завсегдатай Сообщений: 1209 Регистрация: 15.8.2004 Где: Харьков, Ukraine Репутация: 6 Всего: 27 |
Самую точную эмуляцию речи можно добиться только если сэмулировать речевой аппарат человека. Я не думаю что это не выполнимая задача. Достаточно смоделировать голосовые связки и задержку проходящего через них потока в зависимости от буквы. И тогда хоть синтезированные песни можно орать
|
|||
|
||||
RinOSpro |
|
|||
Unregistered |
Вообще не в тему. Давай я задам этот вопрос лет через сто а ты мне так же ответишь. А сейчас мы пробуем то что реально воспроизведение заранее записанных wav. И песни орать нам не надо. Достаточно слушать книги. |
|||
|
||||
Bitter |
|
|||
Опытный лентяй Профиль Группа: Завсегдатай Сообщений: 1209 Регистрация: 15.8.2004 Где: Харьков, Ukraine Репутация: 6 Всего: 27 |
Книги читать можно и с помощью MagicGoody. Зачем делать то, что уже сделано? И зачем ждать сто лет? Попытайся сделать что-то стоящее, а не переводить буквы, грубо говоря, из одного формата в другой.
|
|||
|
||||
RinOSpro |
|
|||
Unregistered |
а тебя как качество устраивает?? читай выше там один предлагал создать госовые связки ))
ты считаешь это нестоящее на сколько я знаю до сих пор нету ни одного речевого синтезатора нормального. Это сообщение отредактировал(а) RinOSpro - 14.9.2007, 13:19 |
|||
|
||||
Bitter |
|
|||
Опытный лентяй Профиль Группа: Завсегдатай Сообщений: 1209 Регистрация: 15.8.2004 Где: Харьков, Ukraine Репутация: 6 Всего: 27 |
Вот я и предложил нормальный. А ты хочешь сделать второй MagicGoody. Воспроизводить одельные записанные звуки это лажа. Так как ты не учьтешь ни ударение на слоге ни ударение на слове и не будет никакого разнообразия. Одна и та же буква будет воспроизводиться одинаково, а значит звучать это будет не естесственно.
|
|||
|
||||
RinOSpro |
|
|||
Unregistered |
MagicGoody насколько я знаю переводчик.
просто от использует голосовые синтезаторы уже созданные. есть программа Говоруша или говорун не помню она лучше этого MagicGoody. А вот на счет ударения спасибо я над этим подумаю. |
|||
|
||||
Bitter |
|
|||
Опытный лентяй Профиль Группа: Завсегдатай Сообщений: 1209 Регистрация: 15.8.2004 Где: Харьков, Ukraine Репутация: 6 Всего: 27 |
Вот удареня и есть главный недостаток воспроизведения готовых звуков. Всё таки подумай над эмитацией голосовых связок. Это было бы супер.
Вот смотри, генеришь синусоиду, которая получается при вибрации связок. Длинна волны - это голос в нормальном режиме. а дальше нужно придумать фильтры, через которые пропускать эту синусоиду. Для каждой буквы свой фильтр. Переход от буквы А к букве Б это морфинг синусоиды полученной фильтром "А" и фильтром "Б". Таким образом синтезируя слово, ты получишь плавные переходы от звука к звуку. Где нужно ударение, увеличиваешь амплитуду синусоиды. В каждом фильтре можно задать случайное незначительное изменение, чтобы каждый раз уква звучала чуть-чуть по другому. И т.д. Так ты получишь довольно достойный синтезатор речи. |
|||
|
||||
ASGDeveloper |
|
|||
developer Профиль Группа: Участник Сообщений: 389 Регистрация: 1.4.2006 Репутация: нет Всего: 1 |
Или как вариант можно взять готовый голосовой движок типа Digalo.
|
|||
|
||||
Snowy |
|
|||
Эксперт Профиль Группа: Модератор Сообщений: 11363 Регистрация: 13.10.2004 Где: Питер Репутация: 18 Всего: 484 |
Стыковать из отдельных вавов - дохлый номер.
Ничего путного из этого не выйдет. Даже одинаковые фонемы, в разных случаях звучат по разному. Не говоря уже про слитность, прерывность, смягчение и т.п. Кроме того в русском языке огромная куча исключений. Вы считаете себя умнее производителей голосовых движков, которые этот вопрос изучали годами? Пожалейте своё время |
|||
|
||||
RinOSpro |
|
|||
Unregistered |
||||
|
||||
RinOSpro |
|
|||
Unregistered |
||||
|
||||
ne0n |
|
|||
PlayBoy Профиль Группа: Участник Сообщений: 733 Регистрация: 5.8.2005 Где: Н.Новгород Репутация: нет Всего: 11 |
и эт ты хочешь составить всевозможные комбинации слогов?! |
|||
|
||||
RinOSpro |
|
|||
Unregistered |
||||
|
||||
W4FhLF |
|
|||
found myself Профиль Группа: Участник Клуба Сообщений: 2831 Регистрация: 2.12.2006 Репутация: нет Всего: 121 |
На данный момент самый продвинутый речевой движок, который я видел, а точнее слышал, у программы MP3book. Программа умеет читать книги с интонацией и ударением. Какие технологии ииспользует, кроме SAPI-5.1, не в курсе, но автор поработал. Это так, для информации
-------------------- "Бог умер" © Ницше "Ницше умер" © Бог |
|||
|
||||
RinOSpro |
|
|||
Unregistered |
||||
|
||||
W4FhLF |
|
|||
found myself Профиль Группа: Участник Клуба Сообщений: 2831 Регистрация: 2.12.2006 Репутация: нет Всего: 121 |
-------------------- "Бог умер" © Ницше "Ницше умер" © Бог |
|||
|
||||
RinOSpro |
|
|||
Unregistered |
посотрел mp3 book он использует движок Speech Cube Russian (Nicolai) вроде там написано что это на сегодняшний день самый лучший да он лучше чем Lernout & Hauspie, TTS3000 но все равно оставляет желать лучшего.
Добавлено через 3 минуты и 6 секунд к тому же там достигается чтение с интонацией и ударениями благодаря словарику на 4 мб вот кусочек от туда архив : <архи<в> /i архиважный : <архива<жный> /i архивариус : <архива<риус> /i архиватор : <архива<тор> /i архивация : <архива<ция> /i архивирование : <архиви<рование> /i архивирования : <архиви<рования> /i архивированный : <архиви<рованный> /i архивировать : <архиви<ровать> /i архивироваться : <архиви<роваться> /i архивист : <архиви<ст> /i архивистка : <архиви<стка> /i архив-музей : <архи<в-музе<й> /i |
|||
|
||||
Mayk |
|
|||
^аВаТаР^ сообщение>> Профиль Группа: Участник Сообщений: 2616 Регистрация: 22.5.2005 Где: за границей разум а Репутация: нет Всего: 134 |
Есть идеи получше? -------------------- Здесь был кролик. Но его убили. Человеки < кроликов, йа считаю. |
|||
|
||||
RinOSpro |
|
||||
Unregistered |
Вот кое что нашел на эту тему почитайте кому интересно
Добавлено через 2 минуты и 31 секунду и еще по орфоэпии
Это сообщение отредактировал(а) RinOSpro - 15.9.2007, 20:26 |
||||
|
|||||
RinOSpro |
|
|||
Unregistered |
RealSpeak - Katerina вот это самая офигенная девушка )) Точнее самый офигенный речевой синтезатор который я скачал красивый женский голос, просто супер , но иногда всетаки проскакивает компьютерный скрип.
|
|||
|
||||
Vetos |
|
|||
Опытный Профиль Группа: Участник Сообщений: 312 Регистрация: 4.4.2005 Репутация: нет Всего: 4 |
не обежайся но самое смешное слово это папа
-------------------- Строить нужно так, чтоб никто не сломал! А ломать, чтоб никто не знал 8) :ne_huliganit |
|||
|
||||
foxjony |
|
|||
Новичок Профиль Группа: Участник Сообщений: 1 Регистрация: 29.10.2015 Репутация: нет Всего: нет |
Виртуальные вокалисты Yamaha Vocaloid и Virsyn Cantor.
Сравнение двух программ синтеза вокала. http://www.muzoborudovanie.ru/equip/studio.../virtualvoc.php |
|||
|
||||
Правила форума "Delphi: Звук, графика и видео" | |
|
Запрещено: 1. Публиковать ссылки на вскрытые компоненты 2. Обсуждать взлом компонентов и делится вскрытыми компонентами
FAQ раздела лежит здесь! Если Вам помогли и атмосфера форума Вам понравилась, то заходите к нам чаще! С уважением, Girder, Snowy. |
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Delphi: Звук, графика и видео | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |