|
Модераторы: Snowy, Alexeis, MetalFan |
|
RinOSpro |
|
|||
Unregistered |
Есть идея создать речевой синтезатор. Хотелось бы узнать ваше мнение, послушать советы!
Знаю уже есть созданные но их качество оставляет желать лучшего особенно для русского языка. в русском алфавите есть 33 буквы напимер человек вводит букву программа берет wav файл и проигрывает его вроде все просто что стоит записать 33 звука. ха но не так все просто мы то с вами знаем что речь состоит из фонем, а сколько их и их сочетаний ХЗ. например буква Р в сочетании с другими буквами будет звучать по другому например. РА, РО, РУ, РЫ, РИ, и т.д. Дальше думайте сами и советуйте. Может я несу бред поправте меня. |
|||
|
||||
Alexeis |
|
|||
Амеба Профиль Группа: Админ Сообщений: 11743 Регистрация: 12.10.2005 Где: Зеленоград Репутация: 55 Всего: 459 |
В худшем случае это < 33 * 33 = 1089, а вообще это скорее всего будет < 23 * 10 * 2 = 460 (т.е. сочетания гласных и согласных) , что совсем не так уж много, еще есть сочетания из 3х букв. На эту темку должны быть учебники. -------------------- Vit вечная память. Обсуждение действий администрации форума производятся только в этом форуме гениальность идеи состоит в том, что ее невозможно придумать |
|||
|
||||
RinOSpro |
|
|||
Unregistered |
||||
|
||||
Bitter |
|
|||
Опытный лентяй Профиль Группа: Завсегдатай Сообщений: 1209 Регистрация: 15.8.2004 Где: Харьков, Ukraine Репутация: 6 Всего: 27 |
Самую точную эмуляцию речи можно добиться только если сэмулировать речевой аппарат человека. Я не думаю что это не выполнимая задача. Достаточно смоделировать голосовые связки и задержку проходящего через них потока в зависимости от буквы. И тогда хоть синтезированные песни можно орать
|
|||
|
||||
RinOSpro |
|
|||
Unregistered |
Вообще не в тему. Давай я задам этот вопрос лет через сто а ты мне так же ответишь. А сейчас мы пробуем то что реально воспроизведение заранее записанных wav. И песни орать нам не надо. Достаточно слушать книги. |
|||
|
||||
Bitter |
|
|||
Опытный лентяй Профиль Группа: Завсегдатай Сообщений: 1209 Регистрация: 15.8.2004 Где: Харьков, Ukraine Репутация: 6 Всего: 27 |
Книги читать можно и с помощью MagicGoody. Зачем делать то, что уже сделано? И зачем ждать сто лет? Попытайся сделать что-то стоящее, а не переводить буквы, грубо говоря, из одного формата в другой.
|
|||
|
||||
RinOSpro |
|
|||
Unregistered |
а тебя как качество устраивает?? читай выше там один предлагал создать госовые связки ))
ты считаешь это нестоящее на сколько я знаю до сих пор нету ни одного речевого синтезатора нормального. Это сообщение отредактировал(а) RinOSpro - 14.9.2007, 13:19 |
|||
|
||||
Bitter |
|
|||
Опытный лентяй Профиль Группа: Завсегдатай Сообщений: 1209 Регистрация: 15.8.2004 Где: Харьков, Ukraine Репутация: 6 Всего: 27 |
Вот я и предложил нормальный. А ты хочешь сделать второй MagicGoody. Воспроизводить одельные записанные звуки это лажа. Так как ты не учьтешь ни ударение на слоге ни ударение на слове и не будет никакого разнообразия. Одна и та же буква будет воспроизводиться одинаково, а значит звучать это будет не естесственно.
|
|||
|
||||
RinOSpro |
|
|||
Unregistered |
MagicGoody насколько я знаю переводчик.
просто от использует голосовые синтезаторы уже созданные. есть программа Говоруша или говорун не помню она лучше этого MagicGoody. А вот на счет ударения спасибо я над этим подумаю. |
|||
|
||||
Bitter |
|
|||
Опытный лентяй Профиль Группа: Завсегдатай Сообщений: 1209 Регистрация: 15.8.2004 Где: Харьков, Ukraine Репутация: 6 Всего: 27 |
Вот удареня и есть главный недостаток воспроизведения готовых звуков. Всё таки подумай над эмитацией голосовых связок. Это было бы супер.
Вот смотри, генеришь синусоиду, которая получается при вибрации связок. Длинна волны - это голос в нормальном режиме. а дальше нужно придумать фильтры, через которые пропускать эту синусоиду. Для каждой буквы свой фильтр. Переход от буквы А к букве Б это морфинг синусоиды полученной фильтром "А" и фильтром "Б". Таким образом синтезируя слово, ты получишь плавные переходы от звука к звуку. Где нужно ударение, увеличиваешь амплитуду синусоиды. В каждом фильтре можно задать случайное незначительное изменение, чтобы каждый раз уква звучала чуть-чуть по другому. И т.д. Так ты получишь довольно достойный синтезатор речи. |
|||
|
||||
ASGDeveloper |
|
|||
developer Профиль Группа: Участник Сообщений: 389 Регистрация: 1.4.2006 Репутация: нет Всего: 1 |
Или как вариант можно взять готовый голосовой движок типа Digalo.
|
|||
|
||||
Snowy |
|
|||
Эксперт Профиль Группа: Модератор Сообщений: 11363 Регистрация: 13.10.2004 Где: Питер Репутация: 18 Всего: 484 |
Стыковать из отдельных вавов - дохлый номер.
Ничего путного из этого не выйдет. Даже одинаковые фонемы, в разных случаях звучат по разному. Не говоря уже про слитность, прерывность, смягчение и т.п. Кроме того в русском языке огромная куча исключений. Вы считаете себя умнее производителей голосовых движков, которые этот вопрос изучали годами? Пожалейте своё время |
|||
|
||||
RinOSpro |
|
|||
Unregistered |
||||
|
||||
RinOSpro |
|
|||
Unregistered |
||||
|
||||
ne0n |
|
|||
PlayBoy Профиль Группа: Участник Сообщений: 733 Регистрация: 5.8.2005 Где: Н.Новгород Репутация: нет Всего: 11 |
и эт ты хочешь составить всевозможные комбинации слогов?! |
|||
|
||||
Правила форума "Delphi: Звук, графика и видео" | |
|
Запрещено: 1. Публиковать ссылки на вскрытые компоненты 2. Обсуждать взлом компонентов и делится вскрытыми компонентами
FAQ раздела лежит здесь! Если Вам помогли и атмосфера форума Вам понравилась, то заходите к нам чаще! С уважением, Girder, Snowy. |
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Delphi: Звук, графика и видео | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |