VPF::Речевой синтезатор - Форум программистов

RinOSpro

Дата 14.9.2007, 08:08 (ссылка)

(голосов: 0)

Загрузка ...

Unregistered

Есть идея создать речевой синтезатор. Хотелось бы узнать ваше мнение, послушать советы!

Знаю уже есть созданные но их качество оставляет желать лучшего особенно для русского языка.

в русском алфавите есть 33 буквы напимер человек вводит букву программа берет wav файл и проигрывает его вроде все просто что стоит записать 33 звука. ха но не так все просто мы то с вами знаем что речь состоит из фонем, а сколько их и их сочетаний ХЗ.
например буква Р в сочетании с другими буквами будет звучать по другому например. РА, РО, РУ, РЫ, РИ, и т.д. Дальше думайте сами и советуйте.
Может я несу бред поправте меня.

Alexeis

Дата 14.9.2007, 08:56 (ссылка)

(нет голосов)

Загрузка ...

Амеба

Профиль
Группа: Админ
Сообщений: 11743
Регистрация: 12.10.2005
Где: Зеленоград

Репутация: 55
Всего: 459

Цитата(RinOSpro @ 14.9.2007, 08:08

)

в русском алфавите есть 33 буквы напимер человек вводит букву программа берет wav файл и проигрывает его вроде все просто что стоит записать 33 звука. ха но не так все просто мы то с вами знаем что речь состоит из фонем, а сколько их и их сочетаний ХЗ.

В худшем случае это < 33 * 33 = 1089, а вообще это скорее всего будет < 23 * 10 * 2 = 460 (т.е. сочетания гласных и согласных) , что совсем не так уж много, еще есть сочетания из 3х букв. На эту темку должны быть учебники.

--------------------

Vit вечная память.

Обсуждение действий администрации форума производятся только в этом форуме

гениальность идеи состоит в том, что ее невозможно придумать

RinOSpro

Дата 14.9.2007, 09:04 (ссылка)

(голосов: 0)

Загрузка ...

Unregistered

Цитата(Alexeis @ 14.9.2007, 08:56

)

На эту темку должны быть учебники.

Помню был такой помоему назывался "Букварь" smile

Добавлено через 56 секунд
Ну для начала можно попробывать часто используемые сочетания.

Добавлено через 1 минуту и 21 секунду
Хотя нет для начала нужно составить список этих сочетаний

Bitter

Дата 14.9.2007, 09:17 (ссылка)

(нет голосов)

Загрузка ...

Опытный лентяй

Профиль
Группа: Завсегдатай
Сообщений: 1209
Регистрация: 15.8.2004
Где: Харьков, Ukraine

Репутация: 6
Всего: 27

Самую точную эмуляцию речи можно добиться только если сэмулировать речевой аппарат человека. Я не думаю что это не выполнимая задача. Достаточно смоделировать голосовые связки и задержку проходящего через них потока в зависимости от буквы. И тогда хоть синтезированные песни можно орать smile

RinOSpro

Дата 14.9.2007, 09:35 (ссылка)

(голосов: 0)

Загрузка ...

Unregistered

Цитата(Bitter @ 14.9.2007, 09:17

)

Самую точную эмуляцию речи можно добиться только если сэмулировать речевой аппарат человека. Я не думаю что это не выполнимая задача.

Вообще не в тему. Давай я задам этот вопрос лет через сто а ты мне так же ответишь.

А сейчас мы пробуем то что реально воспроизведение заранее записанных wav.

И песни орать нам не надо. Достаточно слушать книги.

Bitter

Дата 14.9.2007, 12:18 (ссылка)

(нет голосов)

Загрузка ...

Опытный лентяй

Профиль
Группа: Завсегдатай
Сообщений: 1209
Регистрация: 15.8.2004
Где: Харьков, Ukraine

Репутация: 6
Всего: 27

Книги читать можно и с помощью MagicGoody. Зачем делать то, что уже сделано? И зачем ждать сто лет? Попытайся сделать что-то стоящее, а не переводить буквы, грубо говоря, из одного формата в другой.

RinOSpro

Дата 14.9.2007, 13:10 (ссылка)

(голосов: 0)

Загрузка ...

Unregistered

Цитата(Bitter @ 14.9.2007, 12:18

)

Книги читать можно и с помощью MagicGoody

а тебя как качество устраивает??

Цитата(Bitter @ 14.9.2007, 12:18

)

И зачем ждать сто лет?

читай выше там один предлагал создать госовые связки ))

Цитата(Bitter @ 14.9.2007, 12:18

)

Попытайся сделать что-то стоящее, а не переводить буквы, грубо говоря, из одного формата в другой.

ты считаешь это нестоящее на сколько я знаю до сих пор нету ни одного речевого синтезатора нормального.

Это сообщение отредактировал(а) RinOSpro - 14.9.2007, 13:19

Bitter

Дата 14.9.2007, 14:26 (ссылка)

(нет голосов)

Загрузка ...

Опытный лентяй

Профиль
Группа: Завсегдатай
Сообщений: 1209
Регистрация: 15.8.2004
Где: Харьков, Ukraine

Репутация: 6
Всего: 27

Вот я и предложил нормальный. А ты хочешь сделать второй MagicGoody. Воспроизводить одельные записанные звуки это лажа. Так как ты не учьтешь ни ударение на слоге ни ударение на слове и не будет никакого разнообразия. Одна и та же буква будет воспроизводиться одинаково, а значит звучать это будет не естесственно.

RinOSpro

Дата 14.9.2007, 14:47 (ссылка)

(голосов: 0)

Загрузка ...

Unregistered

MagicGoody насколько я знаю переводчик.
просто от использует голосовые синтезаторы уже созданные. есть программа Говоруша или говорун не помню она лучше этого MagicGoody. А вот на счет ударения спасибо я над этим подумаю.

Bitter

Дата 14.9.2007, 16:13 (ссылка)

(нет голосов)

Загрузка ...

Опытный лентяй

Профиль
Группа: Завсегдатай
Сообщений: 1209
Регистрация: 15.8.2004
Где: Харьков, Ukraine

Репутация: 6
Всего: 27

Вот удареня и есть главный недостаток воспроизведения готовых звуков. Всё таки подумай над эмитацией голосовых связок. Это было бы супер.

Вот смотри, генеришь синусоиду, которая получается при вибрации связок. Длинна волны - это голос в нормальном режиме. а дальше нужно придумать фильтры, через которые пропускать эту синусоиду. Для каждой буквы свой фильтр. Переход от буквы А к букве Б это морфинг синусоиды полученной фильтром "А" и фильтром "Б". Таким образом синтезируя слово, ты получишь плавные переходы от звука к звуку. Где нужно ударение, увеличиваешь амплитуду синусоиды. В каждом фильтре можно задать случайное незначительное изменение, чтобы каждый раз уква звучала чуть-чуть по другому. И т.д. Так ты получишь довольно достойный синтезатор речи.

ASGDeveloper

Дата 14.9.2007, 16:23 (ссылка)

(нет голосов)

Загрузка ...

developer

Профиль
Группа: Участник
Сообщений: 389
Регистрация: 1.4.2006

Репутация: нет
Всего: 1

Или как вариант можно взять готовый голосовой движок типа Digalo.

Snowy

Дата 14.9.2007, 16:28 (ссылка)

(нет голосов)

Загрузка ...

Эксперт

Профиль
Группа: Модератор
Сообщений: 11363
Регистрация: 13.10.2004
Где: Питер

Репутация: 18
Всего: 484

Стыковать из отдельных вавов - дохлый номер.
Ничего путного из этого не выйдет.
Даже одинаковые фонемы, в разных случаях звучат по разному.
Не говоря уже про слитность, прерывность, смягчение и т.п.
Кроме того в русском языке огромная куча исключений. smile

Вы считаете себя умнее производителей голосовых движков, которые этот вопрос изучали годами? smile

Пожалейте своё время smile

RinOSpro

Дата 14.9.2007, 17:37 (ссылка)

(голосов: 0)

Загрузка ...

Unregistered

Вот посмотрите мой бред

Присоединённый файл ( Кол-во скачиваний: 20 )

sintez.part1.rar 117,19 Kb

RinOSpro

Дата 14.9.2007, 17:38 (ссылка)

(голосов: 0)

Загрузка ...

Unregistered

а вот вторая часть

Присоединённый файл ( Кол-во скачиваний: 21 )

sintez.part2.rar 108,65 Kb

ne0n

Дата 14.9.2007, 17:49 (ссылка)

(нет голосов)

Загрузка ...

PlayBoy

Профиль
Группа: Участник
Сообщений: 733
Регистрация: 5.8.2005
Где: Н.Новгород

Репутация: нет
Всего: 11

Цитата(RinOSpro @ 14.9.2007, 17:37

)

Вот посмотрите мой бред

и эт ты хочешь составить всевозможные комбинации слогов?!

--------------------

http://sa-sec.org
как я вам? smile

0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема \| Delphi: Звук, графика и видео \| Следующая тема »