Модераторы: Snowy, Alexeis, MetalFan

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Речевой синтезатор, создание 
:(
    Опции темы
RinOSpro
Дата 14.9.2007, 08:08 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Есть идея создать речевой синтезатор. Хотелось бы узнать ваше мнение, послушать советы!

Знаю уже есть созданные но их качество оставляет желать лучшего особенно для русского языка.

в русском алфавите есть 33 буквы напимер человек вводит букву программа берет wav файл и проигрывает его вроде все просто что стоит записать 33 звука. ха но не так все просто мы то с вами знаем что речь состоит из фонем, а сколько их и их сочетаний ХЗ. 
например буква Р в сочетании с другими буквами будет звучать по другому например. РА, РО, РУ, РЫ, РИ, и т.д. Дальше думайте сами и советуйте.
Может я несу бред поправте меня.
  Вверх
Alexeis
Дата 14.9.2007, 08:56 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Амеба
Group Icon


Профиль
Группа: Админ
Сообщений: 11743
Регистрация: 12.10.2005
Где: Зеленоград

Репутация: 55
Всего: 459



Цитата(RinOSpro @  14.9.2007,  08:08 Найти цитируемый пост)
в русском алфавите есть 33 буквы напимер человек вводит букву программа берет wav файл и проигрывает его вроде все просто что стоит записать 33 звука. ха но не так все просто мы то с вами знаем что речь состоит из фонем, а сколько их и их сочетаний ХЗ. 

В худшем случае это < 33 * 33 = 1089, а вообще это скорее всего будет < 23 * 10 * 2 = 460 (т.е. сочетания гласных и согласных) , что совсем не так уж много, еще есть сочетания из 3х букв. На эту темку должны быть учебники.


--------------------
Vit вечная память.

Обсуждение действий администрации форума производятся только в этом форуме

гениальность идеи состоит в том, что ее невозможно придумать
PM ICQ Skype   Вверх
RinOSpro
Дата 14.9.2007, 09:04 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Цитата(Alexeis @  14.9.2007,  08:56 Найти цитируемый пост)
На эту темку должны быть учебники. 


Помню был такой помоему назывался "Букварь" smile

Добавлено через 56 секунд
Ну для начала можно попробывать часто используемые сочетания.

Добавлено через 1 минуту и 21 секунду
Хотя нет для начала нужно составить список этих сочетаний
  Вверх
Bitter
Дата 14.9.2007, 09:17 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный лентяй
***


Профиль
Группа: Завсегдатай
Сообщений: 1209
Регистрация: 15.8.2004
Где: Харьков, Ukraine

Репутация: 6
Всего: 27



Самую точную эмуляцию речи можно добиться только если сэмулировать речевой аппарат человека. Я не думаю что это не выполнимая задача. Достаточно смоделировать голосовые связки и задержку проходящего через них потока в зависимости от буквы. И тогда хоть синтезированные песни можно орать smile
PM MAIL ICQ Skype   Вверх
RinOSpro
Дата 14.9.2007, 09:35 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Цитата(Bitter @  14.9.2007,  09:17 Найти цитируемый пост)
Самую точную эмуляцию речи можно добиться только если сэмулировать речевой аппарат человека. Я не думаю что это не выполнимая задача. 


Вообще не в тему. Давай я задам этот вопрос лет через сто а ты мне так же ответишь.

А сейчас мы пробуем то что реально воспроизведение заранее записанных wav.

И песни орать нам не надо. Достаточно слушать книги.
  Вверх
Bitter
Дата 14.9.2007, 12:18 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный лентяй
***


Профиль
Группа: Завсегдатай
Сообщений: 1209
Регистрация: 15.8.2004
Где: Харьков, Ukraine

Репутация: 6
Всего: 27



Книги читать можно и с помощью MagicGoody. Зачем делать то, что уже сделано? И зачем ждать сто лет? Попытайся сделать что-то стоящее, а не переводить буквы, грубо говоря, из одного формата в другой.
PM MAIL ICQ Skype   Вверх
RinOSpro
Дата 14.9.2007, 13:10 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Цитата(Bitter @  14.9.2007,  12:18 Найти цитируемый пост)
Книги читать можно и с помощью MagicGoody

а тебя как качество устраивает??

Цитата(Bitter @  14.9.2007,  12:18 Найти цитируемый пост)
И зачем ждать сто лет? 

читай выше там один предлагал создать госовые связки ))

Цитата(Bitter @  14.9.2007,  12:18 Найти цитируемый пост)
Попытайся сделать что-то стоящее, а не переводить буквы, грубо говоря, из одного формата в другой. 

ты считаешь это нестоящее на сколько я знаю до сих пор нету ни одного речевого синтезатора нормального.

Это сообщение отредактировал(а) RinOSpro - 14.9.2007, 13:19
  Вверх
Bitter
Дата 14.9.2007, 14:26 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный лентяй
***


Профиль
Группа: Завсегдатай
Сообщений: 1209
Регистрация: 15.8.2004
Где: Харьков, Ukraine

Репутация: 6
Всего: 27



Вот я и предложил нормальный. А ты хочешь сделать второй MagicGoody. Воспроизводить одельные записанные звуки это лажа. Так как ты не учьтешь ни ударение на слоге ни ударение на слове и не будет никакого разнообразия. Одна и та же буква будет воспроизводиться одинаково, а значит звучать это будет не естесственно.
PM MAIL ICQ Skype   Вверх
RinOSpro
Дата 14.9.2007, 14:47 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











MagicGoody насколько я знаю переводчик.
просто от использует голосовые синтезаторы уже созданные. есть программа Говоруша или говорун не помню она лучше этого MagicGoody. А вот на счет ударения спасибо я над этим подумаю.
  Вверх
Bitter
Дата 14.9.2007, 16:13 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный лентяй
***


Профиль
Группа: Завсегдатай
Сообщений: 1209
Регистрация: 15.8.2004
Где: Харьков, Ukraine

Репутация: 6
Всего: 27



Вот удареня и есть главный недостаток воспроизведения готовых звуков. Всё таки подумай над эмитацией голосовых связок. Это было бы супер.

Вот смотри, генеришь синусоиду, которая получается при вибрации связок. Длинна волны - это голос в нормальном режиме. а дальше нужно придумать фильтры, через которые пропускать эту синусоиду. Для каждой буквы свой фильтр. Переход от буквы А к букве Б это морфинг синусоиды полученной фильтром "А" и фильтром "Б". Таким образом синтезируя слово, ты получишь плавные переходы от звука к звуку. Где нужно ударение, увеличиваешь амплитуду синусоиды. В каждом фильтре можно задать случайное незначительное изменение, чтобы каждый раз уква звучала чуть-чуть по другому. И т.д. Так ты получишь довольно достойный синтезатор речи.
PM MAIL ICQ Skype   Вверх
ASGDeveloper
Дата 14.9.2007, 16:23 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


developer
**


Профиль
Группа: Участник
Сообщений: 389
Регистрация: 1.4.2006

Репутация: нет
Всего: 1



Или как вариант можно взять готовый голосовой движок типа Digalo.
PM MAIL   Вверх
Snowy
Дата 14.9.2007, 16:28 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Модератор
Сообщений: 11363
Регистрация: 13.10.2004
Где: Питер

Репутация: 18
Всего: 484



Стыковать из отдельных вавов - дохлый номер.
Ничего путного из этого не выйдет.
Даже одинаковые фонемы, в разных случаях звучат по разному.
Не говоря уже про слитность, прерывность, смягчение и т.п.
Кроме того в русском языке огромная куча исключений. smile 

Вы считаете себя умнее производителей голосовых движков, которые этот вопрос изучали годами? smile 
Пожалейте своё время  smile 
PM MAIL   Вверх
RinOSpro
Дата 14.9.2007, 17:37 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











Вот посмотрите мой бред

Присоединённый файл ( Кол-во скачиваний: 20 )
Присоединённый файл  sintez.part1.rar 117,19 Kb
  Вверх
RinOSpro
Дата 14.9.2007, 17:38 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











а вот вторая часть

Присоединённый файл ( Кол-во скачиваний: 21 )
Присоединённый файл  sintez.part2.rar 108,65 Kb
  Вверх
ne0n
Дата 14.9.2007, 17:49 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


PlayBoy
**


Профиль
Группа: Участник
Сообщений: 733
Регистрация: 5.8.2005
Где: Н.Новгород

Репутация: нет
Всего: 11



Цитата(RinOSpro @  14.9.2007,  17:37 Найти цитируемый пост)
Вот посмотрите мой бред


и эт ты хочешь составить всевозможные комбинации слогов?!
PM MAIL ICQ   Вверх
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Delphi: Звук, графика и видео"
Girder
Snowy
Alexeis

Запрещено:

1. Публиковать ссылки на вскрытые компоненты

2. Обсуждать взлом компонентов и делится вскрытыми компонентами

  • Литературу по Дельфи обсуждаем здесь
  • Действия модераторов можно обсудить здесь
  • С просьбами о написании курсовой, реферата и т.п. обращаться сюда
  • Вопросы по реализации алгоритмов рассматриваются здесь
  • 90% ответов на свои вопросы можно найти в DRKB (Delphi Russian Knowledge Base) - крупнейшем в рунете сборнике материалов по Дельфи
  • По вопросам разработки игр стоит заглянуть сюда

FAQ раздела лежит здесь!


Если Вам помогли и атмосфера форума Вам понравилась, то заходите к нам чаще! С уважением, Girder, Snowy.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Delphi: Звук, графика и видео | Следующая тема »


 




[ Время генерации скрипта: 0.1595 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.