Модераторы: Rickert, Alexeis, BorisVorontsov
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Посоветуйте чтиво для обработки звука? повышение/понижение тональности, эхо,... 
:(
    Опции темы
Proger10
Дата 24.7.2009, 01:07 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 312
Регистрация: 16.12.2008

Репутация: нет
Всего: нет



Подскажите пожалуйста, есть ли какие-либо книги по программной обработке звука? Эхо, ревер, понижение/повышение тональности. Весьма интересует тема порождения и распознавания речи.

Гуглить пытался - бестолку. Нахожу упоминания книг, но не найду где скачать их smile

Может у кого есть литература по данному направлению?
PM MAIL   Вверх
Alexeis
Дата 24.7.2009, 09:28 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Амеба
Group Icon


Профиль
Группа: Админ
Сообщений: 11743
Регистрация: 12.10.2005
Где: Зеленоград

Репутация: 5
Всего: 459



Цитата(Proger10 @  24.7.2009,  00:07 Найти цитируемый пост)
понижение/повышение тональности

  Делаешь фурье, получаешь комплексный спектр, если в серединку комплексного спектра добавить ноликов, а потом сделать обратное фурье, то тон понизиться. Если ноликов добивать слева и справа (симметрично) начиная с первого отсчета. 1й и n-1й, 2й и n-2й и т.д. то тон станет более высоким (0й отсчет не трогать).
  Эхо скорее всего это дубль фрагмента размноженный и смикшированный на сигнал. Насколько я знаю реверберация это модуляция сигнала низкой частотой, операция умножения сигналов.
  По поводу поиску литературы, вам сюда http://forum.vingrad.ru/forum/wanted.html в специальный раздел.


--------------------
Vit вечная память.

Обсуждение действий администрации форума производятся только в этом форуме

гениальность идеи состоит в том, что ее невозможно придумать
PM ICQ Skype   Вверх
Proger10
Дата 24.7.2009, 12:37 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 312
Регистрация: 16.12.2008

Репутация: нет
Всего: нет



Спасибо! Попробуем чего-нибудь сделать в подобном плане. С микрофона удаётся получать звук через PortAudio, через него же успешно выводить записанный только что сигнал. Вот этот исходник:
https://www.mat.ucsb.edu/projects/scatter/b...record.c?rev=22

Но если честно, мне не очень понятен сам процесс работы.. Изначально перед микрофоном у нас аналоговый, непрерывный сигнал.. далее проходя через микрофон он дискретизируется (разрывается). Мы получаем уже почти тот же сигнал, что был и на входе только дискретизированный в виде огромного набора частот. Количество этих частот на еденицу времени (секунду) постоянно и называется частотой дескритизации. Пока что верно? smile

Далее мы применяем преобразование Фурье. Нам нужно дискретное преобразование Фурье?
Смотрю сейчас на http://ru.wikipedia.org/wiki/Дискретное_преобразование_Фурье - чёт они какие-то другие smile помню там косинусы, синусы разные были в формулах, а тут нет... smile
Так Фурье применять нам к каким числам нужно, ко всему полученному звуку или к одной секунде звучания, или к чему-то ещё..?
PM MAIL   Вверх
Alexeis
Дата 24.7.2009, 16:36 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Амеба
Group Icon


Профиль
Группа: Админ
Сообщений: 11743
Регистрация: 12.10.2005
Где: Зеленоград

Репутация: 5
Всего: 459



Цитата(Proger10 @  24.7.2009,  11:37 Найти цитируемый пост)
Мы получаем уже почти тот же сигнал, что был и на входе только дискретизированный в виде огромного набора частот. 

  В виде большого числа выборок, т.е. чисел пропорциональных амплитуде сигнала. 

Цитата(Proger10 @  24.7.2009,  11:37 Найти цитируемый пост)
Так Фурье применять нам к каким числам нужно, ко всему полученному звуку или к одной секунде звучания, или к чему-то ещё..? 

  К фрагменту. Чем больше точек в фрагменте тем больше точность спектра, но тем медленнее оно вычисляется. Обычно используют "скользящее" оконное фурье, сигнал умножают еще на оконную функцию, которая ослабляет искажения возникающие от того что работа ведется покусочно.


--------------------
Vit вечная память.

Обсуждение действий администрации форума производятся только в этом форуме

гениальность идеи состоит в том, что ее невозможно придумать
PM ICQ Skype   Вверх
Proger10
Дата 26.7.2009, 02:14 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 312
Регистрация: 16.12.2008

Репутация: нет
Всего: нет



Вопрос немного не по теме..
В различных программах типа Audacity, Adobe Audition - можно сильно увеличить звуковое представление, которое будет напомниать что-то типа синусоиды (если скажем сплошной звук 440гц). Это уже преобразованный сигнал по Фурье или нет ещё? smile

Просто не очень понимаю пока что, что из себя представляет звуковой спектр, получаемый после преобразования Фурье.. И чего с ним дальше делать.
PM MAIL   Вверх
Proger10
Дата 26.7.2009, 02:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 312
Регистрация: 16.12.2008

Репутация: нет
Всего: нет



Ещё не очень понятно как именно определяется частота сигнала. Взять тот же 440гц. Т.е. у него 440 раз в секунду колеблется синусоида. Но ведь там может быть и не ровная синусоида. Как в этом случае определить частоту такого сигнала? Кол-во пересечений нуля?

Интересно, а есть ли какой-то специализированный форум по подобным вещам?
PM MAIL   Вверх
Alexeis
Дата 26.7.2009, 11:02 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Амеба
Group Icon


Профиль
Группа: Админ
Сообщений: 11743
Регистрация: 12.10.2005
Где: Зеленоград

Репутация: 5
Всего: 459



  Лучше почитать мануалы, например http://prodav.narod.ru/signals/doc/ts08.doc да и вообще на сайте давыдова сцылко много полезной инфы по цифровой обработке. 


--------------------
Vit вечная память.

Обсуждение действий администрации форума производятся только в этом форуме

гениальность идеи состоит в том, что ее невозможно придумать
PM ICQ Skype   Вверх
Proger10
Дата 27.7.2009, 01:03 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 312
Регистрация: 16.12.2008

Репутация: нет
Всего: нет



Ого сколько чтива. Спасибо за информацию! smile

Вроде уже проясняется потихоньку. Параллельно экспериментирую с увеличением масштаба звуковых волн в Audacity. Генерирую различные звуки и смотрю в каком виде представляется сигнал. 
Насколько я понял вот это и есть спектр, полученный по Фурье? http://www.youtube.com/watch?v=OvkFxyKKGNY

Только не пойму как оно может применяться в распознавании. (хотя бы в попытке различия двух разных гласных звуков).
Мне кажется, что их распознавать надо по их волновому представлению. Но причём тут спектр? Какое он место занимает здесь? Кроме как шумы отсекать не могу представить для чего ещё его используют.. smile Или всё-таки не так я его себе представляю..
PM MAIL   Вверх
Alexeis
Дата 27.7.2009, 20:57 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Амеба
Group Icon


Профиль
Группа: Админ
Сообщений: 11743
Регистрация: 12.10.2005
Где: Зеленоград

Репутация: 5
Всего: 459



Цитата(Proger10 @  27.7.2009,  00:03 Найти цитируемый пост)
Мне кажется, что их распознавать надо по их волновому представлению. Но причём тут спектр? Какое он место занимает здесь?

  Спектр это и есть волновое представление, а на видео модуль комплексного спектра.


--------------------
Vit вечная память.

Обсуждение действий администрации форума производятся только в этом форуме

гениальность идеи состоит в том, что ее невозможно придумать
PM ICQ Skype   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Вы можете найти полезным что...
Alexeis
Rickert
  • Английская документация по DirectX лежит где-то здесь.
  • Английская документация по OpenGL лежит где-то там.
  • Гейм-дев у нас обсуждают где-то тут

Ждём вас! С уважением, Alexeis, Rickert.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | C/C++: Мультимедия, OpenGL/DirectX | Следующая тема »


 




[ Время генерации скрипта: 0.0769 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.