Как преобразовать звук в графику?

Программирование на Visual Basic, главный форум. Обсуждение тем программирования на VB 1—6.
Даже если вы плохо разбираетесь в VB и программировании вообще — тут вам помогут. В разумных пределах, конечно.
Правила форума
Темы, в которых будет сначала написано «что нужно сделать», а затем просьба «помогите», будут закрыты.
Читайте требования к создаваемым темам.
OlegA
Начинающий
Начинающий
 
Сообщения: 7
Зарегистрирован: 12.05.2006 (Пт) 17:28

Как преобразовать звук в графику?

Сообщение OlegA » 12.05.2006 (Пт) 17:34

Хочу сделать программу распознования речи. Как преобразовать звук идущий с микрофона, в график, такой как в стандартной программе Windows "Звукозапись" или просто в цифры?

GSerg
Шаман
Шаман
 
Сообщения: 14286
Зарегистрирован: 14.12.2002 (Сб) 5:25
Откуда: Магадан

Сообщение GSerg » 12.05.2006 (Пт) 17:47

Хм...
Гы гы.
Название топика радует.

Я бы сказал, что нормальный распознаватель речи ещё никому сделать не удалось, а если звук с микрофона попадает в компютер, то он уже цифры, и преобразовывать не надо.

Предлагаю начать с азов в виде DirectSound.
Как только вы переберёте все варианты решения и не найдёте нужного, тут же обнаружится решение, простое и очевидное для всех, кроме вас

OlegA
Начинающий
Начинающий
 
Сообщения: 7
Зарегистрирован: 12.05.2006 (Пт) 17:28

Сообщение OlegA » 12.05.2006 (Пт) 17:57

Дело в том, что я могу сделать программу, которая распознаёт графики, мне только надо преобразовать звук в этот график, но не не знаю как это сделать, желательно чтобы это было простое преобразование.

GSerg
Шаман
Шаман
 
Сообщения: 14286
Зарегистрирован: 14.12.2002 (Сб) 5:25
Откуда: Магадан

Сообщение GSerg » 12.05.2006 (Пт) 18:04

Всё забавнее и забавнее...

Хотелось бы узнать, чем "распознавание" графика проще "распознавания" массива чисел, а также, что в данном случае (подробно) имеется в виду под "распознаванием"...
Как только вы переберёте все варианты решения и не найдёте нужного, тут же обнаружится решение, простое и очевидное для всех, кроме вас

Viper
Артефакт VBStreets
Артефакт VBStreets
Аватара пользователя
 
Сообщения: 4394
Зарегистрирован: 12.04.2005 (Вт) 17:50
Откуда: Н.Новгород

Сообщение Viper » 12.05.2006 (Пт) 18:07

я бы сказал, что "все чудесатее и чудесатее"... Видимо многое еще интересного предстоит узнать в процессе выяснения истины о том, что же хочет автор...

Название темы сам по себе перл
Весь мир матрица, а мы в нем потоки байтов!

OlegA
Начинающий
Начинающий
 
Сообщения: 7
Зарегистрирован: 12.05.2006 (Пт) 17:28

Сообщение OlegA » 12.05.2006 (Пт) 18:12

А я и не говорил, что распознование графика легче распознования чисел, это одно и тоже. Кто нибудь мог бы сделать исходник, идущего звука с микрофона, преобразующийся в массив цифр? Или киньте ссылку подобной инфы. Сделаю бесплатную прогу распознования русской речи, не имеющей аналогов! Буду очень благодарен любой информации по теме.

Viper
Артефакт VBStreets
Артефакт VBStreets
Аватара пользователя
 
Сообщения: 4394
Зарегистрирован: 12.04.2005 (Вт) 17:50
Откуда: Н.Новгород

Сообщение Viper » 12.05.2006 (Пт) 18:16

OlegA писал(а):Кто нибудь мог бы сделать исходник, идущего звука с микрофона, преобразующийся в массив цифр?


Звук с микрофона - это уже поток цифр... Может действительно стоит сходить в поиск по DirectSound например
Весь мир матрица, а мы в нем потоки байтов!

OlegA
Начинающий
Начинающий
 
Сообщения: 7
Зарегистрирован: 12.05.2006 (Пт) 17:28

Сообщение OlegA » 12.05.2006 (Пт) 18:22

!Viper!
Я понимаю что это цифры уже, скажу точнее. Есть форма, на ней поле, на котором массив чисел, при идущем звуке на микрофон, эти цифры должны менятся. Кто знает где есть такой пример с исходником или кто может сделать?

AjaxVS
Постоялец
Постоялец
 
Сообщения: 506
Зарегистрирован: 01.12.2004 (Ср) 13:12
Откуда: Donetsk, Battle.Net

Сообщение AjaxVS » 12.05.2006 (Пт) 18:23

Название рулез +_+
Автор, видимо хочет, пример эквалайзера (типа как в WinAmp-е).. Я бы тоже не отказался глянуть сурцы..

GSerg
Шаман
Шаман
 
Сообщения: 14286
Зарегистрирован: 14.12.2002 (Сб) 5:25
Откуда: Магадан

Сообщение GSerg » 12.05.2006 (Пт) 18:25

Поооооооле... русское пооо-оооле.... (c)


Нет конкретно таких примеров в виду ненужности оных.
Есть примеры по DirectSound (третий раз!), из которых можно сделать алкаемое (впрочем, предварительно задавшись вопросом "а нужно ли?").
Поиск тут, кстати.
Как только вы переберёте все варианты решения и не найдёте нужного, тут же обнаружится решение, простое и очевидное для всех, кроме вас

Viper
Артефакт VBStreets
Артефакт VBStreets
Аватара пользователя
 
Сообщения: 4394
Зарегистрирован: 12.04.2005 (Вт) 17:50
Откуда: Н.Новгород

Сообщение Viper » 12.05.2006 (Пт) 18:28

OlegA писал(а):Есть форма, на ней поле, на котором массив чисел, при идущем звуке на микрофон, эти цифры должны менятся.


Матрица? :shock:
Весь мир матрица, а мы в нем потоки байтов!

OlegA
Начинающий
Начинающий
 
Сообщения: 7
Зарегистрирован: 12.05.2006 (Пт) 17:28

Сообщение OlegA » 12.05.2006 (Пт) 19:07

А кто нибудь мог бы сделать простейший исходник?

Денис Победря
Мегобойанист
Мегобойанист
 
Сообщения: 1037
Зарегистрирован: 03.01.2005 (Пн) 21:29
Откуда: Из Москвы

Сообщение Денис Победря » 12.05.2006 (Пт) 19:47

Он наверное хочет график звуковой волны, как н-р в НероВэйвЕдитор
[Место cдаётся]

OlegA
Начинающий
Начинающий
 
Сообщения: 7
Зарегистрирован: 12.05.2006 (Пт) 17:28

Сообщение OlegA » 12.05.2006 (Пт) 19:50

ДА! Прямо в точку.

BV
Thinker
Thinker
Аватара пользователя
 
Сообщения: 3987
Зарегистрирован: 12.09.2004 (Вс) 0:55
Откуда: Молдавия, г. Кишинёв

Сообщение BV » 12.05.2006 (Пт) 22:19

Мда... В поиск по wave* WinAPI для получения сигнала. Если не найдёшь, но докажешь, что искал - дам прямую ссылку.
Далее посмотрим.
const char *out = "|*0>78-,+<|"; size_t cc = char_traits<char>::length(out);
for (size_t i=0;i<cc;i++){cout<<static_cast<char>((out[i]^89));}cout<<endl;

OlegA
Начинающий
Начинающий
 
Сообщения: 7
Зарегистрирован: 12.05.2006 (Пт) 17:28

Сообщение OlegA » 13.05.2006 (Сб) 15:52

BV
Почему бы сразу не дать ссылку? Буду очень благодарен.


Вернуться в Visual Basic 1–6

Кто сейчас на конференции

Сейчас этот форум просматривают: AhrefsBot и гости: 145

    TopList