Какое расширение имеют файлы содержащие звук закодированный в стандарте

Файлы с оцифрованным звуком (digitized sound files) — звуковые файлы, в которых исходная непрерывная («аналоговая») форма сигнала записана в виде последовательности коротких дискретных значений амплитуд звукового сигнала, измеренных («выбранных») через одинаковые промежутки времени и имеющих между собой весьма малый интервал. Процесс замены непрерывного сигнала последовательностью его значений называют дискретизацией (sampling), а такую форму записи — импульсно-кодовой (pulse code). Аппаратная реализация обработки оцифрованного звука состоит в том, что аналого-цифрового преобразователь (АЦП) преобразует аналоговый сигнал в множество цифровых замеров, а при воспроизведении цифро-аналоговый преобразователь (ЦАП) осуществляет обратный процесс — преобразование цифрового сигнала в аналоговый. Файлы с оцифрованным звуком бывают двух видов: с заголовком и без заголовка.

Основные понятия и термины, связанные с оцифровкой звука:
Выборка, отсчет звукового сигнала (sample) — дискретное («мгновенное») значение, соответствующее минимальному фрагменту исходного звукового сигнала, который подается на вход аналого-цифрового преобразователя (АЦП) при записи звука или получается с использованием цифро-аналогового преобразователя (ЦАП) при его воспроизведении. Выборка характеризует амплитуду звукового сигнала, обычно представляет собой целое число (8 или 16 бит). Выборка может производиться по одному каналу (моно), двум (стерео) или большему числу каналов. Процесс разделения сигнала на выборки называется квантованием (quantizing).
Разрядность дискретизации (sample size) — величина, определяющая количество бит на один канал. Разрядность дискретизации определяет точность замера и качество записи звука. В частности, она влияет на величину отношения сигнала к шуму (signal-to-noise-ratio). Чем выше разрядность дискретизации, тем выше качество записи и воспроизведения звука. Однако при увеличении ее значения растет и объем записи.
Частота дискретизации (sampling rate) — величина, которая определяет, сколько раз в секунду производится считывание выборок из аналогового сигнала. При цифровой записи звуков частота дискретизации измеряется в герцах и килогерцах. Чем выше частота дискретизации, тем выше качество звука. Однако соответственно увеличивается и объем записи. Для определения оптимальной частоты и разрядности необходимо найти компромисс между звуковым качеством и размером данных. В соответствии с Теоремой Котельникова, в сигнале, измеряемом с частотой дискретизации fд, не должны содержаться гармонические компоненты с частотами выше fд/2, иначе цифровое представление сигнала не будет адекватно аналоговому. Частоту fн = fд/2 называют частотой Найквиста. Это предельная частота, выше которой во входном сигнале не должно быть спектральных компонентов. Если в аналоговом сигнале присутствуют частоты выше fн, возникает эффект наложения спектров (aliasing). Поэтому полосу частот входных сигналов необходимо ограничить фильтром низких частот (ФНЧ), который в этом случае называется anti-aliasing фильтром. На практике максимально допустимая частота сигнала определяется частотой подавления ФНЧ (граничная частота, с которой начинается полоса подавления). Поскольку амплитудная характеристика фильтра за частотой среза спадает до нуля не перпендикулярно, а с некоторым наклоном, fд и частота среза должны разниться более чем вдвое.

Наиболее часто встречающиеся частоты дискретизации (Значение fд, Гц — Область применения и/или принцип выбора значения):
5500 — 1/4 частоты дискретизации ПК Macintosh.
7333 — 1/3 частоты дискретизации ПК Macintosh.
8000 — используется для ИКМ-канала телефонного сигнала с A-, мю-законами компандирования (Рекомендации G.711 и G.712 МККТТ). Рабочие станции NeXT используют частоту дискретизации 8012, 82 Гц.
11025 — 1/2 частоты дискретизации ПК Macintosh, 1/4 частоты дискретизации компакт-диска (CD).
16000 — используется при сжатии в соответствии с Рекомендацией МККТТ G.722
18900 — стандарт CD-ROM/XA.
22050 — 1/2 частоты дискретизации компакт-диска, частота дискретизации Macintosh (последняя в действительности 22254, 54 Гц).
31250 — цифровая запись звука в видеомагнитофонах системы Video-8 (PAL)
31500 — цифровая запись звука в видеомагнитофонах системы Video-8 (NTSC).
32000 — цифровое радиовещание, цифровые магнитофоны DAT (Digital Audio Tape).
34629 — звуковой канал телевидения.
37800 — стандарт CD-ROM/XA (высокое качество).
44056 — ИКМ-приставка к видеомагнитофону NTSC для записи звука.
44100 — частота дискретизации компакт-диска, цифровых магнитофонов DAT, ИКМ-приставки к видеомагнитофону PAL/SECAM для записи звука.
48000 — цифровые магнитофоны DAT.

Некоторые форматы звуковых файлов поддерживают произвольную частоту дискретизации (например, VOC-файлы в диапазоне от 5000 до 44100 Гц); другие — только определенные частоты дискретизации (WAV-файлы могут быть оцифрованы с частотами 11025, 22050, 44100 Гц). Поэтому конвертирование (преобразование) файла одного формата в другой не всегда возможно. Наиболее гибкое средство преобразования звуковых файлов различных форматов — программа SOX (Sound Exchange), которая допускает кроме конвертирования введение различных эффектов (добавление эха, фильтрацию, изменение частоты дискретизации).

Файлы с заголовком (files with heading) — один из двух видов файлов с оцифрованным звуком. В заголовке указываются параметры, которые характеризуют оцифрованный звук, включая: частоту дискретизации; количество битов на отсчет (8 или 16); количество каналов — моно (1) или стерео (2); ASCII-символы, описывающие тип файла; длину записанных данных в байтах; номер версии формата; метод компрессии; величину смещения блока данных относительно начала файла.

Некоторые звуковые редакторы (GoldWave, CoolEdit) позволяют импортировать файлы с оцифрованным звуком без заголовка. При этом запрашиваются: частота дискретизации, количество битов на отсчет, количество каналов. Затем информацию можно экспортировать (сохранить) в файле с заголовком (.wav, .voc). Заголовок .voc можно дополнить и утилитой VOCHDR, а полученный файл конвертировать в .wav утилитой VOC2WAV (VOCHDR и VOC2WAV входят в поставку Sound Blaster 16).

Перечень и области применения наиболее распространенных форматов звуковых файлов с заголовком (Расширение — Краткие сведения о форматах):
*.aiff, *.aif — формат AIF (AIFF, Audio Interchange File Format), распространен в системах Apple Macintosh и Silicon Graphics; заключает в себе сочетание MOD и WAV. Формат AIFC (AIFF-С, Audio Interchange File Format-Compressed) — AIFF с заданными параметрами сжатия (компрессии); используется в ПК фирмы Apple.
*.au*.snd — формат AU, предназначен для работы со звуком в рабочих системах SUN, NeXT, DEC, Linux, FreeBSD; обеспечивает экономию памяти, нашел широкое распространение в Интернете. Структура файла проще, чем wav, где указан метод кодирования данных. Наиболее часто используются параметры m-Law 8 кГц – моно, но существуют 16-битные стереофайлы с частотами 22050 и 44100 Гц. SND бывает двух видов: один — AU для SUN и NeXT; другой — восьмибитный монофайл для РС и ПК фирмы Apple с различной частотой дискретизации.
*.avr — предложен фирмой Audio Visual Research (заголовок — 128 байтов).
*.hcom — ПК фирмы Apple.
*.iff — формат IFF (Interchange File Format), имеет сходство с RIFF (Resource Interchange File Format), являющимся универсальным для записи любых структурированных данных. Основное отличие заключается в поддержке программно-сэмплерной эмуляции музыкальных инструментов. Звук в файле делится на две части: то, что должно звучать вначале, и элемент того, что идет за началом. В результате вторая часть звукового фрагмента повторяется за начальной столько раз, сколько нужно пользователю и нота может звучать сколь угодно долго. IFF используется в системах типа IFF/8SVX на компьютерах фирмы Amiga.
*.mp3 — формат MР3, в котором использованы параметры сжатия, имеющие сходство с форматом jpeg для изображений. Коэффициент сжатия составляет 10-12, однако специалистами он считается сложным («навороченным») и не обеспечивающим высокое качество звука. Основным недостатком является эффект контурности звука. При отсутствии строгих требований к качеству звучания его потери считаются неощутимыми.
*.nsp — формат для записи на аппаратуре CSL Model 4300B (фирма Kay Elemetrics).
*.sf — IRCAM Sound Files; программы CSound, MixView.
*.smp — программа SampleVision (фирма Turtle Beach).
*.snd — компьютеры Sun, NeXT.
*.voc — восьмибитный моноформат VOC (Voice File) семейства звуковых карт SoundBlaster фирмы Creative Labs; используется в старых немузыкальных программах. HСОМ — то же самое, что и VOC (8 бит, моно), но для ПК фирмы Apple Macintosh.
*.vqf — формат записи звуковых файлов VQF — альтернативы МР3. К недостаткам VQF относят длительность кодирования и малое число бесплатных программ-приложений, что стало причиной его незначительного распространения.
*.wav — формат WAVE (Waveform Audio File), разработанный фирмой Microsoft; один из простейших для записи и хранения дискретных данных. WAVE относится к одному из вариантов файлов семейства RIFF (Resource Interchange File Format) и является жестко структурированным. В заголовке помимо обычных значений (разрядность, уровни громкости) в WAV могут быть указаны и другие параметры (метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения частей звукового файла, текстовая информация). PCM WAVE — версия WAVE формата данных PCM.

Перечень и области применения наиболее распространенных форматов звуковых файлов без заголовка (Расширение — Краткие сведения о форматах):
*.pcm — PCM (Pulse Code Modulation — буквально Импульсно-кодовая модуляция, ИКМ). Хотя файлы с таким расширением встречаются редко (в основном на аудио-CD), принцип импульсно-кодовой модуляции характерен для всех звуковых файлов. Метод записи и хранения аудиоинформации в формате PCM неэкономный, однако объемы современных устройств внешней памяти (в том числе винчестеров и оптических дисков) позволяют его использовать несмотря на связанные с этим потери, которые могут составлять десятки мегабайт.

*.dpcm — DPCM (Difference Pulse Code Modulation) — вариант формата PCM, в котором с целью повышения экономии хранения звуковых данных на диске использован метод сжатия записи, получивший наименования «разностного РСМ». Эта схема сжатия с фиксированной скоростью преобразовывает последовательность измерений, сохраняя только разницу между последующим и предыдущим значениями сигналов. Сохранение дискового пространства происходит за счет того, что значение разности меньше самих измерений.
*.adpcm — ADPCM (Adaptive DPCM, адаптивный DPCM) — формат DPCM, дополненный использованием коэффициента масштабируемости, что обусловлено требованием исключения искажений звука, вызванных ошибками измерения разности амплитуд сигналов, которые связаны со значительными перепадами громкости отдельных составляющих звука.
*.sb — signed byte (байт со знаком); по умолчанию 8000 Гц, моно.
*.sw — signed word (слово со знаком); по умолчанию 8000 Гц, моно.
*.ub — unsigned byte (байт без знака); по умолчанию 8000 Гц, моно.
*.ul — UL, стандартный формат U-Law (мю-закон). По умолчанию 8 кГц, 8 бит, моно.
*.uw — Unsigned word (слово без знака); по умолчанию 8000 Гц, моно.

Существует ещё один способ кодирования звука, который можно применить только для записи инструментальных мелодий. Он основан на стандарте MIDI (англ. Musical Instrument Digital Interface — цифровой интерфейс музыкальных инструментов).

В отличие от оцифрованного звука в таком формате хранятся последовательность нот, коды инструментов, громкость, тембр, время затухания каждой ноты и т. д.

Фактически такая запись звука — это программа для звуковой карты, в памяти которой хранятся образцы звуков реальных инструментов (волновые таблицы, англ. wave tables).

Современные звуковые карты поддерживают многоканальный звук, т. е. в звуковом файле может храниться несколько дорожек, которые проигрываются одновременно.

Существуют специальные MIDI-клавиатуры, которые позволяют вводить звук и сразу сохранять его в стандарте MIDI (рис. 2.34).

Рис. 2.34

Для проигрывания MIDI-файла используют синтезаторы — электронные устройства, имитирующие звук реальных инструментов.

Простейший синтезатор — звуковая карта компьютера. Главные достоинства инструментального кодирования:

• кодирование мелодии (нотной записи) происходит без потери информации;
• файлы имеют значительно меньший объём в сравнении с оцифрованным звуком той же длительности.

Однако произвольный звук (например, человеческий голос) в таком формате закодировать невозможно.

Используя дополнительные источники, найдите ответы на вопросы.

— Сколько различных музыкальных инструментов включено в стандарт MIDI?
— Что такое полифония?
— Какое расширение имеют файлы, содержащие звук, закодированный в стандарте MIDI?

Следующая страница Кодирование видеоинформации

Cкачать материалы урока

Рис. 2.34

Простейший синтезатор — звуковая карта компьютера. Главные достоинства инструментального кодирования:

Однако произвольный звук (например, человеческий голос) в таком формате закодировать невозможно.

Используя дополнительные источники, найдите ответы на вопросы.

Следующая страница Кодирование видеоинформации

Cкачать материалы урока

Звук представляет собой непрерывный сигнал — звуковую волну с меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека. Чем больше частота сигнала, тем выше тон. Частота звуковой волны выражается числом колебаний в секунду и измеряется в герцах (Гц, Hz). Человеческое ухо способно воспринимать звуки в диапазоне от 20 Гц до 20 кГц, который называют звуковым.

Количество бит, отводимое на один звуковой сигнал, называют глубиной кодирования звука. Современные звуковые карты обеспечивают 16-, 32- или 64-битную глубину кодирования звука.

При кодировании звуковой информации непрерывный сигнал заменяется дискретным, то есть превращается в последовательность электрических импульсов (двоичных нулей и единиц). Важной характеристикой при кодировании звука является частота дискретизации — количество измерений уровней сигнала за 1 секунду:

- 1 (одно) измерение в секунду соответствует частоте 1 Гц;
- 1000 измерений в секунду соответствует частоте 1 кГц.

Количество измерений может лежать в диапазоне от 8 кГц до 48 кГц (от частоты радиотрансляции до частоты, соответствующей качеству звучания музыкальных носителей).

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых можно выделить два основных направления: метод FM и метод Wave-Table.

Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, и следовательно, может быть описан кодом. Разложение звуковых сигналов в гармонические ряды и представление в виде дискретных цифровых сигналов (рис. 1.5) выполняют специальные устройства — аналогово-цифровые преобразователи (АЦП).

Рис. 1.5. Преобразование звукового сигнала в дискретный сигнал:
a — звуковой сигнал на входе АЦП; б — дискретный сигнал на выходе АЦП

Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука представлен на рис. 1.6. Данный метод кодирования не дает хорошего качества звучания, но обеспечивает компактный код.

Рис 1.6. Преобразование дискретного сигнала в звуковой сигнал:
а — дискретный сигнал на входе ЦАП; б — звуковой сигнал на выходе ЦАП

Таблично-волновой метод (Wave-Table) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д.. Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) — один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

Применение MIDI

Основным применением MIDI является хранение и передача музыкальной информации. Сюда можно отнести:

управление электронными музыкальными инструментами в реальном времени;
запись MIDI-потока, формирующегося при игре исполнителя, на носитель данных с последующим редактированием и воспроизведением;
синхронизацию различной аппаратуры (синтезаторов, ритм-машин, блоков обработки звука, световой аппаратуры и т.п.).

Кодирование аудиоинформации

Так как компьютер работает с числами, звуки и музыка должны быть представлены в числовом виде, или, как принято говорить, закодированы. Произвольная аудиоинформация при кодировании занимает много места, поэтому часто используют сжатые аудиоформаты. Музыка занимает меньше места, так как хорошо формализуется – ее можно записать с помощью нот.

Звук представляет собой волну, распространяющуюся в атмосфере, и воспринимаемую человеком с помощью органов слуха. Громкость звука – это его кажущаяся сила. Измеряется громкость в децибелах (дБ). Громкость обычного разговора около 50 дБ, шум на улице часто превышает 70 дБ, а громкость взлетающего самолета составляет 120 дБ. Порог чувствительности человеческого уха около 20 дБ.

Характеризуется звуковая волна изменением во времени частоты и амплитуды сигнала. Графически звуковая волна описывается кривой, задающей зависимость амплитуды от времени. Частота основных колебаний определяет высоту звука. Но звуки одной частоты могут иметь разный тембр.

Чтобы закодировать звук, необходимо измерять амплитуду сигнала через определенные промежутки времени. На каждом временном отрезке определяется средняя амплитуда сигнала. Графически такое преобразование описывается множеством столбиков.

При восстановлении исходной кривой ее вид будет искажен. Искажения тем больше, чем больше ширина столбиков, то есть чем реже определяется текущая амплитуда. Чем промежутки времени меньше, тем выше будет качество закодированного звука. Частота, с которой определяется амплитуда сигнала, называется частотой дискретизации.

Амплитуда сигнала, определенная в каждый момент времени, также должна быть представлена в числовом виде. В простейшем случае можно использовать один бит – есть звук или его нет. Но на практике такое кодирование не имеет смысла. Минимально для кодирования амплитуды сигнала отводятся восемь бит – один байт, что позволяет описать двести пятьдесят шесть уровней громкости. Качество звука при этом получается не слишком высокое. Если и частота дискретизации невелика, то при воспроизведении будут присутствовать сильные искажения. Значительно лучшее качество получается при использовании двух байт, что позволяет задать более шестидесяти пяти тысяч разных значений амплитуды. В большинстве случаев двух байт достаточно для получения высококачественной записи звука, хотя иногда применяют 24 бита – три байта для кодирования амплитуды сигнала.

Для кодирования звуков следует использовать частоту вдвое большую, чем частота кодируемого звука. Объяснение этому довольно простое. Звуковая волна состоит из двух полупериодов: положительного и отрицательного. Поэтому для ее имитации необходимо иметь хотя бы по одной выборке на каждом из полупериодов. Так как человек воспринимает звуки в диапазоне частот от 20 до 20000 Гц, то для качественного кодирования необходимо использовать частоту вдвое большую, чем 20000, то есть 40000 Гц. Тогда сохраненные выборки позволят воспроизводить звуковую волну внутри диапазона, воспринимаемого человеческим ухом. Для качественного кодирования звука принято иметь некоторый запас, поэтому при цифровой звукозаписи используется частота дискретизации 44100 Гц и 48000 Гц. Это означает, что за каждую секунду звукозаписи в цифровом виде записывается более 44000 единиц информации, последовательность которых моделирует звук длительностью в одну секунду.

Для того чтобы записать стереозвук, следует одновременно кодировать два независимых канала звука. При этом чтобы получить хорошее качество, нужно использовать два байта для кодирования и частоту дискретизации 44100 Гц для каждого из каналов. Именно так кодируется звук на компакт-дисках. При этом одна минута закодированного звука займет более 10 Мб. В некоторых случаях можно обойтись более низким качеством, сравнимым с качеством записи диктофона. Для того чтобы закодировать голос, не предъявляя повышенных требований к качеству звучания, можно использовать один байт при кодировании и один монофонический канал. Частоту дискретизации также можно понизить. Чтобы разбирать отдельные слова и понимать их смысл, достаточно частоты дискретизации 8000 Гц. С такими параметрами минута закодированного звука займет менее 480 Кб.

Для повышения качества кодирования используют более высокие частоты дискретизации, до 96000 Гц, однако такое качество требуется исключительно при работе в профессиональных звукозаписывающих студиях.

Современные компьютеры часто используются при создании и воспроизведении музыки. Музыкальное произведение можно закодировать как любой другой звук, однако это займет много места. Кроме того, возникнут трудности при изменении партий отдельных инструментов. Проще указать инструмент и задать, какую ноту и как долго он должен играть. Для воспроизведения музыки компьютер синтезирует разнообразные звуки, которые издают музыкальные инструменты.

В компьютерной музыке используется аббревиатура MIDI, которая расшифровывается как Musical Instrument Digital Interface (Цифровой интерфейс музыкальных инструментов). Имеется стандарт, описывающий основные используемые инструменты, – GM (General MIDI – единый MIDI). В стандарте описаны пятнадцать групп мелодических инструментов и одна группа ударных инструментов. Мелодический набор состоит из пианино, органов, гитар, струнных, духовых и тому подобных инструментов. За всеми инструментами закреплены номера, например, нулевой номер имеет акустический рояль. Кроме GM используются стандарты GS (General Synth – единый синтез), XG (Extended General – единый расширенный), GM2 (General MIDI 2). Все эти стандарты не заменяют собой GM, а лишь дополняют его новыми инструментами и дополнительными параметрами звучания.

Несмотря на то, что инструменты и тембры стандартизированы в GM, а MIDI-файл содержит только номера инструментов и тембров, этот файл по-разному будет воспроизводиться на разных звуковых картах. Это объясняется несколькими причинами. Так, в стандарте описаны только названия инструментов и тембров. Такие параметры звука, как громкость, окраска и другие не определены и выбираются производителями звуковых карт произвольно.

Кроме того, на качество воспроизведения звука сильно сказывается метод, которым этот звук воспроизводится. Применяют два основных метода синтеза звуков. Более простой метод называется частотным синтезом (FM-синтез). Для каждой ноты каждого инструмента определена частота и амплитуда звука, и звуковая плата компьютера синтезирует звук. Однако при этом синтезированные звуки получаются не слишком похожими на звучание реальных инструментов. В современных звуковых платах частотный синтез не используется.

Значительно лучшее качество звучания дают волновые таблицы (Wave Table). В таблице записаны закодированные звуки реальных инструментов. При этом используется метод кодирования амплитуды звукового сигнала через короткие промежутки времени. Например, если требуется воспроизвести удар по тарелке, звуковая плата проигрывает небольшой фрагмент, записанный в определенном месте таблицы. Фрагменты называют сэмплами (samples). Инструменты с малой длительностью звучания обычно записываются полностью, а для остальных может записываться лишь начало, конец звука и небольшая средняя часть, которая затем проигрывается в цикле в течение нужного времени. Такое кодирование обеспечивает предельную реалистичность звучания классических инструментов и простоту получения звука. Однако волновые таблицы могут занимать много места в памяти.

Так как музыка, представленная в цифровом виде, не требует преобразований, к компьютеру напрямую можно подключить цифровые синтезаторы. Наигрывая мелодию на синтезаторе, в компьютер вводится последовательность нот. Также синтезаторы позволяют проигрывать композиции, созданные на компьютере. Загрузив в синтезатор сэмплы из волновой таблицы, можно извлекать самые необычные звуки при нажатии клавиш.

В последнее время стало модным караоке, и в компьютере стали кодировать музыку вместе с текстом. Фактически караоке является вариантом MIDI. Музыка закодирована обычным способом, но дополнительно добавлен текст, заменивший описание одного из инструментов.

Хотя частота дискретизации при кодировании звукового сигнала по компьютерным меркам не очень велика, объем получившихся цифровых данных достаточно большой. Чтобы уменьшить объем, занимаемый цифровыми аудиоданными, применяют различные методы сжатия информации, в частности алгоритмы MPEG. Например, применение сжатия по алгоритму MPEG-1 Layer 3 (МР3) позволяет уменьшить объем данных более чем в десять раз, при сохранении качества звука, близкого к audio-CD. Наряду с МР3 применяется формат сжатия по стандарту WMA (Windows Media Audio), поддерживаемый последними версиями операционных систем Windows.

В обоих стандартах используется метод сжатия по психоакустической модели, то есть из исходного звукового сигнала удаляется информация, малозаметная на слух, после чего сигнал сжимается обычными методами, которые реализованы в программах–архиваторах. При таком методе кодирования неизбежно искажение исходного сигнала, а значит – потеря качества. Степень потери качества можно регулировать, однако при увеличении качества неизбежно растет объем информации. Основным параметром, характеризующим качество записи, является скорость потока данных, поступающих для декодирования. Часто этот параметр называют битрейтом (bitrate – частота битов).

Битрейт измеряется в килобитах в секунду и может составлять до 320 Кбит/с. В большинстве случаев вполне хватает 192 или даже 128 битрейт. Битрейт ниже 48 Кбит/с существенно ухудшит качество и его не следует применять для записи музыки. Для записи речи можно использовать меньший битрейт. Качественную диктофонную запись можно получить при битрейте равном 8 Кбит/с. Искажения при кодировании в форматах MP3 и WMA во многом зависят от характера музыки. Симфоническая музыка требует большего битрейта, а танцевальная – меньшего. Наиболее популярным битрейтом при кодировании музыкальных композиций считается битрейт 128 Кбит/с, дающий хорошее качество записи и позволяющий сжимать исходную информацию более чем в десять раз. Для хранения произвольных звуковых данных чаще всего используются файлы формата wav. В этом формате может храниться моно- или стереозвук, закодированный одним или двумя байтами и с различной частотой дискретизации. Файлы этого формата могут быть сжаты разными способами для достижения меньшего размера, а могут оставаться и несжатыми. Музыкальные файлы используют формат mid, так как цифровой музыкальный интерфейс и способ кодирования музыкальной информации называется MIDI. Сжатые файлы могут иметь расширение wav, а могут расширением указывать на используемый способ сжатия – mp3 или wma. Есть и несколько других форматов звуковых файлов, но они применяются значительно реже.

Преимущества MIDI

Причина, по которой MIDI на протяжении стольких лет имеет огромный успех, достаточно проста и заключается в том, что протокол был очень тщательно разработан, прежде чем его представили пользователям. Требования в нем к аппаратной реализации и взаимодействию устройств были четко определены и трактовались однозначно. Кроме того, MIDI не была детищем одной компании, а явилась продуктом работы целой ассоциации производителей.

Конечно же, данная система кодирования позволяет записать далеко не всякий звук, она годится лишь для записи инструментальной музыки.

Однако, она все же обладает рядом неоспоримых преимуществ:

чрезвычайно компактная запись;
естественность для музыканта (практически любой MIDI-редактор позволяет работать с музыкой в виде обычных нот);
легкость замены инструментов;
легкость изменения темпа и тональности мелодии.

Помимо того, качество звучания зависит исключительно от возможностей синтезатора или звуковой платы компьютера, с помощью которых это воспроизводится.

Средства и технологии обработки звуковой информации

Готовые работы на аналогичную тему

Секвенсоры можно сравнить с магнитофонами, которые были так популярны все в те же $80$-е годы прошлого столетия, различие заключается лишь в том, что пишут они не сам звук, а команду управления, и не на магнитную ленту, а в память компьютера (в качестве которой может использоваться и встроенный компьютер синтезатора). С помощью секвенсоров мы можем записать действия исполнителя (в том числе и динамику исполнения, и стиль, и штрихи и т. п.), а затем воспроизвести все это в первозданном виде, словно музыкант снова сел за инструмент и исполнил то же самое. Помимо этого с помощью секвенсоров можно отредактировать записанную информацию способами, которые мы никогда не смогли бы использовать работая с магнитофоном, а именно транспонировать партии или же отдельные ноты, менять ритмическую позицию событий или тембр, которым синтезатор будет воспроизводить партию.

Extended General (XG) – еще один стандарт от конкурирующей фирмы Yamaha. В нем было предусмотрено расширенное управление параметрами синтеза звука, а кроме реверберации и хоруса имелся третий эффект - вариация. XG-звуковые карты представляли собой даже не персональный оркестр, а оркестр оркестров. К примеру, одна из наименее дорогих звуковых карт Yamaha DB50XG синтезирует голоса около полутысячи различных музыкальных инструментов.

Запись и редактирование миди-музыки

Миди-песни – это отличное пособие для начинающих музыкантов: в окне миди-редактора, представленного на рисунке, можно, например, наглядно видеть и одновременно слышать партию гитары, проигрывать ее в любом темпе, самому изменять, транспонировать, играть на любой гитаре (с нейлоновыми струнами или металлическими, джазовой и других) и т.д.

MIDI-файлы невелики по объему (чаще всего не более $100$ кб), а в упакованном виде и того меньше. Они имеют вполне приличное качество звучания особенно при наличии хорошей звуковой карты и колонок.

Что такое MIDI?

MIDI, а точнее MIDI-интерфейс (Musical Instrument Digital Interface - цифровой интерфейс музыкальных инструментов), был разработан в начале $80$-х годов прошлого столетия фирмами, производящими электронное музыкальное оборудование (Rolland, Yamaha и т.д.). В результате однозначно были определены структура сигналов, схемы соединения инструментов, порядок обмена данными между инструментами.

Способ представления музыки в формате MIDI оказался настолько удобным и популярным, что уже в середине $80$-х годов практически не выпускалось инструментов без его поддержки, а в операционных системах типа Windows и OS/2 он был реализован, как один из стандартных элементов.

Звуковое оборудование и программы

За воспроизведение и запись звука в компьютерах отвечают специальные звуковые адаптеры. Звуковой адаптер содержит еще один специализированный процессор, тем самым освобождая основной процессор от функций по управлению воспроизведением звука. С помощью звукового адаптера можно записывать звуковую информацию, воспроизводить речь и музыку.

Звуковой адаптер

Современные звуковые платы позволяют производить обработку звука, монтаж музыкальных композиций. Основным направлением развития современных звуковых плат является поддержка объемного звука. В этом случае появляется возможность позиционирования источников звука в пространстве.

Подавляющее большинство современных компьютеров оборудовано звуковой картой. Хорошие звуковые платы Sound Blaster Audigy различных версий выпускает фирма Creative. Вместе с тем в настоящее время многие материнские платы поддерживают качественный шестиканальный звук.

Для того чтобы создавать собственные музыкальные произведения может понадобиться специальная клавиатура, подключаемая к интерфейсу MIDI. Музыкальные клавиатуры, подключаемые к звуковой карте, различаются количеством октав (обычно от трех до семи), а также количеством клавиш и их размером. Наиболее известными производителями являются фирмы Korg, Roland, Yamaha. Неплохие любительские клавиатуры выпускает фирма Casio.

Музыкальная клавиатура

Для качественной записи голоса нужно использовать соответствующие микрофоны. Простые компьютерные микрофоны не обеспечивают высокое качество звука. Кроме того, микрофонный вход большинства звуковых плат также не обладают хорошим качеством. Поэтому рекомендуется использовать микрофонный усилитель, который подключается к линейному входу звуковой платы. Микрофонный усилитель обеспечит подключение двух микрофонов, что позволит записывать стереофонический звук.

Микрофон

В последнее время широкое распространение получили миниатюрные цифровые проигрыватели, хранящие музыку в формате МР3. Музыка с компьютера записывается в память такого устройства, после чего ее можно прослушать в любом месте через наушники.

Портативный плейер

В качестве дополнительного источника звука для компьютера может рассматриваться компьютерный радиоприемник. Он может быть реализован в качестве дополнительной платы, а может подключаться к порту USB.

Радиоприемник

Конечно, работа со звуком на компьютере немыслима без специальных программ. Простейшие программы для работы со звуком включены в состав всех версий Windows. С их помощью можно настроить громкость разных источников звука, установить чувствительность микрофона и линейного входа. Кроме того, можно записать небольшой звуковой фрагмент, выполнить с ним простые преобразования и записать результат в файл. Также в Windows включены средства проигрывания компакт-дисков и мультимедийных файлов, записи музыки на цифровые плееры, прослушивания музыки из Интернета.

При использовании музыкальной клавиатуры требуется работа со звуком в реальном масштабе времени. Наиболее мощной такой программой является Cakewalk Home Studio, но можно обойтись и более простыми программами.

Для обработки звуков следует использовать звуковой редактор. Лучшими звуковыми редакторами являются программы Sound Forge и WaveLab. Для многоканального монтажа применяется редактор Cool Edit. Для создания и редактирования музыки, а также для добавления вокала к музыке, применяются программы, называемые секвенсорами MIDI и аудио. Лучшими программами этого класса являются Cakewalk Sonar и Cubase VST.

Sound Forge

Пение караоке стало в последнее время достаточно популярным. Существуют несколько программ для создания файлов караоке и для их воспроизведения. Достаточно удобна программа Karaoke GALAXY Maker, позволяющая создавать караоке. Для воспроизведения таких файлов используют программы Karaoke GALAXY Player или vanBasco’s Karaoke Player.

Человек множество столетий передает из поколения в поколение прекрасные музыкальные произведения, созданные великими композиторами, а для этого использует нотную запись, которая есть ничто иное, как способ компактного представления музыки, в котором специальными символами можно указать на то, какой высоты звук, на каком инструменте и как исполнить. Фактически нотная запись представляет собой алгоритм для музыканта, записанный на особом формальном языке. Как уже говорилось ранее, для перевода символьной информации в информацию, понятную компьютеру, достаточно иметь лишь таблицу соответствия между символами этого языка и их двоичными кодами.

В 1983 г. ведущие фирмы-производители компьютеров и музыкальных синтезаторов разработали стандарт, который описал подобную систему кодов. Он получил название MIDI.

MIDI (миди) - нотно-музыкальная технология для звуков, искусственно созданных синтезатором. Информация данного типа обычно хранится в файлах с расширением .mid.

Именно с появлением MIDI музыкальным творчеством на компьютере смогли заниматься все желающие.

Миди и звуковая карта

Звуковая карта включает в себя MIDI-интерфейс, синтезатор, аналого-цифровой и цифро-аналоговый преобразователи (АЦП и ЦАП). Звучание MIDI-файлов напрямую зависит от параметров конкретной звуковой карты. MIDI-файл не содержит непосредственного оцифрованного звука. Он содержит набор команд, при помощи которых микросхемы звуковой платы способны синтезировать звук. И от того насколько правильно и верно происходит синтез звука в конкретной звуковой карте (он, в свою очередь, зависит от многих параметров), настолько естественно будет звучать MIDI-файл.

Дешевые звуковые карты имеют встроенный FM-синтезатор, который дает довольно некачественное компьютерное звучание. В операционной системе появляется его собственный порт с именем FM Synth, OPL-3 Music Synthesizer, или подобным. Для карт с более мощным волновым синтезатором (WT-синтезатор) появляется порт с именем вроде Wavetable Synth, Advanced Wave Effects и т.п. Звук у такого синтезатора более качественный, но различается у разных звуковых карт, так они могут иметь различные банки готовых звуков. В некоторых картах эти банки можно заменять, редактировать. На данный момент наиболее качественный волновой синтезатор имеется у карты Creative Sound Blaster Live. Существуют и программные синтезаторы, позволяющие программно синтезировать качественные звуки. Например, программный синтезатор Microsoft GS в Windows 98. Если не обнаружили у себя такого программного синтезатора, то можно установить программный синтезатор Roland VSC-88. Лучшие из программных синтезаторов Roland VSC-88 или Yamaha S-YXG50 (его звуки уже несколько другие) можно скачать в Интернете.

Читайте также: