Звуковые файлы какое это обеспечение

Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Все это огромное множество преобразований сводится, в конечном счете, к следующим основным типам:

1. Амплитудные преобразования. Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.

2. Частотные преобразования. Выполняются над частотными составляющими звука: сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное «сворачивание» сигнала из спектра в волну.

3. Фазовые преобразования. Сдвиг фазы сигнала тем или иным способом; например, такие преобразования стерео сигнала, позволяют реализовать эффект вращения или «объёмности» звука.

4. Временные преобразования. Реализуются путем наложения, растягивания/сжатия сигналов; позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.

Практическую обработку сигналов можно разделить на два типа: обработка «на лету» и пост-обработка. Обработка «на лету» подразумевает мгновенное преобразование сигнала (то есть с возможностью осуществлять вывод обработанного сигнала почти одновременно с его вводом). Простой пример – гитарные «примочки» или реверберация во время живого исполнения на сцене. Такая обработка происходит мгновенно, то есть, скажем, исполнитель поет в микрофон, а эффект-процессор преобразует его голос и слушатель слышит уже обработанный вариант голоса. Пост-обработка – это обработка уже записанного сигнала. Скорость такой обработки может быть сильно ниже скорости воспроизведения. Такая обработка преследует те же цели, то есть придание звуку определенного характера, либо изменение характеристик, однако применяется на стадии мастеринга или подготовки звука к тиражированию, когда не требуется спешка, а важнее качество и скрупулезная проработка всех нюансов звучания. Существует множество различных операций над звуком, которые вследствие недостаточной производительности сегодняшних процессоров нельзя реализовать «на лету», поэтому такие преобразования проводят лишь в пост-режиме .

Аналоговый и дискретный способы представления звука

Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме.

При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно.

При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.

Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно), а дискретного — аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью).

Восприятие звука человеком

Звуковые волны улавливаются слуховым органом и вызывают в нем раздражение, которое передается по нервной системе в головной мозг, создавая ощущение звука.

Колебания барабанной перепонки в свою очередь передаются во внутреннее ухо и раздражают слуховой нерв. Так образом человек воспринимает звук.

В аналоговой форме звук представляет собой волну, которая характеризуется:

Высота звука определяется частотой колебаний вибрирующего тела.
Г ромкость звука определяется энергией колебательных движений, то есть амплитудой колебаний.
Длительность звука - продолжительность колебаний.
Тембром звука называется окраска звука.

Герц (Гц или Hz) — единица измерения частоты колебаний. 1 Гц= 1/с

Человеческое ухо может воспринимать звук с частотой от 20 колебаний в секунду (20 Герц, низкий звук) до 20 000 колебаний в секунду (20 КГц, высокий звук).

Кодирование звуковой информации

Для того чтобы комп ьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Таким образом, при двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала.

Качество кодирования звуковой информации зависит от :

1)частотой дискретизации, т.е. количества измерений уровня сигнала в единицу времени. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

2)глубиной кодирования, т.е. количества уровней сигнала.

Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле: N = 2 i = 2 16 = 65536, где i — глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.

Количество измерений в секунду может лежать в диапазоне от 8000 до 48 000, то есть частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц. При частоте 8 кГц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц — качеству звучания аудио-С D . Следует также учитывать, что возможны как моно-, так и стерео-режимы.

РСМ. РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко. Но РСМ является основополагающей для всех звуковых файлов.

WAV. Самое простое хранилище дискретных данных. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости, в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали - это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

RIFF. Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

IFF. Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga - одна из первых, в которой стали задумываться о программно-сэмплернойэмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

MOD. Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента.

AIF или AIFF. Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

МР3. Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для "обычных немузыкальных" людей потери не ощутимы явно.

VQF. Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF - процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

RA. Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.

Этот урок посвящён звуковым файлам. С помощью этого урока учащиеся познакомятся со звуковыми файлами, а точнее, с наиболее популярными расширениями звуковых файлов, узнают, какие существуют программы для прослушивания аудиозаписей. Также некоторая часть уделена интересным и познавательным фактам из истории развития звукозаписи.

В данный момент вы не можете посмотреть или раздать видеоурок ученикам

Чтобы получить доступ к этому и другим видеоурокам комплекта, вам нужно добавить его в личный кабинет, приобретя в каталоге.

Конспект урока "Звуковые файлы"

В начале урока мы с вами вспомним, что такое файл.

Файл – это информация, которая хранится как единое целое и имеет своё название – имя файла. В каждом файле хранится однотипная информация: графическая, звуковая и прочие.

Сегодня мы с вами узнаем о том, что такое звук, какие существуют расширения звуковых файлов, познакомимся с историей звукозаписи.

Звук – это колебания воздуха или любой другой среды, в которой он распространяется.

Звук попадает в компьютер при помощи микрофона. А чтобы компьютер смог работать со звуком, его нужно преобразовать в последовательность нулей и единиц, ведь компьютер умеет работать только с такой информацией. Этим занимается звуковая карта. Для прослушивания звука используются наушники или колонки.

Витя: «Но если звук в компьютере находится в виде нулей и единиц, то как же его можно прослушать?»

Здесь нам снова поможет звуковая карта. Когда мы даём команду компьютеру на воспроизведение, звуковая карта преобразует нули и единицы обратно в звук, который выводится через колонки или наушники.

Вся музыка и звуки в компьютере, телефоне и на прочих устройствах хранения информации являются звуковыми файлами.

Как мы с вами знаем, у каждого файла есть своё расширение. Звуковые файлы не являются исключением.

Витя: «Давайте узнаем, какие существуют расширения звуковых файлов».

Рассмотрим наиболее популярные из них.

«MIDI». Формат файлов «MIDI»был разработан для того, чтобы позволить музыкантам и композиторам копировать данные «MIDI»из одного приложения в другое. В таких файлах содержится информация о расположении нот, скорости игры и прочих параметрах звука.

«MP3». В наше время это одно из стандартных расширений звуковых файлов. Большинство музыкальных плееров, смартфонов, компьютеров и прочих устройств воспроизводят музыку именно из файлов «MP3». При сохранении звукового файла с таким расширением происходит его сжатие. А при сжатии, в свою очередь, – потеря качества. В этом есть и свои плюсы. При хранении файлов с расширением «MP3» наблюдается значительная экономия места на диске.

Расширение «WMA». Популярность этого формата была достигнута за счёт его использования при воспроизведении видеофайлов на DVD-плеерах, а также на портативных устройствах и мобильных телефонах.

Ну и в заключение рассмотрим формат «WAV». Файлы «WAV» были созданы компаниями IBM и Microsoft. Они содержат различные аудиоданные: звуки, звуковые эффекты, музыку, а также записи голоса. По размерам файлы с расширением «WAV» значительно больше файлов с расширением «MP3», и именно поэтому они не пользуются популярностью.

Витя: «Какие существуют программы для прослушивания звука?»

Программ для прослушивания звуковых файлов огромное количество. Стандартным же проигрывателем в операционной системе Windows является Windows Media. Этот проигрыватель позволяет воспроизводить все популярные форматы аудио- и видеофайлов. Можно записать диск из понравившихся композиций, или наоборот, скопировать его к себе на жёсткий диск.

Следующий проигрыватель, который мы с вами рассмотрим, AIMP. Он является бесплатным, поддерживает огромное количество форматов. В данном проигрывателе можно создавать несколько плейлистов. Эту программу устанавливают не только на компьютер или ноутбук, но и на телефоны с операционной системой Андроид.

Идём дальше. Рассмотрим проигрыватель Winamp. С его помощью можно не только слушать музыку, но и смотреть видеозаписи. Также в Winamp можно искать нужные аудиозаписи, создавать свои списки звуковых файлов. Ну и, конечно же, с помощью этого проигрывателя можно прослушивать звуковые файлы с различными расширениями.

Tomahawk. Отличительной особенностью этого проигрывателя является то, что его можно устанавливать в операционных системах Windows, Linux и Mac OS. После того, как приложение было установлено, оно собирает всю музыку, которая находится на компьютере, в одну библиотеку. Это позволяет сразу же после установки начать её прослушивание.

Витя: «Может, немного поговорим об истории звукозаписи?»

К первым устройствам для записи звука относятся механические устройства. В то же время они не могли записывать и воспроизводить голос. На такие устройства записывалась только мелодия. Мелодии записывались на бумагу, дерево, металлические валики, перфорированные диски и другие приспособления. Эти инструменты могли приводиться в движение не только при помощи человеческих рук, но и при помощи воды, песка, электричества и прочих средств.

К примерам таких устройств относятся шарманки, музыкальные часы, шкатулки, ящики.

Все они воспроизводили различные сохранённые мелодии, но в то же время на них нельзя было записать живые выступления, звуки. Количество же мелодий было ограничено.

В 1857 г. де Мартенвиль изобрёл фоноавтограф.

Минус этого устройства был в том, что оно не могло воспроизводить сделанную запись.

А вот в 1877 г. Томас Эдисон изобрёл фонограф, который уже мог воспроизводить свою запись.

В 1887 г. Эмиль Берлинер изобрёл граммофон.

Звуки записывались на пластинки.

Но аудиодорожки могли вмещать в себя только до 5 минут аудиозаписи.

В 1907 г. Гильон Кеммлер предложил усовершенствовать граммофон. Так, на замену ему пришёл патефон.

Главное отличие патефона заключалось в том, что он был скомпонован в виде чемоданчика и его можно было переносить в застёгнутом виде за специальную ручку.

В 1925 г. появляется запись через микрофон. Таким образом был изобретён электрофон. Он отличается от граммофона и патефона принципом действия, который основан на электрических колебаниях. Более подробно об этом вы узнаете в старших классах. В быту такое устройство очень часто называли проигрывателем. Электрофоны до сих пор используются в домашних условиях. Но продажа граммофонных пластинок практически прекратилась, так как на смену пришли цифровые средства воспроизведения звука.

Далее в 1931 г. Шорин Александр Фёдорович создал шоринофон. Запись в таком устройстве производилась с помощью иглы на киноленту.

В тысяча девятьсот тридцать втором году компания AEG начала производство «Магнетофон-К1». А в 1941 г. эта же фирма выпускает магнитофон нового образца.

В дальнейшем в 1963 г. появляются первые компакт-кассеты. Они производились фирмой Philips.

В 1971 г. компания Advent Corporation выпускает кассету с магнитной лентой на основе оксида хрома.

Витя: «А что такое оксид хрома?»

Об этом вы узнаете в старших классах на уроках химии.

Качество звука на таких носителях информации было намного выше. На такие кассеты можно записывать в фабричных условиях фонограммы. Также кассеты начали использоваться для самостоятельной записи музыки.

С появлением оптических дисков появляется лазерная (оптическая) запись. При помощи лазерного луча на вращающийся оптический диск записываются сигналы. В результате записи на диске образуется спиральная дорожка. При воспроизведении лазерный луч перемещается по поверхности оптического диска и считывает записанные на него данные.

В 1980 г. компании Philips и Sony создают международный стандарт хранения оцифрованного звука на компакт-дисках. А в апреле 1982 г. Philips представила свой первый проигрыватель компакт-дисков.

Витя: «Перед записью звук же как-то редактируется?»

Верно. Прежде, чем получить нужную аудиозапись, необходимо записать несколько различных вариантов, например, песни. После чего песня обрабатывается, редактируется и записывается на носитель информации.

Для работы со звуковыми дорожками существуют специальные программы. К примерам относятся Audacity, WavePad Sound Editor, Wavosaur, Traverso, FREE Wave MP3 Editor. Все эти программы являются бесплатными.

В самой операционной системе Windows также есть стандартная программа для записи звука. Она называется «Запись голоса». Рассмотрим её интерфейс.

При открытии появляется окно с микрофоном. Для начала записи нужно на него нажать.

Как только началась запись звука, её можно поставить на паузу, сделать метку в нужном месте и остановить запись.

После того, как запись остановлена, её можно прослушать, добавить или удалить метку на дорожке, удалить запись, поделиться, переименовать, а также обрезать. Для обрезки файла нужно нажать на соответствующую кнопку и при помощи маркеров указать начало и конец дорожки. После чего нажать на «OK». При этом изменения можно сохранить в исходном файле или же копию в новом. Если вы не хотите применять изменения к звуковой дорожке, то нужно нажать на кнопку «Отмена». Файл сохранится автоматически в папку, которую система выделила для этой программы. Чтобы посмотреть, где находятся файлы, нужно из меню выбрать пункт «Открыть папку с файлом». При удалении файла он автоматически удаляется из папки.

Витя: «Какая простая программа!»

А сейчас давайте рассмотрим интерфейс программы «Аудиомастер».

При запуске программы появляется окно, с помощью которого можно открыть файл для редактирования, извлечь звук из видео, записать звук с микрофона и прочие действия. Выберем пункт «Записать звук с микрофона».

Появится окно, в котором нужно нажать на кнопку «Начать новую запись». После остановки записи необходимо нажать на кнопку «Сохранить». Откроется окно для редактирования.

Сверху находится строка меню, с помощью которой можно задать эффекты для звуковой дорожки, отредактировать её и выполнить с ней прочие действия.

Чуть ниже находится панель быстрого доступа. С её помощью можно вырезать, скопировать или вставить фрагмент. Прежде, чем вырезать или скопировать фрагмент, его нужно выделить.

В области слева находятся эффекты, которые можно применить к аудиозаписи. Снизу же находится строка, с помощью которой можно воспроизвести, остановить файл, перейти в конец или в начало дорожки, а также записать звук с микрофона. Самую большую часть окна занимает область непосредственно с самой звуковой дорожкой.

Мы с вами вкратце рассмотрели интерфейс программы «АудиоМастер».

А сейчас пришла пора подвести итоги урока.

Сегодня мы с вами познакомились с различными расширениями звуковых файлов.

Узнали, какие существуют программы для прослушивания аудиозаписей.

Познакомились с историей звукозаписи.

В конце урока рассмотрели интерфейс стандартной программы Windows для записи звука, а также программы «АудиоМастер».

Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию. С помощью специальных программных средств (редакторов звукозаписей) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи, что, в результате, даёт возможность управлять компьютером с помощью голоса. На этом уроке учащиеся узнают, как в компьютере представляется звук, то есть какое устройство в компьютере производит оцифровку вводимого звукового сигнала, от чего зависит качество цифрового звука и какие виды кодирования звуковых файлов существуют.

Конспект урока "Представление звука в компьютере"

· оцифровка вводимого звукового сигнала;

· качество цифрового звука;

· виды кодирования звуковых файлов.

С начала 90-ых годов персональные компьютеры получили возможность работать со звуковой информацией.

Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.

С помощью специальных программных средств (редакторов звукозаписей) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи и, в результате, появляется возможность управления компьютером при помощи голоса.

А как же представляется звук в компьютере?

Вообще звук – это процесс колебания воздуха или любой другой среды, в которой он распространяется. Звук характеризуется амплитудой (силой) и частотой (количеством колебаний в секунду).

Под звукозаписью понимают процесс сохранения звуковой информации на каком-либо носителе с помощью специальных устройств.

Ввод звука в компьютер производится с помощью звукового устройства, микрофона или радио, выход которого подключается к порту звуковой карты.

Рассмотрим подробнее процесс ввода звука в компьютер.

Звуковые сигналы непрерывны. С помощью микрофона звуковой сигнал превращается в непрерывный электрический сигнал. Но, как вы помните компьютер может работать только с цифровой информацией, поэтому если нам нужно обработать звук на компьютере, то его необходимо дискретизировать – то есть превратить в прерывистую, состоящую из отдельных частей, последовательность нулей и единиц.

Процессом преобразования звука из непрерывной формы в дискретную при записи и из дискретной в непрерывную при воспроизведении занимается звуковая карта или аудио адаптер.

Звуковая карта – это устройство для записи и воспроизведения звука на компьютере. То есть задача звуковой карты — с определённой частотой производить измерения уровня звукового сигнала и результаты измерения записывать в память компьютера. Этот процесс называют оцифровкой звука.

Промежуток времени между двумя измерениями называется периодом измерений — обозначается буквой Т и измеряется в секундах.

Обратная величина называется частотой дискретизации. Она обозначается буквой ν. Ровна 1/Т и измеряется в герцах.

Таким образом на качество преобразования звука влияет несколько условий:

• Частота дискретизации, то есть сколько раз в секунду будет измерен исходный сигнал.

• Разрядность дискретизации – количество битов, выделяемых для записи каждого результата измерений.

Результаты таких измерений представляются целыми положительными числами с конечным количеством разрядов. Как мы уже говорили, в таком случае получается дискретное конечное множество значений в ограниченном диапазоне.

Размер этого диапазона зависит от разрядности ячейки — регистра памяти звуковой карты.

То есть обратите внимание, снова работает главная формула информатики:

здесь i — это разрядность регистра. Также число i называют разрядностью дискретизации. Записанные данные сохраняются в файлах специальных звуковых форматов.

Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мб. Частота дискретизации ровна 22050 Герц. Нужно найти разрядность аудиоадаптера.

При воспроизведении звукового файла цифровые данные преобразуются в электрический аналог звука. К звуковой карте подключаются наушники или звуковые колонки. С их помощью электрические колебания преобразуются в механические звуковые волны, которые воспринимают наши уши.

Таким образом, чем больше разрядность и частота дискретизации, тем точнее представляется звук в цифровой форме и тем больше размер файла, хранящего его.

Рассмотрим такой пример: Нужно определить качество звука (то есть какое это качество радиотрансляции или качество аудио-CD) если известно, что объём моноаудиофайла длительностью звучания в 10 секунд равен 940 Кб. Разрядность аудиоадаптера ровна 16 бит.

Рассмотрим ещё один пример. Аналоговый звуковой сигнал был дискретизирован сначала с использованием 256 уровней интенсивности сигнала (качество звучания радиотрансляции), а затем с использованием 65536 уровней интенсивности сигнала (качество звучания аудио-CD). Нужно найти во сколько раз различаются информационные объёмы оцифрованного звука?

Для работы со звуковой информацией на компьютере используются различные программы. Одни из них позволяют записать звук на цифровой носитель, другие — воспроизвести. Существуют программы, которые выполняют более сложную обработку звука. Такие программы называются редакторы звука. Например, можно вырезать фрагмент музыкального произведения или речи, объединить фрагменты, изменить тембр звучания, длительность воспроизведения создавать различные музыкальные эффекты, очищать звук от шумов, согласовывать с изображениями для создания мультимедийных продуктов и так далее.

При хранении оцифрованного звука приходится решать проблему уменьшения объёма звуковых файлов. Существует два способа кодирования звука: кодирования данных без потерь, позволяющего осуществлять стопроцентное восстановление данных из сжатого потока. А также кодирование данных с потерями. Позволяет добиться схожести звучания восстановленного сигнала с оригиналом при максимальном сжатии данных. Здесь используются различные алгоритмы, сжимающие оригинальный сигнал путём выкидывания из него слабо слышимых элементов.

Существует множество различных аудио форматов. Наиболее часто используются такие форматы как WAV и MP3. Тип формата обычно определяется расширением файла (то, что идёт после точки в имени файла mp3, wav, ogg, wma)

WAV – один из первых аудио-форматов. Обычно используется для хранения несжатых аудиозаписей, идентичных по качеству звука записям на компакт-дисках. В среднем одна минута звука в формате wav занимает около 10 Мб.

MP3 – наиболее распространённый в мире звуковой формат. MP3, как и многие другие форматы кодирует звук с потерей качества, то есть урезает звук, который не слышится человеческим ухом, тем самым уменьшая размер файла.

На текущий момент mp3 не является лучшим форматом по соотношению размера файла к качеству звучания, но в силу своей распространённости и поддерживаемости большинством устройств, многие хранят свои записи именно в нём.

Звуковая карта – это устройство для записи и воспроизведения звука на компьютере. Задача звуковой карты — с определённой частотой производить измерения уровня звукового сигнала и результаты измерения записывать в память компьютера. Этот процесс называют оцифровкой звука.

Качество оцифрованного звука зависит от:

• Частоты дискретизации, то есть сколько раз в секунду будет измерен исходный сигнал.

• и Разрядности дискретизации – то есть от количества битов, выделяемых для записи каждого результата измерений.

Существует два способа кодирования звука:

• кодирования данных без потерь, здесь осуществляется стопроцентное восстановление данных из сжатого потока;

• кодирование данных с потерями. Это способ позволяет добиться схожести звучания восстановленного сигнала с оригиналом при максимальном сжатии данных.

Звук представляет собой непрерывный сигнал — звуковую волну с меняющейся амплитудой и частотой.

Чем больше амплитуда сигнала, тем он громче для человека.

Чем больше частота сигнала, тем выше тон.

Частота звуковой волны выражается числом колебаний в секунду и измеряется в герцах (Гц, Hz).

Человеческое ухо способно воспринимать звуки в диапазоне от 20 Гц до 20 кГц, который называют звуковым.

Количество бит, отводимое на один звуковой сигнал, называют глубиной кодирования звука.

Современные звуковые карты обеспечивают 16-, 32- или 64-битную глубину кодирования звука.

При кодировании звуковой информации непрерывный сигнал заменяется дискретным, то есть превращается в последовательность электрических импульсов (двоичных нулей и единиц).

Процесс перевода звуковых сигналов от непрерывной формы представления к дискретной, цифровой форме называют оцифровкой.

Важной характеристикой при кодировании звука является частота дискретизации — количество измерений уровней сигнала за 1 секунду:

- 1 (одно) измерение в секунду соответствует частоте 1 Гц;

- 1000 измерений в секунду соответствует частоте 1 кГц.

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Количество измерений может лежать в диапазоне от 8 кГц до 48 кГц (от частоты радиотрансляции до частоты, соответствующей качеству звучания музыкальных носителей).

Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим «стерео»).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Оценить информационный объём моноаудиофайла ( V ) можно следующим образом: V = N⋅f⋅k , где N — общая длительность звучания (секунд), f — частота дискретизации (Гц), k — глубина кодирования (бит).

Например, при длительности звучания 1 минуту и среднем качестве звука ( 16 бит, 24 кГц):

V = 60⋅24000⋅16 бит = 23040000 бит = 2880000 байт = 2812,5 Кбайт = 2,75 Мбайт.

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Например, оценим информационный объём цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука ( 16 битов, 24000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду и умножить на 2 (стереозвук):

V=16 бит * 24000⋅2 = 768000 бит = 96000 байт = 93,75 Кбайт.

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых можно выделить два основных направления: метод FM и метод Wave-Table.

Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, и, следовательно, может быть описан кодом. Разложение звуковых сигналов в гармонические ряды и представление в виде дискретных цифровых сигналов выполняют специальные устройства — аналогово-цифровые преобразователи (АЦП).

Преобразование звукового сигнала в дискретный сигнал: a — звуковой сигнал на входе АЦП; б — дискретный сигнал на выходе АЦП.

Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука представлен на рис. ниже. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) — один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

-75%

На сегодняшний день существует около трех десятков распространенных цифровых аудиоформатов. Зачем понадобилось создавать такое количество видов звуковых файлов для хранения одного типа контента и как со всем этим управляться вы узнаете из этого материала.

Вступление

Наверняка многие пользователи предпочитают использовать домашний компьютер не только в качестве рабочей лошадки, но и как мультимедийный центр, на котором можно просматривать фильмы или семейные фотографии, а так же слушать любимую музыку. Хотя наверняка, для прослушивания музыкальных композиций более подходящими являются компактные цифровые плееры или мобильные телефоны, но в отличие от них, компьютер умеет не только проигрывать музыку.

Каким бы большим объемом встроенной памяти не обладал ваш музыкальный плеер, скорее всего, хранить в нем всю фонотеку вряд ли удастся. Более того, с помощью ПК можно создавать, редактировать, упорядочивать и искать музыку. Так же не стоит забывать, что на сегодняшний день существует около трех десятков распространенных цифровых аудио форматов, а большинство плееров далеко не всеядны, и способны воспроизводить только некоторые из них.

Так зачем же понадобилось создавать такое количество музыкальных форматов для хранения одного типа контента? Все дело в том, что звук в подавляющем большинстве случаев хранится в «сжатом» виде, так как одна минута несжатой композиции занимает на жестком диске около 10 Мб. С одной стороны это вроде бы не много, а с другой, если вы меломан и ваша коллекция состоит из нескольких сотен или даже тысяч песен, то становится ясно, что звук необходимо сжимать, для уменьшения занимаемого им места на электронных носителях информации.

Для сжатия музыкальных файлов используются различные особые алгоритмы, которые впоследствии определяют структуру и особенности представления звуковых данных или так называемые цифровые аудиоформаты файлов. Все звуковые форматы можно разбить на три группы: аудиоформаты без сжатия, со сжатием без потерь и с применением сжатия с потерями.

Сжатие без потерь (lossless)

Алгоритмы, осуществляющие сжатие аудиофайлов без потерь работают по принципу обычных архиваторов. Обеспечивая не самый высокий уровень сжатия (от 40 до 60%), при этом они практически не влияют на качество звука. Так же стоит отметить, что в этом случае, закодированные данные можно полностью восстановить до первоначального вида. Поэтому использование сжатия без потерь наиболее часто применяется в тех случаях, когда важно сохранить идентичность сжатых данных оригиналу.

Наиболее популярными аудиоформатами в этой группе являются FLAC (Free Lossless Audio Codec), APE (Monkey’s Audio), WMA (Windows Media Lossless) и ALAC (Apple Lossless Audio Codec). У каждого из них есть свои плюсы и свои минусы. Например, кодек APEдает несколько больший выигрыш в сжатии, а FLAC является более распространенным. В общем же, все настоящие меломаны хранят свои музыкальные коллекции именно в lossless-форматах, так как в них не удаляется никаких данных из аудиопотока, а созданные с помощью этих кодеков файлы, можно прослушивать даже на высококачественной звуковой аппаратуре.

Для воспроизведения сжатых без потерь форматов, как правило, используются сторонние плееры (кроме WMA), такие как MPlayer, foobar, AIMP, Winamp, VLC и прочие, так как в них уже встроены все необходимые кодеки. Другим вариантом является отдельная установка пакета дополнительных кодеков (например, K-Lite), после чего прослушивание файлов в lossless-формате становится доступным практически из любого аудиопроигрывателя.

Сжатие с потерями

Это самая популярная группа алгоритмов, которые обеспечивают максимальную (до 10 раз и даже более) степень сжатия звука. Правда в отличие от предыдущих форматов, здесь аудиофайл теряет в качестве, а насколько сильно – напрямую зависит от степени его сжатия.

Для определения качества оцифрованного звука наиболее часто применяется такой показатель, как битрейт – скорость звукового потока, получившаяся после сжатия и измеряемая в килобитах в секунду (kbps). Как мы уже говорили, в среднем минута несжатого звука занимает около 10 Мб, что соответствует аудиопотоку примерно в 1400 кбит/c. После кодирования с потерями, его битрейт может снизиться до 56 кбит/с. При этом, стоит учитывать, что для сохранения естественного звучания скорость потока должна быть не ниже 192 или 256 кбит/c. Если же битрейт потока составляет 320 кбит/c и более, то разница в звучании для большинства людей между сжатым и несжатым аудио практически исчезает.

Самым популярным форматом здесь однозначно считается знаменитый и всеми любимый MP3, разработанный специалистами известной группы MPEG (Moving Picture Experts Group). Наиболее широко он используется для кодирования аудиофайлов, размещаемых в интернете и различных файлообменниках из-за возможности существенно уменьшить размер передаваемых данных, что при низкой скорости подключения к сети немаловажно.

Другими известными форматами из этой серии являются AAC (Advanced Audio Coding) и OGG Vorbis. При этом, будучи менее популярными, их алгоритмы сжатия совершеннее, чем у основного конкурента. Так при одинаковом размере файла, они обеспечивают лучшее качество звукового ряда по сравнению с MP3. Еще одно серьезное преимущество данных форматов – возможность кодирования до 48 звуковых каналов у AAC и 255 у OGG, против всего двух у MP3.

Стоит отметить, что и формат WMA – собственность компании Microsoft, изначально создавался для хранения и трансляции аудиоинформации в сжатом виде с потерями, а кодирование без потери качества добавилось к нему не так давно, начиная с Windows Media Audio 9.1. Номинально этот формат обеспечивает лучшую степень сжатия, чем MP3, что дает возможность разработчикам противопоставлять его в качестве альтернативы конкурирующим алгоритмам AAC и OGG. Правда широкому распространению WMA мешает его закрытость и ограниченность применения на многих платформах (операционных системах). Да и встроенная поддержка цифровой системы управления авторскими правами (DRM) не добавляет популярности детищу Microsoft.

Не смотря на то, что MP3 проигрывает своим конкурентам, как по эффективности сжатия, так и по качеству звучания, он до сих пор продолжает оставаться самым популярным аудиоформатом. Секретом такого успеха, наверное, можно назвать банальную инерцию мышления, так как за многие годы к нему привыкло большинство пользователей, производителей аппаратуры и разработчиков программного обеспечения. Именно поэтому MP3-файлы можно прослушать вообще на всем, что способно проигрывать цифровой звук – будь то мобильный телефон, персональный компьютер с любой популярной операционной системой, портативный аудиоплеер, современный музыкальный центр или DVD-проигрыватель.

И хотя другие форматы пока что такой поддержкой похвастаться не могут, у них тоже все не так уж и плохо. Так AAC нашел широкую поддержку со стороны компании Apple, которая использует его алгоритмы для хранения аудиокниг, подкаст, музыкальных композиций в магазине iTunes и рингтонов. Так что для поклонников компьютеров Macintosh, планшетов iPad, смартфонов iPhone и плееров iPod этот формат можно считать «родным».

Файлы WMA легко воспроизводятся на любом ПК под управлением операционной системы Windows, которая является самой распространенной в мире. При этом многие производители портативных аудиоплееров и стационарных проигрывателей оптических дисков так же поддерживают этот формат. А вот для прослушивания файлов в форматах OGG Vorbis или AAC в Windows-системах придется установить специальные кодеки. Хотя это не проблема. Установка вышеупомянутого бесплатного пакета кодеков K-Lite Codek Pack позволит проигрывать на вашем компьютере с помощью любимого плеера практически любые звуковые файлы.

Получите невероятные возможности

Без сжатия

Одним из самых распространенных форматов, относящихся к этому типу, можно смело считать известнейший WAV. Звук в файлах с таким расширением хранится без какого-либо сжатия и изменений. Правда места для хранения несжатых файлов требуется гораздо больше и поэтому наиболее широкое применение WAV находит лишь в профессиональных аудио и видео приложениях, где звук перед обработкой не должен иметь потери в качестве. Хранение же обычных музыкальных композиций в таком виде является неоправданной расточительностью.

Для воспроизведения WAV-файлов вам не потребуется какое-то специальное программное обеспечение, так как этот формат понимают все медиаплееры, включая и встроенный в систему Windows штатный проигрыватель аудиофайлов Windows Media.

Еще одним форматом, использующимся для хранения несжатого аудио, о котором стоит упомянуть, является разработка компании Appleпод названием AIFF (Audio Interchange File Format). Как вы, наверное, уже догадались, наиболее часто он используется в компьютерах Macintosh под управлением систем Mac OS X.

В данный момент вы не можете посмотреть или раздать видеоурок ученикам

Получите невероятные возможности

Заключение

В заключение давайте посмотрим, какой набор программного обеспечения вам понадобится, что бы превратить свой домашний компьютер в универсальный инструмент для работы с аудиофайлами. Для удобства, разделим все приложения на несколько основных групп.

Плееры – служат для непосредственного воспроизведения звуковых файлов, а так же часто используются для каталогизации и упорядочивания музыкальных коллекций. Их количество столь огромно, что и не сосчитать. Но все же, что бы несколько облегчить вам выбор, приведем, на наш взгляд, двенадцать самых популярных: Windows Media Player (встроен в систему), Winamp, KMPlayer, iTunes, GOM Player, jetAudio, VLC Media Player (VideoLAN), AIMP, BSPlayer, Real Player, WinDVD и Foobar2000.

Конверторы – приложения, способные осуществлять перекодировку из одного формата в другой. Для этой цели можно использовать большинство популярных плееров, не прибегая к использованию специальных программ. Хотя в некоторых случаях без этого не обойтись.

Рипперы (грабберы) – позволяют извлекать цифровую звуковую информацию с оптических носителей (Audio-CD, DVD) и сохранять ее в различных форматах. Несмотря на многочисленность всевозможным грабберов, на этом поприще наибольшую популярность снискало приложение EAC (Exact Audio Copy), позволяющее делать наиболее точные копии дисков. К другим популярным рипперам относятся: Audiograbber, Reaper, Easy CD-DA Extractor и прочие.

Редакторы – программы, предназначенные для создания, записи и редактирования звуковых данных. В этой группе существуют как довольно простые программы, позволяющие сделать элементарные операции с аудиофайлом (вырезать, обрезать, объединить, нормализовать и т.д.), так и настоящие монстры для профессиональной работы со звуком. Среди небольших редакторов можно выделить приложение Nero WaveEditor, за его скромный размер и при этом довольно высокую функциональность. К наиболее популярным профессиональным решениям обработки звука относятся: Adobe Audition, Sound Forge, Cubase, Sony Vegas Pro и другие.

Конечно, чисто теоретически все эти необходимые функции может сочетать в себе только одна программа, но на практике использовать единственное приложение для всех задач не всегда удобно. Да и добиться от одной программы качественного выполнения всех задач практически невозможно.

В любом случае гораздо удобнее иметь под рукой несколько специализированных приложений, которые и места занимают меньше, и с задачами своими по отдельности справляются лучше.

Читайте также: