Где используется формат файлов aac
Apple Lossless (также известный как Apple Lossless Encoder, ALE, или Apple Lossless Audio Codec, ALAC) — аудио кодек, разработанный Apple Inc, для сжатия цифровой музыки без потерь данных.
Формат сжатия AMR был разработан специально для использования в системах сотовой связи. Областью его применения является сжатие речевого аудио контента.
Monkey's Audio (только для Windows) считается одним из лучших аудио-кодеков без потерь для хранения музыки из-за своего эффективного соотношения размера итоговых файлов и скорости.
ATRAC — это система сжатия с потерями, основанная на психоакустических принципах. Она сжимает аудио компакт-диск до приблизительно 1/5 от оригинала с неощутимыми потерями качества звука.
Кодек CELT представляет собой алгоритм для сжатия аудио данных. Как и MP3, Vorbis и AAC он подходит для передачи музыки в высоком качестве. В отличие от этих форматов, CELT имеет ещё и очень маленькую задержку, меньшую, чем даже Speex, GSM или G.729.
LossyWAV является бесплатным форматом сжатия с потерями. Но по сути — это препроцессор для PCM-аудио, хранимого в WAV-контейнерах.
MPEG-1 Audio Layer I (сокращенно MP1) является одним из трех форматов включенных в MPEG-1 стандарт. Несмотря на то, что он поддерживается многими медиа плеерами, кодек уже сильно устарел и заменен кодеками MP2 и MP3.
MP2 до сих пор используется в радиовещательной индустрии для спутниковой трансляции Цифрового Видео Вещания (Digital Video Broadcast) и Цифрового Аудио Вещания (Digital Audio Broadcast).
Формат иногда путают с MPEG-3, но MP3 предназначен для сжатия только аудиоинформации и полное название звучит как MPEG Audio Layer-3.
В 2004-м, институтом Fraunhofer IIS было опубликовано обратно совместимое расширение для MP3. Файлы MP3 Surround обепечивают высокое качество на звуке 5.1 при помощи новых декодеров.
Это расширения файлов для формата-контейнера MPEG-4, который может включать в себя все разновидности мультимедиа (видео, натуральное и синтетическое аудио, 2D и 3D графику, анимированные аваторы и т.д.).
Musepack — схема сжатия с потерями, созданная немецким программистом — Эндри Бушманом (Andree Buschmann).
Формат Ogg vorbis разработан компанией Xiphophorus. На этом же сайте можно найти исходные коды проекта. Он является частью проекта Ogg, предусматривающего создание полностью открытой мультимедиа системы.
OptimFROG — это алгоритм сжатия без потерь, главная цель которого — максимально уменьшить размер аудио файлов. Это чем-то напоминает ZIP сжатие, но этот алгоритм высоко специализирован для аудио данных.
Opus является абсолютно открытым, свободным от лицензионных отчислений, крайне универсальным аудио кодеком.
RealMedia — проприетарный стандарт, рассчитанный на потоковое вещание и на формат медиафайлов, принадлежащий фирме "RealNetworks Products and Services".
Speex является свободным от патентов форматом для сжатия аудио, разработанным для передачи речи, а также для использования в открытом программном обеспечении (например, в направлении VoIP).
TAK — это сжатие аудио информации без потерь, которое обеспечивает эффективность APE и скорость декодирования FLAC.
Проприетарный формат, который был создан на замену MP3, но так и не получил должного развития из-за своей собственнической природы.
Формат WAV является, пожалуй, наиболее обычным форматом хранения аудио. Его проще всего использовать для обработки и поддерживается он чуть ли не всеми аудио плеерами.
WavPack является полностью открытым форматом аудио сжатия без потерь, высокого качества с потерями и уникального гибридного режима.
Технические характеристики наиболее распространённого режима AAC LC:
Параметр | Значение |
---|---|
Каналы | моно, стерео, многоканальность |
Частота дискретизации | от 8 кГц до 96 кГц |
Битрейт | до 256 kbps на канал |
Сам по себе формат является проприетарным и требует приобретения лицензии для использования в коммерческих целях.
История
Разработка формата начата в 1994 году совместными усилиями Fraunhofer IIS, AT&T, Dolby и Sony. Только три года спустя формат стал частью MPEG стандарта как MPEG-2 AAC. При последующей разработке аудио стандарта MPEG-4, AAC был улучшен и усовершенствован.
В общих чертах хронология развития формата выглядит следующим образом:
- 1997 — стандартизация MPEG-2 AAC-LC.
- 1999 — стандартизация MPEG-4 AAC-LC. Добавлена технология PNS (Perceptual Noise Substitution).
- 2003 — стандартизация MPEG-4 HE-AAC. Добавлена технология SBR (Spectral Band Replication).
- 2004 — стандартизация MPEG-4 HE-AAC v2. Добавлена технология PS (Parametric Stereo).
HE-AAC является форматом, ориентированным на низкие битрейты. Комбинация из AAC LC и SBR, используемая в нем, дает неплохое качество на битрейтах от 32 до 48 kbit/s. Естественно, HE-AAC поддерживает многоканальность и допускает богатый выбор частот дискретизации. HE-AAC также известен как aacPlus.
Будучи скомбинированным с параметрическим стерео HE-AAC v2 обеспечивает хорошее качество аудио на битрейтах около 16 kbit/s для стерео. HE-AAC v2 также известен как aacPlus v2.
Профили
Некоторые профили обладают низкой сложностью, поэтому они более предпочтительны для портативных устройств, но они также дают немного более слабое качество. Тем не менее, наиболее распространенный профиль в настоящее время — LC, так как другие более требовательные профили (Main, LTP) не дают настолько большего качества насколько являются более требовательными к вычислительным ресурсам.
Заголовки
В AAC существует 4 вида заголовков:
Этот формат заголовка предназначен для простого локального хранения, в отличии от ADTS и LATM / LOAS, которые предназначены для мобильной передачи AAC.
В отличии от заголовка ADIF для файлов AAC, заголовок ADTS присутствует в AAC перед каждым необработанным участком данных или блоком от 2 до 4 таких участков данных во фрейме, что позволяет получить хорошую стабильность в таких средах, как мобильная связь или Интернет. Из-за этих дополнительных данных битрейт возрастает примерно на 2-3 kbps. Некоторые японские вещатели цифрового контента выбрали именно этот формат.
LATM / LOAS
В случае с этими заголовками базовый поток данных MPEG-4 HE AAC или HE AAC v2 в первую очередь инкапсулируется в формат мультиплексирования LATM, который описан в ISO/IEC 14496-3. Используется AudioMuxElement() элемент мультиплексирования. Затем этот поток данных, инкапсулированный в LATM должен быть инкапсулирован в формат трансляции LOAS, который описан в том же стандарте ISO/IEC 14496-3. Здесь используется AudioSyncStream(), который добавляет в аудио поток данные для синхронизации.
Такой формат встречается в европейском цифровом вещании.
Реализации
Apple AAC
Этот кодек был разработан компанией Apple и входил в состав фреймворка Core Audio. Этот фреймворк используется в iTunes, браузере Safari и других продуктах Apple. На средних битрейтах в режиме LC этот кодек считается одним из лучших по качеству. Кодировщик изначально входил в состав медиа фреймворка QuickTime, но позднее был перенесён в AV Foundation.
Дата: | 20 ноября 2018 |
Файл: | qaac_2.68.zip |
Размер: | 2.93 MB |
Существует реализация обёртки с открытым исходным кодом для AAC из Core Audio и ALAC под названием qaac от разработчика nu774, она работает только под Windows. На момент обновления статьи, это наиболее актуальный AAC кодек.
Nero Digital Audio
Дата: | 18 февраля 2010 |
Файл: | NeroAACCodec-1.5.4.zip |
Размер: | 1.96 MB |
Начиная с пятой версии пакет Nero поставляется вместе с AAC кодеком. Сейчас он в составе Nero Digital — проекте о создании нового стандарта в мире цифрового видео и аудио. Nero AAC умеет создавать два типа AAC: LC и HE. Low Complexity (LC) является обычным AAC стандартом, в то время как High Efficiency (HE) использует SBR технологию (схожа с mp3PRO), и если плеер понимает эту технологию, то может быть декодирована дополнительная частотная информация, иначе половина аудио качества пропадает во время воспроизведения. На данный момент кодек значительно устарел и его качество уступает реализации от Apple. Этот кодек очень удобно использовать вместе с программой dBpowerAMP Music Converter и соответствующим кодеком для нее (dBpowerAMP Nero MP4 Codec).
Достоинства Nero MPEG-4 AAC (LC profile):
- Во всех случаях качество заметно выше, чем у LAME MP3 при меньших размерах файла.
- Низкая ресурсоемкость по сравнению с последними версиями LAME MP3 (VBR/ABR).
Psytel AACenc and Fastenc
PsyTEL® FAST MPEG-2 AAC LC Encoder v2.0 (build Mar 4 2002) / Copyright © 1999-2001 PsyTEL Research / Copyright © 1999-2001 Иван Димкович
Югославская компания Psytel Research работала над улучшением стандарта MPEG-2/4 AAC. Она была основана приблизительно в 1998 году программистом Иваном Димковичем.
В то время как первая версия (1.0) была приблизительно компиляцией исходных кодов ISO, качество начало увеличиваться быстро и, через некоторое время, это был единственный реально оптимизированный ISO AAC кодировщик, доступный общественности (версии от FhG и Dolby были доступны только для разработчиков, заинтересованных в улучшении их технологий). Liquifier был также доступен, но потоки данных, созданные им были зашифрованы.
К середине 2002 года компания Psytel Research и все ее имущество было куплено Ahead Software GmbH., и AACEnc стал Nero AAC Encoder.
FAAC (Freeware Advanced Audio Сoder)
В конце 1999 Менно Бэккер (Menno Bakker) открыл исходные коды своих разработок и обосновал проект FAAC (Freeware Advanced Audio Coder). Декодер FAAD2 на сегодняшний день считается одним из лучших и быстрейших AAC декодеров. У проекта FAAD2 (Freeware Advanced Audio Decoder) есть Copyright © 2003-2004 M. Bakker, Nero Software AG. За лицензированием необходимо обращаться к Nero Software AG.
HomeBoy AAC
HomeBoy, так называлась группа программистов, которая создала первый ISO публично доступный AAC кодировщик для Windows’а в далеком 1998. Как сообщается, они также были создателями первого стороннего плагина для Winamp’а (их AAC input plugin), таким образом сделав доступным широким массам первый ISO AAC декодер. Кодировщик представляет собой всего лишь компиляцию оригинальных, связанных с ISO, исходных кодов, поэтому качество было плохим. Но интересно то, что потоки данных, созданные им до сих пор декодируются в современных декодерах.
Версии
Дата | Версия | Интерфейс | Платформа |
---|---|---|---|
1998? | 0.5alpha (Кодировщик) | CLI | Win32 |
1998 | 1.0 (Декодер) | CLI | Win32 |
1998? | 1.1 (Плеер) | CLI | Win32 |
1998? | 1.09 | Winamp Plugin | Win32 |
Dicas/zPlane Compaact!
AAC кодек Compaact! был разработан немецким инженером DSP, Александром Лерхом (Alexander Lerch). Релиз состоялся в 2003 году. Кодек хорошо приняли после релиза. Также он содержал некоторые интересные возможности. Там было три уровня качества (от быстрого до высококачественного кодирования), поддерживал LC и Main профили, имелась возможность включать или отключать такие технологии как TNS или PNS, поддержка многоканального кодирования, некоторые операции предварительной обработки и очень интересную возможность предварительного прослушивания, которая позволяла услышать в реальном времени как будут звучать композиции после сжатия. По неизвестным причинам, проект был остановлен в 2005 году.
Версии
MBsoft AAC
Проект начался приблизительно в 1998, когда немецкий программист Менно Бэккера (Menno Bakker) начал свою работу над исходными кодами AAC. Кодировщик mbaacenc был в той или иной степени сборкой исходных кодов ISO с хорошим front-end’ом. Также был доступен плагин для Winamp’а.
В конце 1999 Менно (Menno) открыл исходные коды своих разработок и обосновал проект FAAC (Freeware Advanced Audio Coder). Проект до сих пор жив, и его декодер, FAAD2 на сегодняшний день считается одним из лучших и быстрейших AAC декодеров.
Это наверное самый логичный шаг после обкатывания и отладки новой методики тестирования: взять кодеки с потерями, которые все считают одними из лучших, и посмотреть, кто кого? В сегодняшнее тестирование попали:
- Apple AAC LC — утилита afconvert, входящая в состав MacOS.
- Ogg Vorbis libvorbis 1.3.6 aoTuV b6.03 — наиболее свежая модификация с оптимизациями качества кодирования.
- Opus 1.3.1 — самый современный кодек и формат кодирования с потерями, позиционируется как лучший на момент написания статьи.
- LAME 3.100 — самая свежая стабильная версия кодека для работы с популярным и по сей день форматом MP3.
Могу сказать, что ради интереса я поверхностно прогнал старичков faac и nero для кодирования в AAC LC. Можно сказать, faac сдался сразу же, на частотах выше 6 кГц он вёл себя на порядок хуже конкурентов. А вот nero удивил, сухие цифры говорят, что он и по сей день прекрасен на частотах до 9500 Гц и даже вполне в паритете с современным Opus! Но, начиная с 13 кГц nero полностью проваливается и сдаёт все позиции конкурентам. Эти два кодека я всё же решил убрать из результатов тестирования. Вероятно, я сделаю обзор на них позже.
В будущем я также думаю сделать обзор, насколько в действительности модификация aoTuV улучшает качество оригинального кодека Ogg Vorbis.
Но давайте продолжим, кто же из 4 перечисленных претендентов на лучший кодек сможет отстоять своё звание?
Параметры исследования
Командные строки запуска кодеков:
Apple AAC LC afconvert
Ogg Vorbis libvorbis 1.3.6 aoTuV b6.03
Opus 1.3.1
LAME 3.100
Битрейты были подобраны так, чтобы размеры итоговых файлов были примерно одинаковыми: в диапазоне от 11.4 до 11.8 МБ. Оригинал был сжат более чем в 7 раз.
Результаты
Давайте начнём с самого интересного, анализа вносимых искажений. Не могу сказать, что нам открывается что-то поразительное, но, тем не менее, картина весьма занятная.
Искажения
Что же у нас тут?
Apple AAC LC называют одним из лучших потребительских AAC кодеков на сегодняшний день. И действительно, он прекрасно держится и проигрывает только технологичному Opus. Но у нас будет ещё одна важная рубрика, посмотрим, как он поведёт себя дальше. Говоря более детально, он хорошо себя показывает на частотах до 3.5 кГц, и до самого потолка, можно сказать, держится наравне с Ogg Vorbis, то слегка выигрывая, то проигрывая.
Ogg Vorbis уже довольно старый формат и на диапазоне самых важных, на мой взгляд, частот от 1 кГц до 4.3 кГц проигрывает всем в степени искажений. Тем не менее, на высоких частотах от 7кГц он с лёгкостью обходит другой ещё более почтенный кодек LAME.
LAME обладает одной из самых низких степеней искажений до 3.5 кГц, затем постепенно сдаёт позиции и проваливается на частотах 6 кГц и выше. Кодек, история которого начинается больше 20 лет назад даже сегодня показывает вполне достойные результаты.
Opus наконец выглядит безусловным фаворитом этой рубрики. Я думаю, вы тоже заметили, что я опускаю рассмотрение искажений на низких частотах, где этот кодек выглядит хуже всех, но, учитывая логарифмическую шкалу и порядки искажений в сотые доли процента, не стоит так сильно упирать на этот момент. Тем не менее, стоит отметить, Opus действительно ведёт себя заметно хуже других кодеков на частотах до 1 кГц, но это примерно 0.04% у других и 0.08% у Opus. Это достаточно низкие показатели в абсолютных величинах. На частотах выше, вплоть до 14 кГц, этому кодеку нет равных, он идёт с большим отрывом, затем ненадолго сравнивается с Apple AAC и снова уходит в отрыв на сверх-высоких частотах выше 16.5 кГц. Стоит сказать, что этот кодек меньше всего «зарезает» сверхвысокие частоты, хотя для среднестатистического человека с обычными наушниками эти частоты уже почти не слышимы.
Скорость кодирования
В этой рубрике кодировщик Ogg Vorbis работал в эмуляторе Wine, поэтому не будем брать в рассмотрение его слабый результат. Могу сказать, что без эмулятора кодировщики Ogg Vorbis весьма и весьма быстрые.
Кодеки отсортированы по скорости декодирования по возрастанию. Тем самым мне хотелось сделать акцент на бытовое применение кодека, так как зачастую именно с этой процедурой сталкиваются потребительские устройства вроде плееров и смартфонов.
Что ж, несмотря на всю свою технологичность, очевидно, что декодирование музыки в формате Opus будет требовать гораздо больших вычислительных ресурсов. Если сравнить с кодеком AAC Apple, то эта разница просто феноменальна и достигает 7 раз!
Что же касается декодеров Ogg Vorbis и LAME, они показывают себя наравне. Хм, здесь очень интересно, насколько оптимальный декодировщик встроен в Spotify, потому что, если результаты их плеера сравнимы с полученными выше, то Apple Music, вероятно, окажется намного более долгоиграющим на одном заряде. Стоит учитывать, что при тестировании использовались оригинальные и референсные декодеры, которые в других реализациях могут показать гораздо более высокие результаты. Впрочем, то же самое можно сказать и про Opus.
Итоги
Очень сложно вынести окончательный вердикт, так как, с одной стороны, Opus и правда справляется со своей задачей намного лучше конкурентов. Но, с другой, он выглядит очень требовательным к ресурсам. Учитывая всё, я думаю, что готов объявить результаты:
- Первое место делят между собой кодеки Apple AAC и Opus 1.3.1. Это лучшие кодеки сжатия с потерями среди выбранных претендентов. Применяйте их в зависимости от вашей сферы: если вам нужно воспроизведение на слабых устройствах, берите Apple. Если же вы хотите получить лучшее качество без оглядок на требовательность к ресурсам: с уверенностью применяйте Opus.
- Второе место отдаётся Ogg Vorbis libvorbis 1.3.6 aoTuV b6.03. Хоть он и провалился на средних частотах, но всё же на частотах выше показал себя весьма неплохо.
- Третье место занимает LAME 3.100 из-за его слабостей на высоких частотах и ярко-выраженной полочки со срезом сверхвысоких частот.
Надеюсь, исследование вышло интересным и позволит вам принять правильное решение в выборе подходящего кодека. До новых встреч в новых исследованиях!
Если не lossless, то кто? MP3, AAC — что еще? Ранее мы уже несколько раз изучали алгоритмы сжатия музыки, настало время сравнить самых достойных.
По-хорошему следовало бы отречься от lossy-кодеков вовсе, но всегда интересно прочертить границу, где количество переходит в качество. Кроме того, даже lossy-кодек может кое-чем удивить, вот увидите. В данном обзоре было решено не морочить голову разными VBR-режимами, а сразу остановиться на максимальном битрейте с постоянной величиной 320 кб/с. Сегодня, при современной емкости портатива, выпрашивать лишние 10 Мб на емкость альбома с риском потерять в качестве? Зачем? В целом, даже с древними кодеками поток 320 кб/с обеспечивает отсутствие характерных артефактов с мерзкими позвякиваниями. Первая часть обзора будет посвящена сравнению роста артефактов с помощью софта RMAA, во второй — изложен субъективный опыт слушателя на реальных фонограммах.
Сравнительная АЧХ трех lossy-форматов относительно оригинала WAV
Если в прошлый раз в качестве источника звука использовался iPad Mini, то сейчас для повышения точности мы выносим любое влияние железа за скобки, и далее весь анализ искажений будет проводиться исключительно в цифровом домене, без преобразования в аналог, поскольку RMAA предоставляет такую возможность.
Для этого генерируем в RMAA тестовый образец в WAV, затем поочередно загоняем его в различные lossy-кодеки. Далее конвертим обратно из них WAV, чтобы программа могла «узнать» файл и оценить отклонения от оригинального шаблона. Теперь смотрим, как рубятся высокие частоты и растут искажения, которые придают противную окраску звуку. Их, кстати, будет не так уж и много. Вообще, на битрейте 320 кб/с поймать на слух явно что-то вредное будет не так просто. Речь пойдет не об артефактах даже, а разве что некоторой «тупости» звука по сравнению с оригиналом. Фонограмма как будто чуть выдыхается, теряет подвижность из-за нарушения переходных процессов после психоакустической обработки. Но явственно зафиксировать эту разницу получится не всегда, зависит от конкретного трека.
MP3: лавинообразные искажения
Начинаем с самого популярного формата. МР3 — чудовище из института Фраунгофера, которое захватило Землю. Из-за него сегодня никому не приходит в голову использовать чистый WAV для записи звуков. Даже если выдирают изуродованное аудио из YouTube, то все равно крошат его еще раз в МР3, да еще и с похабным битрейтом 128 кб/с. Мы так делать не будем, и для теста используем самую актуальную на сегодня версию кодера LAME 3.100 с пресетом insane и битрейтом 320 кб/с.
На самом первом рисунке было видно, что спектр в МР3 ожидаемо испытывает колебания в области ВЧ и окончательно отфильтровывается на границе 20 кГц. Разумеется, это предел синтетического теста, на реальном музыкальном сигнале она наверняка окажется еще ниже. Размеры динамического диапазона в МР3-файле не изменились по сравнению с оригиналом. Т.е. кодер LAME 3.100 на битрейте 320 кб/с не добавляет в запись никаких собственных шумов.
Искажения формы сигнала 1 кГц при кодировании в МР3 в сравнении с оригиналом WAV
Конвертация в МР3 одиночного сигнала 1 кГц показала появление множества мелких гармонических искажений. И хотя формально их доля невелика (0,0009%) — т.е. раза в полтора-два меньше, чем на выхлопе у хорошего ЦАПа, — в динамичном спектре реальной фонограммы их число будет расти в лавинообразном и непредсказуемом порядке. Также «утолщение» основания узкого в оригинале пика 1 кГц указывает на определенные проблемы, обрастание паразитными колебаниями. Эту особенность наглядно иллюстрирует «квадратная» 100 Гц волна после ее конвертации в МР3. Как видите, по горизонтальной оси ее контур теряет четкость. Все это в конечном итоге отрицательно сказывается на утомляемости слуха при прослушивании МР3, увы, даже самых максимальных битрейтов.
«Квадратная» волна 100 Гц после конвертации в МР3 (вверху) и AAC (внизу)
AAC: поднять шум, но сохранить чистоту
Более аккуратным образом действует алгоритм ААС, которым активно оперирует Apple, да и не только он. С данным аудиокодеком работают цифровые ТВ-бродкастеры, а кроме того, ААС входит в пакет контейнера MPEG-4.
Квадратная волна после конвертации в ААС сохраняет свою форму, хотя искажения основания и гармоники вокруг пика 1 кГц тоже имели место, хотя и менее заметно, чем в МР3. При этом ААС демонстрирует больший на 1 дБ измеренный уровень шума. Что бы это значило — промежуточная запись на кассету, что ли? Нет, наверняка в алгоритме ААС используется что-то вроде нойзшейпинга — великое изобретение, позволяющее снижать ошибки квантования за счет подмешивания псевдослучайного шумового сигнала. Повторюсь, это не просто утопление искажений ниже шумового порога — здесь применяется более изощренная математика.
Для иллюстрации посмотрим артефакты вокруг так называемого джиттер-теста на частоте 11,025 кГц. Почему именно эта частота? Потому что кратная гармоника к этому пику приходится ровно на верхнюю границу спектра из цифрового потока с дискретизацией 44 кГц, а все остальные будут находиться за его пределами. Паразитные маленькие пики, особенно те, которые располагаются симметрично относительно основного тона (продукты модуляции, «боковые полосы») — вот это и есть зерна джиттера.
Устойчивость в джиттер-тесте ААС (вверху) и МР3 (внизу)
Как видим, дурак-МР3 сберег низкий уровень шума, но сгенерировал больше высокочастотного джиттера (наиболее заметного на слух), а AAC немного поднял шум, зато избежал паразитов на остальных участках спектра. Но еще большие фокусы с нойзшепингом вытворяет кодер WavPack.
WavPack: сохранить частоту, поменять разрядность
Вообще, если уж сразу и совсем коротко, то математика кодера WavPack на сегодня относится к самым гибким и крутым протоколам для аудиоэнтузиастов, без шуток. В отличие от FLAС, он умеет поддерживать 32-битное исчисление (я рекомендовал его для создания lossless виниловых рипов). Более того, в WavPack даже можно запаковать DSD-файл, не обращая его в РСМ. При этом размер такого файла получится гораздо меньше, чем dsf-оригинал. Но об lossless WavPack мы поговорим как-нибудь в другой раз, а пока рассмотрим уникальный принцип действия lossy-кодека WavPack.
В одном из своих обзоров я показывал, что в ряде случаев при сжатии с потерями имеет смысл снижать не частоту дискретизации, а непосредственно битность сигнала (т.е. ниже 24 или 16 бит), аккуратно подмешивая дизер (т.е. специальный профиль шума для уменьшения ошибок квантования). WavPack пошел именно этим славным путем, не трогая дискретность и частотку вообще, зато изменяя глубину бит, которая теперь является динамической величиной, описывая уровень громкости сигнала. Чем-то напоминает DSD-принцип, не правда ли?
Примечательно, что при конвертации в такой lossy WavPack, можно дополнительно сохранить параллельный «корректирующий» файл, с помощью которого можно будет полностью, до последнего бита, восстановить оригинал. Правда, экономить место на диске в этом случае не получится, так как размер такой пары будет все равно соответствовать lossless-оригиналу. Но тем не менее функционал протокола все равно впечатляет.
Битрейт нашего тестового файла был выставлен на 320 кб/с, чтобы сопоставить его с максимумом наших МР3 и ААС, но теоретически в WavPack его можно ставить и выше. Особенно это пригодится для хайрезов, далее я покажу как — и никакой MQA больше не нужен!
Сравнение гармонических искажений оригинала (зеленым) и файла, закодированного в lossy WavPack (белым). Чуть подрос уровень шума и почти никаких искажений
На графиках lossy WavPack демонстрирует похвальное отсутствие частокола гармоник, которые набегали у двух предыдущих кодеров из-за агрессивной психоакустической модели. В WavPack подобные хитрые алгоритмы отсутствуют, фильтров АЧХ тоже нет — работает просто динамическое взвешивание уровня сигнала под заданный битрейт, и все. В итоге тестирование 1 кГц дает всего несколько гармоник нечетного порядка — 3-я, 7-я, 9-я и т. д. Частотный диапазон сохранен, квадратная волна тоже. На джиттер-тесте 11 кГц по остальному спектру кроме подросшего шума не замечено, никакой паразитной деятельности.
В джиттер-тесте тоном 11025 Гц у lossy WavPack все чисто
Для слухового опыта я отобрал пару достаточно звонких и неплохо прописанных фонограмм, которые вы также можете скачать и послушать в трех вариациях lossy-кодирования с битрейтом 320 кб/с: MP3, AAC и WavPack. Там же, в этих двух архивах, будут приложены оригиналы FLAC в стандартном CD-разрешении 16 бит / 44 кГц.
Композиция «White Wood» группы Lush поможет оценить деградацию ВЧ-диапазона. Кто-то на форуме шутил над моей верностью шугейзу, но именно такая, хрупкая, но спектрально насыщенная ткань оказывается весьма чувствительной к бульдозеру lossy-кодеков и поганой аппаратуры. Стоит чуть уступить, и все гитарные хорусы с медью тарелочек превратятся в жестяную помойку. Вторая фонограмма, «Deep Sleep» B-52’s, представляет собой пример адекватного мастеринга с сочным саундом, студийными эффектами и сохраненным при этом динамическим диапазоном.
Выводы
По итогам прослушивания все треки разделились на две группы. В первую по степени неразличимости попали оригинал, AAC и WavPack. На их фоне МР3 прозвучал явным аутсайдером-одиночкой. Звук МР3 на 320 кб/с не делается жестким, нет, скорее даже наоборот. Я бы, кстати, звучание этого кодека охарактеризовал скорее как теплое — подача музыки как будто оборачивается мутноватым полиэтиленом. Само собой, мастеринг и частотная коррекция у альбомов бывает очень разной, в том числе и такой вот теплой. И если просто запустить подобный MP3 без сравнения с оригиналом, никто ничего и не заподозрит. Но в целом следует признать, что МР3 справляется со своей задачей хуже всех.
Конечно, можно обратиться к старинным МР3-кодекам типа LAME 3.93, где отключался полифазный фильтр, покрутить еще какие-то настройки. Но после ясного и естественного звука AAC на том же битрейте, заниматься подобными экспериментами пропадает желание. К тому же AAC и WavPack можно слушать на любом софте и в том числе на телефонах после установки какой-нибудь портативной версии Foobar. С поддержкой WavPack в Car Audio придется повозиться, но в принципе все преодолимо.
В заключение также предлагаю сравнить работу WavPack на образце моего винилового рипа из «Щелкунчика». Здесь уже продемонстрирована обработка высокодискретного сигнала. Оригинал был закодирован во FLAC с размерностью 24 бит / 88 кГц. Далее из него было сделано два варианта:
№1 — это стандартный FLAC 16 бит / 44 кГц, совместимый с CD-стандартом.
№2 — lossy WavPack с дискретностью 88 кГц и битрейтом 700 кб/с.
Величину данного битрейта lossy WavPack можно было сделать меньше или больше, она подбиралась экспериментально. Для нашего сравнения было важно, чтобы конечный файл WavPack совпадал по размеру с конкурентом FLAC 16 бит / 44 кГц. Все три файла также можно скачать и сравнить самостоятельно.
Непосредственное сравнение образцов подтвердило идею о том, что стандартное понижение HD-мастеров до CD-разрешения, пускай и незначительно, но все же огрубляет музыкальную фактуру оригинала. Деградация происходит, главным образом, за счет потери глубины передних и дальних планов. Сцена как бы выстраивается в единую плоскость. При этом стоит отметить, что вариант lossy WavPack при сопоставимом размере файла оказался лишен данного недостатка и может быть рекомендован для широкого применения в портативном аудио и различных стриминговых сервисах.
Файл с расширением AAC – это файл MPEG-2 Advanced Audio Coding. Он похож на аудиоформат MP3, но содержит некоторые улучшения в плане производительности.
Apple iTunes и iTunes Music Store используют Advanced Audio Coding в качестве метода кодирования по умолчанию для музыкальных файлов. Это также стандартный аудиоформат для Nintendo DSi и 3DS, PlayStation 3, DivX Plus Web Player и других устройств и платформ.
Файлы AAC, безусловно, могут использовать расширение файла .AAC, но чаще всего они заключены в контейнер файла M4A и поэтому обычно имеют расширение файла .M4A.
Как воспроизвести файл AAC
Вы можете открыть файл AAC с помощью iTunes, VLC, Media Player Classic (MPC-HC), Windows Media Player, MPlayer, Audials One и, возможно, многих других мультиформатных медиаплееров.
Вы можете импортировать файлы AAC в iTunes через меню «Файл». На Mac используйте опцию Добавить в библиотеку. Для Windows выберите «Добавить файл в библиотеку . » или «Добавить папку в библиотеку . », чтобы добавить файлы AAC в медиатеку iTunes.
Если вам нужно открыть файл AAC в программном обеспечении для редактирования звука Audacity, Вам необходимо установить библиотеку FFmpeg, если вы работаете в Windows или Linux.
Расширение файла AAC имеет некоторые из тех же букв, что и расширения, встречающееся в других форматах файлов, таких как AAE (формат бокового изображения), AAF, AA (общий образ компакт-диска), AAX (расширенная аудиокнига), ACC (данные графических учетных записей) и DAA, но это не значит, что они обязательно имеют какое-либо отношение друг к другу или что они могут открываться с помощью одних и тех же программ.
Если вы обнаружите, что приложение на вашем компьютере пытается открыть файл AAC, но это неправильное приложение, или если вы предпочитаете, чтобы другая установленная программа открывала файлы AAC, обратитесь к нашему руководству для внесения этого изменения в Windows.
Как конвертировать файл AAC
Используйте бесплатный аудио конвертер для преобразования файла AAC. Большинство программ позволяют конвертировать файл AAC в MP3, WAV, WMA и другие подобные аудио форматы. Вы также можете использовать бесплатный аудио конвертер, чтобы сохранить файл AAC в качестве мелодии звонка M4R для использования на iPhone.
Вы можете использовать FileZigZag для преобразования файла AAC в MP3 (или другой аудиоформат) в macOS, Linux или любой другой операционной системе, поскольку он работает через веб-браузер. Загрузите файл AAC в FileZigZag, и вам будет предоставлена возможность конвертировать AAC в MP3, WMA, FLAC, WAV, RA, M4A, AIF / AIFF / AIFC, OPUS и многие другие форматы.
Zamzar – ещё один бесплатный онлайн-конвертер AAC, такой как FileZigZag.
Некоторые музыкальные файлы, приобретенные через iTunes, могут быть закодированы в защищенном формате AAC определенного типа и поэтому не могут быть преобразованы с помощью конвертера файлов. Посмотрите страницу iTunes Plus на веб-сайте Apple, чтобы получить информацию о том, как вы можете удалить эту защиту, чтобы вы могли конвертировать файлы в обычном режиме.
Читайте также: