Максимальный динамический диапазон записи на компакт диск

Возможно, по прошлым колонкам у кого-то сложилось впечатление, что я призываю не скулить, переходить на сетевые плееры и HD-контент, и все автоматом станет окей. Это не совсем так. Сравнивая несколько изданий одного альбома, прежде всего меня интересует не максимальное количество бит, а максимальная ширина динамического диапазона.

Чтобы узнать, нуждается ли в нем ваша акустика — поставьте простой эксперимент. Запустите любой компакт-диск примерно до 90-го года выпуска, и прибавьте газку на усилителе. Звук остался плоским, вялым и невыразительным, как и на малой громкости, да? Я вас поздравляю — акустика справляется только с компрессированными записями.

В 80-х компакт-диски причислялись к High-End. Динамический диапазон уважали и принимали за точку отсчета самое громкое место в альбоме, по которому и выстраивали CD-мастеринг. В начале 90-х пики цифрового сигнала стали потихоньку подтягивать к лимиту в 0 дБ. Громче было нельзя, иначе звуковая волна обрезалась, и не просто, а с искажениями, называемыми клиппингом.

Я отлично помню тот переломный момент, когда вдруг поперли громкие, раскатистые альбомы вроде «The Fat of the Land» (1997) у The Prodigy или «Gran Turismo» (1998) у The Cardigans. Я тогда еще не знал, что во второй половине 90-х на студиях распространились цифровые компрессоры и лимитеры, позволяющие эффективно отсекать пики сигнала и подтягивать к 0 дБ уже основную музыкальную партию, делая ее еще громче, громче и громче. Не скрою, что тогда мне очень понравилось звучание этих новых альбомов. К тому же моя hi-fi система попросту не позволяла раскрыть потенциал «тихих» CD с большим динамическим диапазоном. А свежие издания звучали действительно лихо — и не только у меня. Это и был решающий аргумент в знаменитой loudness war, начавшейся еще в виниловую эпоху, когда продюсеры и музыканты обратили внимание, что громкие синглы лучше привлекают публику. C легкой руки лейбла Motown появился термин «Hot Mastering».

Позже мне стало очевидно, что эти накачанные анаболиками треки невозможно слушать на большой громкости — музыка получается зычная, но пустая, как барабан. Сегодня практически 100% новых записей и ремастеров издается с компрессией динамики. Тенденции не избежали даже тестовые CD. Например, таковой сделалась серия демо-дисков Focal JMLab, начиная с 2000 года. Исключения составляют лейблы с классической музыкой и специальные издания вроде тех, которые делают на Mobile Fidelity Sound Lab.

В loudness war есть своя логика — ведь музыку чаще всего слушают в автомобилях, портативе и мультимедийных системах — фонограмма с большой амплитудой прозвучит там абсолютно беспомощно.

На хорошей, чуткой акустике слышно, что больше всего при компрессии страдает вокал. Студийными эффектами сцену можно сделать сколь угодно широкой, добавить баску, но голос в зажатой динамике потеряет в живости и локализации. Он размажется где-то там, между третьим и четвертым инструментами.

Однако не стоит отчаиваться. Спецификации современных АС с тугими длинноходными динамиками чувствительностью ниже 88 дБ не описывают этот нюанс, но большинство из них адаптировано именно под компрессированный контент. Иначе бы вы не накупили себе столько ремастеров. Самые мудрые и понимающие издатели выпускают (например, Пол Маккартни) в двух вариантах — полнодиапазонном и традиционном «громком». Надеюсь, это станет стандартной процедурой в индустрии. А пока, если интересно получить на руки цифровое измерение динамического здоровья свой аудиоколлекции, поставьте к плееру Foobar соответствующий плагин. Познавательное занятие, честно скажу.

FAQ по звуковым компакт-дискам (CD-DA)

Все права в отношении данного текста принадлежат автору. При воспроизведении текста или его части сохранение Copyright обязательно. Коммерческое использование допускается только с письменного разрешения автора.

Как устроен компакт-диск?

Конструкция диска CD-DA (Compact Disk - Digital Audio, компакт-диск - цифровой звук) и способ записи звука на нем описывается стандартом предложивших его фирм Sony и Philips, изданным в 1980 году под названием Red Book (Красная Книга).
Стандартный компакт-диск (CD) состоит из трех слоев: основы, отражающего и защитного. Основа выполнена из прозрачного поликарбоната, на котором методом прессования сформирован информационный рельеф. Поверх рельефа напыляется металлический отражающий слой (алюминий, золото, серебро, другие металлы и сплавы). Отражающий слой покрывается сверху защитным слоем поликарбоната или нейтрального лака - так, чтобы вся металлическая поверхность была защищена от контакта со внешней средой. Общая толщина диска - 1.2 мм.
Информационный рельеф диска представляет собой непрерывную спиральную дорожку, начинающуюся от центра и состоящую из последовательности углублений - питов (pits). Промежутки между питами носят название lands. Чередованием питов и промежутков различной длины на диске записывается закодированный цифровой сигнал: переход от промежутка к питу и наоборот обозначает единицу, а длина пита или промежутка - длину серии нулей. Расстояние между витками дорожки выбирается от 1.4 до 2 мкм, стандарт определяет расстояние в 1.6 мкм.

Каким образом на диске представляется звуковой сигнал?

Исходный стереофонический звуковой сигнал подвергается оцифровке в 16-разрядные отсчеты (линейное квантование) с частотой дискретизации 44.1 кГц. Полученный цифровой сигнал носит название PCM (Pulse Code Modulation - импульсно-кодовая модуляция, ИКМ), так как каждый импульс исходного сигнала представляется отдельным кодовым словом. Каждые шесть отсчетов левого и правого каналов оформляются в первичные кадры, или микрокадры, размером 24 байта (192 бита), поступающие со скоростью 7350 штук в секунду, которые подвергаются кодированию при помощи двухуровневого кода CIRC (Cross Interleaved Reed-Solomon Code - избыточный код Рида-Соломона с перекрестным перемежением) по схеме: перемежение с задержкой на 1 байт, кодирование уровнем C2, перекрестное перемежение с переменной задержкой, кодирование уровнем C1, перемежение с задержкой на 2 байта. Уровень C1 предназначен для обнаружения и коррекции одиночных ошибок, C2 - групповых. В результате получается блок длиной 256 бит, данные в котором снабжены разрядами обнаружения и коррекции ошибок, и к тому же "размазаны" до блоку, что приводит к записи смежных звуковых данных в физически несмежных областях диска и снижает влияние ошибок на отдельные отсчеты.
Код Рида-Соломона имеет избыточность 25% и позволяет обнаруживать до четырех ошибочных байтов и корректировать до четырех потерянных или двух ошибочных байтов. Максимальная длина полностью исправляемого пакета ошибок - около 4000 бит (~2.5 мм длины дорожки), однако не любой пакет такой длины может быть полностью исправлен.
После второго перемежения к каждому полученному блоку добавляются разряды субкодов - P, Q, R, S, T, U, V, W; каждый блок получает восемь субкодных битов. Затем каждые 98 блоков с субкодами оформляются в один сверхкадр длительностью 1/75 сек (объем чистых звуковых данных - 2352 байта), называемый также сектором, в котором субкоды первых двух блоков служат признаком синхронизации, а оставшиеся 96 разрядов каждого субкода образуют P-слово, Q-слово и т.д. На протяжении всей дорожки последовательность субкодных слов называют также субкодными каналами.
Слова или каналы субкодов используются для управления форматом записи, индикации фрагментов фонограммы и т.п. - например, канал P служит для пометки звуковых дорожек и пауз между ними (0 - пауза, 1 - звук), а канал Q - для пометки формата дорожек и секторов, записи оглавления TOC (Table Of Contents - таблица содержимого) и временнЫх меток, по которым отслеживается время воспроизведения. Канал Q может использоваться также для записи информации в ISRC (International Standard Recording Code - международный стандартный код записи), предназначенном для представления сведений о производителе, времени выпуска и т.п., а также - для разделения дорожки на отдельные фрагменты (всего на звуковом диске может быть до 99 звуковых дорожек, каждая из которых может включать до 99 фрагментов).
В конце концов оформленные таким образом кадры подвергаются канальному кодированию в терминах "пит - промежуток" с использованием избыточного кода 8/14 (Eight to Fourteen Modulation - EFM), в котором исходные байты кодируются 14-битными словами, повышающими разборчивость сигнала. Между словами вставляется по три связующих бита для соблюдения ограничений на количество смежных нулей и единиц, что облегчает демодуляцию и уменьшает постоянную составляющую сигнала. В результате из каждого первичного микрокадра получается 588 канальных битов, и полученный битовый поток записываются на диск со скоростью 4.3218 (588 x 7350) Мбит/с. Поскольку EFM-кодирование дает цифровой поток, в котором нулей больше, чем единиц, и была выбрана система представления единиц границами пита и промежутка, а количества нулей между единицами - длиной пита или промежутка соответственно.
В начале диска располагается так называемая вводная (lead-in) зона, содержащая информацию о формате диска, структуре звуковых программ, адресах фрагментов, названиях произведений и т.п. В конце записывается выводная (lead-out) зона (дорожка с номером AA), выполняющая роль границы записанной области диска; бит P-кода в этой зоне изменяется с частотой 2 Гц. Ряд бытовых проигрывателей не может опознать диск без этой зоны, однако многие могут обходиться без нее. Между вводной и выводной зонами записывается программная область (Program Memory Area - PMA), содержащая собственно звуковые данные. Программная область отделена от вводной зоны участком из 150 пустых блоков (2 секунды), играющим роль зазора (pre-gap).
Общая длительность записи на компакт-диске - 74 минуты, однако при уменьшении стандартного шага дорожки и расстояния между питами можно достичь увеличения времени записи - за счет снижения надежности считывания в стандартном дисковом приводе.

Как записываются и изготавливаются компакт-диски?

Основной способ изготовления дисков - прессование с матрицы. Оригинал формируется с исходной цифровой мастер-ленты, содержащей уже подготовленный и закодированный цифровой сигнал, специальным высокоточным станком на стеклянном диске, покрытом слоем фоторезиста - материала, изменяющего свою растворимость под воздействием лазерного луча. При обработке записанного оригинала растворителем на стекле возникает требуемый рельеф, который методом гальванопластики переносится на никелевый оригинал (негатив), который может служить матрицей при мелкосерийном производстве, либо основой для снятия позитивных копий, с которых, в свою очередь, снимаются негативы для массового тиражирования.
Штамповка выполняется методом литья под давлением: с негативной матрицы прессуется поликарбонатная подложка с рельефом, сверху напыляется отражающий слой, который покрывается лаком. Поверх защитного слоя обычно наносятся информационные надписи и изображения.
Диски с возможностью записи (CD-R, "болванки") изготавливаются таким же методом, но между основой и отражающим слоем располагается слой органического вещества, темнеющего при нагревании. В исходном состоянии слой прозрачен, при воздействии лазерного луча образуются непрозрачные участки, эквивалентные питам. Для облегчения слежения за дорожкой при записи на диске в процессе изготовления формируется предварительный рельеф (разметка), дорожка которого содержит метки кадров и сигналы синхронизации, записанные со сниженной амплитудой и впоследствии перекрываемые записываемым сигналом.
Записываемые диски за счет наличия органического фиксирующего слоя имеют более низкий коэффициент отражения, чем штампованные, отчего некоторые проигрыватели (Compact Disk Player - CDP), рассчитанные на стандартные алюминиевые диски и не имеющие запаса по надежности чтения, могут воспроизводить диски CD-R менее надежно, чем обычные.

Как воспроизводятся компакт-диски?

Каковы параметры звукового сигнала на CD?

Диапазон частот: 0..22050 Гц
Динамический диапазон: 98 дБ
Уровень шума: -98 дБ
Коэффициент нелинейных искажений: 0.0015% (на максимальном уровне сигнала)

Что такое jitter?

Джиттер - быстрое по отношению к длительности периода дрожание фазы цифрового сигнала, когда нарушается строгая равномерность следования фронтов импульсов. Такое дрожание возникает из-за нестабильности тактовых генераторов, а также в местах выделения синхросигнала из комплексного сигнала методом PLL (Phase Locked Loop - петля с захватом фазы, или фазовая автоподстройка частоты - ФАПЧ). Такое выделение имеет место, например, в демодуляторе сигнала, считанного с диска, в результате чего образуется опорный синхросигнал, который путем коррекции скорости вращения диска "подгоняется" к эталонной частоте 4.3218 МГц. Частота синхросигнала, а следовательно - его фаза и фаза информационного сигнала - при этом непрерывно колеблются с различной частотой. Дополнительный вклад может вносить неравномерность расположения питов на диске, порожденная, например, некачественным прессованием или нестабильной записью.
Однако неравномерности сигнала с диска полностью компенсируются входным буфером декодера, так что любое дрожание и детонация, возникшие до помещения сигнала в буфер, на этом этапе уничтожаются. Выборка из буфера управляется стабильным генератором с фиксированной частотой, однако таким генераторам тоже присуща определенная, хотя и гораздо меньшая, нестабильность. В частности, она может быть вызвана помехами по цепям питания, которые, в свою очередь, могут возникать в моменты срабатывания САР и коррекции скорости диска или положения головки/линзы. На дисках низкого качества эти коррекции происходят чаще, давая ряду экспертов повод напрямую связывать стабильность выходного сигнала с качеством диска, хотя на самом деле причиной является недостаточно хорошая развязка систем CDP.

Что означают аббревиатуры AAD, DDD, ADD?

Буквы этой аббревиатуры отражают формы звукового сигнала, использованные при создании диска: первая - при исходной записи, вторая - при обработке и сведении, третья - конечный мастер-сигнал, с которого формируется диск. "A" обозначает аналоговую (analog) форму, "D" - цифровую (digital). Мастер-сигнал для CD всегда существует только в цифровой форме, поэтому третья буква аббревиатуры всегда "D".
И аналоговая, и цифровая формы сигнала имеют свои достоинства и недостатки. При записи и обработке сигнала в аналоговой форме наиболее полно сохраняются его "тонкие элементы", в частности - высшие гармоники, однако возрастает уровень шума и искажаются амплитудно-частотная и фазо-частотная характеристики (АЧХ/ФЧХ). При обработке в цифровой форме высшие гармоники принудительно обрезаются на половине частоты дискретизации, а часто и еще ниже, однако все дальнейшие операции выполняются с предельно возможной для выбранного разрешения точностью. Сигнал, прошедший аналоговую обработку, ряд экспертов оценивает, как более "теплый" и "живой", однако многие современные методы обработки сигнала приемлемо реализуются только в цифровом варианте.

Могут ли два одинаковых диска звучать по-разному?

Недостаточно надежная система считывания и декодирования во многих дорогих CDP, преднамеренно рассчитанная на столь же редкие и дорогие диски. Это косвенно подтверждается тем, что нередко диски низкого качества, успешно считываемые дешевыми CDP, крайне плохо воспроизводятся проигрывателями класса High End.
Применение в декодере CIRC стратегий, ориентированных на обнаружение ошибок, нежели на их исправление, в результате чего безошибочно считываются только очень качественные диски, а большая часть обычных порождает ошибки, маскируемые интерполятором.
Недостаточно полное подавление помех, создаваемых механической системой CDP, которая при плохом качестве сигнала с диска работает с большей нагрузкой и создает помехи большей интенсивности.
Различные коэффициенты отражения/преломления луча, глубина/форма питов, неровность дорожки, а также прочие особенности дисков, влияющие на интенсивность отраженного луча и форму сигнала, создаваемого им в фотоприемнике. Даже если восстановленный при декодировании цифровой сигнал в обоих случаях будет одинаковым, тем не менее электрические процессы, происходящие в CDP, в общем случае будут различны. Отголоски этих процессов в виде паразитных помех могут проникать в схему ЦАП и влиять на выдаваемый им звуковой сигнал.

High Definition Compatible Digital - "сверх-система" кодирования звука на CD, использующая стандартный формат CD-DA. Звуковой сигнал с более высокой разрядностью и частотой дискретизации подвергается цифровой обработке, в результате которой из него выделяется основная часть, кодируемая, как обычно, методом PCM, а дополнительная информация, уточняющая мелкие детали, кодируется в младших битах отсчетов (LSB) и маскируемых спектральных областях. При проигрывании диска HDCD на обычном CDP используется только основная часть сигнала, а при использовании специального CDP со встроенным декодером и процессором HDCD из цифрового кода извлекается вся информация о сигнале.

Как обращаться с компакт-дисками?

Избегая механического повреждения любой из поверхностей, попадания на диск органических растворителей и прямого яркого света, ударов и перегибов диска. Надписи на записываемых дисках допускается делать только карандашами или специальными фломастерами, исключая нажим и использование шариковых или перьевых ручек.
При извлечении диска из коробки следует остерегаться его перегиба. Один из удобных и безопасных методов требует участия двух рук - большой палец левой руки слегка нажимает на фиксатор, ослабляя его, в то время как другая рука снимает диск с фиксатора. Метод с использованием одной руки, когда указательный палец ослабляет фиксатор, а большой и средний снимают диск, требует более точного согласования усилий, без которого легко перегнуть диск или сломать лепестки фиксатора.
Загрязненный диск можно мыть теплой водой с мылом или неагрессивным поверхностно-активным веществом (шампунь, стиральный порошок), либо специально выпускаемыми жидкостями. Неглубокие царапины на прозрачном слое можно заполировать - полирующими пастами, не содержащими органических растворителей и масел, или обычной зубной пастой.

Что такое "зеленый фломастер" и зачем он нужен?

Это фломастер, наполненный специальным составом, хорошо поглощающим инфракрасное излучение. Им закрашивается внешняя кромка диска с целью ослабить отражения луча от ее внутренней поверхности, и тем самым снизить помехи от паразитных отражений на основной луч.
Многие пользователи и эксперты утверждают, что обработанный таким образом диск дает более чистое звучание в аппаратах высокого класса, приписывая это более точному считыванию цифровой информации с диска, который в своем исходном виде якобы не может быть достоверно считан в большинстве приводов. Однако тщательно выполненная система (привод и декодер) в состоянии правильно считывать не только необработанные диски, но и диски среднего качества, и даже слегка загрязненные и поцарапанные, поэтому возможные причины улучшения звучания следует искать не в диске. Наиболее вероятными объяснениями этого феномена представляются те же факторы, которые создают различное звучание совпадающих по цифровому содержимому экземпляров дисков.

При выборе музыкальных СД-дисков большое значение играет динамический диапазон записи.

Именно из за сознательно суженного (компрессированного) звукорежиссером динамического диапазона записи на компакт-диске могут возникнуть претензии к звучанию.

Компрессия по звуковому диапазону применяется все чаще не только на этапе финальной подготовки диска.

Любая компрессия DR (динамического диапазона) негативно сказывается на впечатлениях при прослушивании.

Если вы вставили диск в СД-проигрыватель и у вас при прослушивании остается стойкое ощущение каши и сумбура, «грязного» звука — это признак того, что диск немилосердно сжат по динамическому диапазону.

Что же такое динамический диапазон и для чего его вообще нужно сжимать.

Сжимать динамический диапазон не нужно, его сжатие можно воспринимать, как уродование звука.

Динамический диапазон — это диапазон между самыми тихими и самыми громкими звуками на фонограмме.

Естественно, чем он больше, тем более тонко (если это требуется) может быть подан музыкальный материал, где в трехмерном пространстве будет слышно все — от турбуленции воздуха от дирижерской палочки, до выстрела из пушки.

В чем теоретический минус.

Во многих симфонических концертах динамический диапазон очень большой и есть места где музыканты играют крайне тихо, а есть, где нарастает экспрессия и музыка грохочет. При прослушивании, в таких композициях устанавливается громкость усилителя достаточно высоко и становятся прекрасно слышны, как самые тихие звуки, так и по мере нарастания, очень громкие.

В переносных устройствах (смартфоны, планшеты) стоят маломощные усилители, которые, сомнительно, что могут все это отыграть в полном диапазоне с приемлемой громкостью. Поэтому стали применять компрессию — самые тихие звуки по громкости подтягивают к самым громким (получается фактически, что начинают шепотом орать), динамический диапазон сужается, но громкость в целом возрастает на 30%, что плюс для мобильных устройств, которые прослушиваются в агрессивной для прослушивания среде (шумная улица, метро). Мобильная музыка во всех случаях — это компромисс между качеством и удобством.

Производители готовы пожертвовать качеством звучания ради любителей мобильной музыки, но портят в итоге музыку для всех.

На примере альбома группы ZZ Top — уродование звука более поздними релизами. В ремастере 2008 года уже даже не угадываются первоначальные контуры. Щелкните на картинку для отображения в динамике.

Приходится в коллекцию искать СД-диски не изуродованные компрессией динамического диапазона, что сейчас становится нелегкой задачей.

Чтобы определить динамический диапазон СД-диска, достаточно установить плагин Dynamic Range Meter измеряющий динамический диапазон в проигрыватель foobar2000.

Точнее, он меряет некий пик-фактор — разницу между пиковыми уровнями и RMS (среднеквадратичным значением уровня звука в альбоме или аудиотреке).

Если значение пик-фактора (DR) динамического диапазона фонограммы равно 14 — это великолепный показатель. Если вы увидите значение 15 — это близко к фантастике.

Но этот показатель сильно зависит от жанра в котором вы слушаете музыку.

Для рок-музыки в целом хороший результат начинается с DR 10.

Например, альбом группы Nazareth «Sound Elixir» на СД имеет DR равный 10 и при этом прекрасно звучит, благодаря использованию электронных инструментов.

Для heavy и thrash-метал так же вполне достаточно DR в районе 10, так как, в большинстве случаев, в этой музыке нет сильных звуковых перепадов.

Обширнейший динамический диапазон требуется для воспроизведения акустических инструментов — гитары, саксофона и тд.

В таких случаях порадует разница диапазона от 13 до 15.

В целом большинство хороших СД дисков показывает DR от 11 до 14. Но встречаются диски имеющие динамический диапазон равный 15 (например СД-диск группы Телевизор «Отечество иллюзий») и даже 18.

Диски с большим DR слушаются с огромным удовольствием — их звучание открытое, естественное, лишенное цифровой сухости и тяжеловесности.

Если же прослушивание диска кажется вам грязноватым, но терпимым, то скорее всего вы нарвались на компрессированный по динамическому диапазону диск со значением примерно 8. С таким значением идут многие ранние концерты группы Nazareth и других — это удручает, так как такая интересная и богатая на инструменты музыка достойна лучшего качества.

Порой вызывает недоумение, когда априори аудиофильские исполнители выпускают записи своих концертов с сильной компрессией.

Например диск Sade Soldier of Love выпущенный в 2010 годe имеет DR динамического диапазона равный всего лишь 10. При этом, композиции наполнены прекрасным женским вокалом и акустическими инструментами. Здесь компрессия диапазона явно слышна и сильно разочаровывает.

Становится непонятно для кого тогда этот диск записан в принципе. Его не станут слушать любители рэп и аналогичного, а для аудиофилов такое качество мало пригодно к прослушиванию.

Более того, я вообще сомневаюсь, что сегодня кто то слушает на улице музыку с переносного СД-проигрывателя. Обычно в портативе используются файлы с музыкой, но не СД. Поэтому очевидного смысла коверкать запись на СД-диске для более высокой громкости не просматривается.

Таблица минимального DR в соответствии с музыкальным стилем.

Тогда становится разумным вопрос — в таком случае зачем портить СД-запись по DR?

Если для смартфонов, то в них используют файлы, а не диски, в большинстве случаев это не аудиофильские форматы (mp3,AAC) , которые так же имеют деструктивную природу и ограничение еще и по частотному диапазону . Вопрос, почему нельзя СД-диски писать без компрессии остается риторическим.

Как ответ этой ситуации на рынке стали появляться специальные «аудиофильские» диски без компрессии, например компиляция Audiophile World.

Действительно, не компрессированный диск на дешевом переносном плеере или смартфоне в силу внешних шумов, которые замаскируют самые тихие звуки, будет звучать возможно неважно, а компрессированный покажется звучащим лучше в силу того, что громкость тихих звуков гиперзавышена и находится над внешним шумом. Но это, в любом случае, низкокачественное низкосортное воспроизведение и для высококачественного воспроизведения на хороших Hi-Fi/Hi-End аппаратах компрессированные записи не годятся.

Статистика, к сожалению, свидетельствует, что производитель с каждым годом усиливает компрессию звукового материала, что конечно же негативно сказывается на качестве звучание на аппаратуре класса Hi-Fi.

Это схоже с тем, что звукорежиссер озадачился целью, записать диск, который будет звучать отлично на фоне работающего отбойного молотка. Возможно в таких ситуациях это покажется прекрасным, но можно ли серьезно говорить о качестве звучания, если используется глубокая компрессия?

Большинству аудиофилов не важна громкость диска, ее можно выставить любой на усилителе, важна чистота и детальность звучания, и многие другие параметры.

С появлением современных высококлассных усилителей музыка открыла для себя новое измерение, которое добавляет к ней еще одну восхитительную грань — возможность большего вовлечения благодаря аудиофильской прорисовки музыкальных событий. В этом измерении воспринимается не только мелодия, но и каждый звук, который в хорошем тракте поет и восхищает, цепляет за струны души.

Но ряд современных дисков после покупки хочется сразу выкинуть. Например альбом Madonna Handy Candy.

Звук идет ужасно грязный, кашеобразный. Причина легко определяется при проверке на DR динамического диапазона. На диске он равен удручающему значению 5.

Хорошо звучащими дисками можно считать записи имеющие диапазон минимально от 10 и выше.

Диапазон СД-диска от DR 8 и ниже вызывает нехорошие ощущения.

Я предвижу, что многие предложат в виде панацеи прослушивание виниловых дисков, где компрессия маловероятна. Но компрессия маловероятна и на всех оригинальных СД старых выпусков (я встречал DR до 18), а современный винил может быть так же компрессирован. Это первый аргумент, а второй происходит из того, что я замерил значение DR динамического диапазона некоторых виниловых дисков и он оказался не очень высоким. Для разных виниловых дисков значение DR равно 12-14. Но остались серьезные подозрения, что нижняя граница определялась не самым тихим звуком, а рокотом и шумом самой виниловой пластинки из за механического характера считывания данных и тогда, вероятно, реальный DR имеет еще худшее значение.

При этом не так редко можно встретить записи на СД с DR динамического диапазона равным 15. Кроме того на СД-диске существенно лучше выполнено разделение каналов и многие другие показатели.

Из вышесказанного можно сделать вывод, что на качество звучания СД-диска оказывает большое значения интенсивность компрессии звукового диапазона. Надеюсь эта статья поможет вам подойти к отбору дисков по звучанию не только интуитивно, руководствуясь эзотерическими принципами, но и с использованием технического подхода.

Что такое дискретизация

Дискретизация делает дискретным сигнал во времени (в отличие от квантования, которое делает дискретными амплитуды сигналов). Все знают, что такое разрядность аудио и цапов (ацп). Чем выше разрядность аудиоинформации и цапа (ацп), тем выше: качество, лучше динамический диапазон и отношение сигнал\шум.

Мало кто задумывается, что квантование на временной оси или правильнее говорить — дискретизация, так-же вносит свой вклад в динамический диапазон и привносит цифровой шум (об этом мало пишут в сети).

Ошибка дискретизация в этом смысле похожа на ошибку квантования — чем выше частота дискретизации и, таким образом, больше информации для цифрового представления сигнала, тем лучше качество. Чаще всего меломаны ограничиваются лишь информацией о (теоретическом) частотном диапазоне, а зря! =)

Содержание / Contents

Камрад, рассмотри датагорские рекомендации

🌼 Полезные и проверенные железяки, можно брать

Опробовано в лаборатории редакции или читателями.

Конечно, об этом всем можно спорить. Но мне понравился не только теоретический, но и практический инженерный подход к делу, наглядность и доступность изложения его мыслей. Не буду все пересказывать, читайте и смотрите сами, отмечу лишь некоторые мысли.

Вот что Крис Монтгомери пишет о динамическом диапазоне 16-битого звука :
16-битный линейный PCM, имеет динамический диапазон 96 дБ.который рассчитывается как (6*бит) дБ. Многие считают, что 16-бит аудио не может представлять произвольные звуки тише чем -96 дБ. Это неверно. на практике эффективный динамический диапазон 16-битного звука достигает 120 дБ.
16-бит вполне достаточно, чтобы хранить все, что мы можем услышать, и будет хватать всегда.

А вот что он говорит о частотах дискретизации:

Считается, что восприятие звука человеком простирается примерно до 20 кГц. При частоте 44,1 или 48 кГц, фильтрация низких частот перед стадией дискретизации должна быть предельно точной, чтобы избежать удаления слышимых частот ниже 20 кГц, и в то же время не допуская попадания частот выше частоты Найквиста в процесс дискретизации. Этот тяжело реализуемый фильтр и на практике ни один фильтр не достиг идеала полностью.

С другой стороны, если частота дискретизации 96 кГц или 192 кГц, низкочастотный фильтр имеет дополнительно октаву или две в диапазоне модуляции. Такой фильтр намного легче построить. Частоты дискретизации ниже 48 кГц являются на самом деле одним из неприятных компромиссов на аналоговом этапе.

В этом видео еще много всего познавательного, в том числе и о цифровом представлении видео данных. Но больше мне понравилось второе видео, где Крис, используя реальную аппаратуру, объясняет, например, вот что:
цифровой сигнал не является ступенчатым, и вы ни в коем случае не получите ступенек после преобразования цифрового сигнала в аналоговый.

А вот и ответ на мой вопрос, правда не про винил, а про магнитную пленку:
компакт-кассеты. если конечно вы их ещё застали и помните, они могли достигать разрядности в девять бит, при идеальных условиях, однако наиболее распространённым было значение в пять-шесть бит, особенно, если кассета была записана на бытовой деке.
Именно так. Ваши микстейпы обладали разрядностью около шести бит, если вам повезло!
Лучшие профессиональные бобинные плёнки, которые использовались в студиях, едва достигали, угадайте, сколько? 13 бит (!), при условии дополнительного шумопонижения.
Поэтому надпись «DDD» на компакт-диске говорит о его high-end уровне.

В другом месте нашел про виниловые пластинки: «динамический диапазон ограничен шумом носителя, возможностью лака, станка, войной громкости. и составляет. где-то 45 дБ. Ну может быть даже 55 дБ на практике у хороших экземпляров».
Похоже, что старые записи практически никогда не будут доступны в действительно лучшем качестве, чем компакт диск, то есть лучше 16 бит/44,1кГц. Оцифровывать студийные старые плёнки, если они ещё сохранились, в формате 24/192 бесполезно.
Ну разве что старики рока или диско соберутся в студии и заново запишут свои хиты. Те, кто еще живы.

компрессия вредит не всегда - это один из важных процессов обработки, без нее невозможно работать с голосом, некомпрессированный сырец непригоден для прослушивания.

Звучала лучше на чем?
Не нужно ориентироваться на лоуенд технику создавая произведения.
в тексте выше описано почему на низкосортной портативной технике может ощущатся мнимый прирост качества.

Граждане, подумайте, сколько в мире аудиофилов? Десятые доли процента? А бабло как на них заработаешь? Думаю, что никак. iTunes приносит гораздо больше доходов. Вот под него и мастерят. И то же самое катают на CD. Иногда, простите меня за такое кощунство, лучше даже послушать lossless оцифровку с бобины, чем lossless оцифровку с CD, бо последняя бывает редкостной гадостью, хоть и нет шипения лентопротяга. И дело не только в компрессии, а вообще в том, что всем, извините, срать на качество. И тем, кто пишет, и тем кто слушает.

Причем, некоторые из местных аудиофилов сами слушают музыку из смартфонов. Вот под вас и издают. Если бы массе вдруг понадобился хороший звук, то все смартфоны быстренько оснастили бы приличными выделенными ЦАП-ами и неплохими ушными усилителями. Сразу же полезли бы в уши все косяки, и качество записей повысилось бы. Но большинству плевать. Играет и играет.

Когда многим плевать на качество - что происходит:
Хороший звук начинает мтоить баснословно дорого чтобы остаться рентабельным.
еслибы люди возмутились, что хватит кормить нас дерьиом - то так называемая аудиофилия, а на самом делепросто достойное звучание - стали бы доступны по цене.
виноваты в плохом вкусе и низких требованиях к томучто потребляют сами покупатели.
зачем сливочное масло ведь спред дешевле и тд, аналогии понятны. А потом и спред станет дифицитом гурманским в итоге.

Два адепта друг-друга не поняли.

Зато студийная запись может производиться ДЛЯ портативной техники. И сейчас, в большинстве случаев, для нее и производится. Поэтому портативная техника всегда причем.

ну в любом случае исходник сначала делается нормальный, а адаптируется под устройства потом.

раньше был хороший агрегат - Nokia 6300
который делал компрессию звука сам, своими средствами, и из его хиленького динамика было даже слышно какое-то подобие басов)))
звучало это не всегда красиво, но детали звука прослушивались в принципе))

Компрессия нужна только ради громкости и чтобы в зашумленном помещении приподнять звук по громкости выше чем громкость шума помещения.
при прослушивании дома никакой компрессии не нужно- она портит звук, уродует -сужает динамический диапазон. У любого усилителя есть ручка громкости - компрессия вредна. Она нужна только для портативок.
с проф аппаратурой в какой то степени знаком, так как был лидер группы трэш-металичесеой в конце 80х, начале 90х - пультами пользовались, что то сами писали.
сейчас мода в программах компрессировать все что угодно - профаны даже не поримают зачем они это делают.

просто компрессия используется не только на стадии записи звука на носитель, а еще дофига где на этапе обработки.

какой звукач пишет голос без компрессора и лимитера?
ничего же путного не выйдет

Это немного разные каши. Возможно, Infinity имел в виду компрессию при финальном сведении альбома.
Для записи той же электрогитары используется, как минимум, несколько примочек (программных или аппаратных - не важно). Какой соляк без компрессора? Для идеально ровных по громкости нот придётся полжизни заниматься, а примочки решают эту проблему мгновенно. К примеру, есть диапазон наслоения частот бас-гитары и электрогитары, который прибирается лимитером - по сути тот же компрессор, но без криминальных искажений в звуке. Чистый звук очень сух, не зависимо от инструмента и ОЧЕНЬ редко когда применяется в современной (не ортодоксально-классической) музыке. Поэтому и не понятно, о какой компрессии идёт речь.

Про адаптацию для различных устройств слышу впервые

Я с этой ерундой столкнулся, когда послушал свой рингтон))
И мне он не понравился.
Пришлось возиться с частотами. чтобы звучал лучше

После обработки для обычного прослушивания стал непригоден, но на телефоне звучит более-менее

Я сейчас объясню, как я понял, что имел в виду Infinity.

Музыка с высоким средним уровнем громкости всегда кажется более выигрышной в случаях: телевещания, радиовещания, прослушивания в автомобиле, в кинотеатре среди зрителей чавкающих попкорном, на вечеринке, в кабаке, во время занятий спортом, во время перемещения по городу в наушниках с помощью общественного транспорта и пешком, и так далее, список можно продолжать. То есть, в 99% жизненных случаев.

Возьмем гипотетическую аудиозапись такого типа, которая на протяжении большего времени своего звучания что-то негромко и нежно пиликает и только в некоторые моменты в разы (а то и в десятки раз) нарастает по громкости во всю мощь инструментов. Так вот, такая запись будет говено восприниматься во всех вышеперечисленных случаях. И только в берлоге аудиофила, в тишине, на нормальном аудиооборудовании, на приличной акустике, или хороших наушниках она будет звучать во всей своей красе.

Соответственно, записывающие компании душат звукорежиссеров на предмет подъема громкости звучания. Первое, что делается - пиковая нормализация. Это еще хороший вариант. Пики громкости подтягиваются к 0 dBFS (максимум на шкале), при этом практически ничего не меняется, кроме общей громкости, разница между самым тихим и самым громким звуком композиции остается неизменной.

Но в случае нашей гипотетической аудиозаписи, этого может быть мало. Нежное пиликание все равно никто нормально не слышит. Метро шумит, машины ездют, девки пляшут и орут. А крутанув громкость повыше, ничего хорошего мы не добьемся, потому что усилок в нашем плеере (бумбоксе, дешевой автомагнитоле) дрянной. Если же поднять при записи громкость еще выше, срежутся пики и звук на них уйдет в тартарары. Но тут вступает в дело компрессия. Оставив пики на месте (в 0 dBFS) эти черти начинают повышать громкость самого тихого участка, а все, что между ним и самым громким пиком, повышается пропорционально. В результате увеличивается средняя громкость композиции, но разница между самым тихим и самым громким звуком становится меньше. В результате, наше пиликание теперь хорошо слышно, правда оно больше не нежное, но когда я бегу за троллейбусом, мне пофиг его нежность, главное чтобы было слышно.

Впрочем, если компрессировано грамотно, без фанатизма, то с этим можно смириться. Но если график выглядит так, как тот самый ZZ Top 2008 г, где практически один сплошной пик, то по такой записи Shift+Del рыдает горючими слезами.

А насчет собственных компрессоров в портативном аудио, тот же "рокбокс", на божьей коровке - "сансе" позволяет вдоволь поиздеваться над звуком.

Это я описал. Только я считаю, что "нормально" слушать музыку - это как раз именно дома. А бежать за тролейбусом - это не слушать музыку. Для таких вариантов "когда за тролейбусом" достаточно мп3, которую можно коверкать по компрессии как угодно. Но когда композиция с дикой компрессией пишется на СД-диск, то просто ошеломляет тупость звукорежисера. Кому она нужна на компакт диске? Диски в метро не слушают. Слушают плееры или телефоны с мп3 и тд. И получается, что все диски выпускаемые в последнее время слушать невозможно. Сейчас есть "аудиофильские" СД-диски, когда пишут как положено. Например это вариант K2HD. SHM-CD мне не показался таким уж прорывным. Ибо в отличии от victor-овского K2HD с его подходом к записи исходя из манипуляция с конвертацией источника в диапазон до 100 000 гц и тд, в SHM-CD просто очень прозрачная пластмасса, что не мешает на нее поместить запись с зажатой DR. У виктора же, они там мучаются с выжимаением из записи всего что можно, поэтому такой дури, как компрессия DR там можно сказать, что нет.
В плохих звуковых условиях мне достаточно обычных настольных колоноче гениус SP-G10 с мп3, звучат отлично. И в таких условиях я нетребую большего. Но прийдя домой, в желании насладится музыкой, купив диск, я слышу какую то орущую какофонию из за компрессии - вот зачем?
Зачем вообще качественная запись аудио?
Вот представьте вы смотрите фильм. Вам понравилось. А потом вам говорят, что ваш видеомагнитофон проигрывал только каждый 5-й эпизод из фильма. А чтобы посмотреть полностью, надо иметь нормальный видак. Вот с музыкой так же. На говеной записи вы слышите кое как только мелодию - это 10% от того, что сокрыто в записи.

Блин, я кажется понял почему у меня mp3 файл скачанный из инета и ролик в Mp4 выдают звук лучше, чем тот же трек с лицензионного CD. При том, что в последнем случае звучание стало намного хуже и прослушивается то, что было приглушено в оригинале (ударные лупят, аж ушам неприятно), а лёгкое мелодичное звучание как колокольчик практически удалено и непрослушивается. Пипец. Спасибо за инфу.

Бежать за троллейбусом тоже лучше под музыку. А оздоровительные пробежки моя жена, например, осуществляет исключительно в плеере.

Да, в метро диски сейчас не слушают. Слушали в 90-х, на переносных CD плеерах. Но их крутят по радио, они играют в барах, клубах, на вечеринках в квартирах и на работе, на праздниках и торжествах, в переносных бумбоксах, в автомобильных магнитолах и CD чейнджерах, и мало ли еще где. Под это и пишут. Если будут писать для одних аудиофилов - разорятся.

Кроме того, CD - это основной вид коробочной лицензионной аудиопродукции. Всё остальное - фляки, сраки, эмпэтришки, есть производное от CD. Нафига мучиться два раза, когда можно сделать один. Для всех. Ну, кроме аудиофилов.

Рассмотрим такие характеристики как: реальный динамический диапазон для форматов DSD, величину фазового шума и ошибки дискретизации для всех цифровых форматов в общем.

В характеристиках звуковоспроизводящей аппаратуры часто приводят такие характеристики как:

Динамический и частотный диапазон
Отношение сигнал\шум
И т.д.

Но очень многое упускается.

⭐ Лучшие беспроводные наушники 2021:

Что такое дискретизация;
Формат CD и родственные ему форматы Flac – реальный динамический диапазон;
Итог по чистоте записи в формате CD;

Дискретизация во Flac;
Форматы WAVE, с ультравысокой частотой дискретизации;

Дискретизация формата DSD;
DSD с более высокими частотами дискретизации;

Итог, 3 важных вывода и суть статьи;

↑ Что же делать?

1) Искать качественные оригинальные CD или их качественные «рипы», например, в формате FLAC.

2) Слушать музыку через качественные цифро-аналоговые преобразователи (ЦАП/DAC). Например, наш USB audio DAC "Goldsmith", не говоря уже про гораздо более дорогие аппараты. Даже самоделка на PCM2705 даст реальную и вполне ощутимую разницу по сравнению с интегрированной в ноутбук звуковой картой.
Посредственным качеством звука «страдают» многие ноутбуки и мобильные телефоны, да и встроенные в материнскую плату звуковые решения далеко не идеальны.

3) Использовать хорошие наушники или качественную активную акустику.

4) Применять специальные усилители для наушников — далеко не все звуковые карты хорошо работают на низкоомную нагрузку.

Возможно, все это в комплексе позволит по-новому услышать вашу любимую музыку!

Ну, и напоследок, видео для поднятия настроения. И не важно, сколько там бит и килогерц: Tom Jones & Jerry Lee Lewis, Rockin' Medley. 1969 год

Спасибо за внимание!

↑ Ссылки

Уникальная учебная программа "Золотые уши" была разработана для наших инженеров, чтобы они развивали свои навыки экспертов-акустиков. Благодаря их умению оценивать звук мы создаем устройства с превосходным качеством звучания, чтобы раскрыть все нюансы музыкальных произведений.

Формат CD и родственные ему форматы Flac – динамический диапазон

Рассмотрим для начала любимый формат CD и родственные ему форматы Flac. Динамический диапазон рассчитывается очень просто — он равен 6дБ на 1 бит информации, при импульсно кодовой модуляции использующейся в этих форматах. Для компакт диска динамический диапазон таким образом равен 16бит х 6дБ = 96дБ. Соответственно величина ошибки квантования равна величине младшего разряда и для 16бит динамического диапазона цифровой (теоретический) шум квантования составит -96дБ. Мы разобрали квантование по амплитуде и это еще не все характеристики цифрового аудио.

В прошлых своих обзорах я уже рассказывал о проблемах связанных с дискретизацией аудио в компакт диске и его реальном частотном диапазоне. Напомню. Диапазон CD (теоретический) составляет 20Гц-20000Гц.

С нижними частотами все в порядке. Проблемы возникают при оцифровке высоких частот. Дело в том что период максимальной (по теореме Котельникова-Шеннона или известная как «частота Найквиста») частоты 22050Гц, будет записан всего двумя цифрами. Это и есть частота дискретизации которая равна для компакт диска 44100Гц. Если сравнить количество информации доступное для записи максимальной частоты 22050Гц и минимальной для CD частоты в 20Гц, на ум приходит очень важный и простой вывод — различные частоты записываются с разным качеством.

Понятно так же, что если нижняя частота запишется с высоким качеством, то верхние частоты, совершенно логично, запишутся с качеством плохим. Вопрос только в том насколько плохое это качество.

Чтобы посчитать величину шума дискретизации подойдет формула от оценки шума квантования. Предварительно нужно знать величину периода (целое число) искомой частоты и расчитать требуемое количество бит кодирующих фазу частоты. Ниже представлена таблица где приведены частоты с уменьшением на октаву, плюс самая низкая частота (кодируемая, как мы помним с избытком качества), далее следует величина периода, минимальная 2р, здесь и далее указывается число единиц информации кодирующих один период частоты и разрядность в битах необходимая для кодирования одного периода при этой частоте дискретизации (ограничением для количества бит на фазу является как раз частота дискретизации). В конце приводится то что нам нужно — величина (теоретическая) фазового шума (ошибка дискретизации) для определенной частоты:

CD 44100 Hz 16bit

22050 Hz 2p(1b) -6дБ
11025 Hz 4p(2b) -12дБ
5512 Hz 8p(3b) -18дБ
2756 Hz 16p(4b) -24дБ
20 Hz 2205p(11b) -66дБ

Итак, значения шума дискретизации прямо сказать обескураживающие =). Недаром эти характеристики производители аппаратуры не указывают вообще.

Как-то раз, бороздя просторы интернета, я искал ответ на вопрос — каков динамический диапазон виниловой грампластинки и имеет ли смысл их оцифровывать, чтобы получить качество, лучше компакт-диска. А нашел статью о том, что «распространение аудио в формате 24 бит/192 кГц не имеет смысла» и ещё пару весьма интересных видеолекций по теме.

Читайте также: