СОЛО на клавиатуре

В каком формате лучше слушать музыку. Три кита lossy

http://lifehacker.ru/
08.03.2015

Разобраться в цифровых аудиоформатах совсем не просто. Сделать однозначный вывод, в каком именно формате лучше слушать музыку, и того сложнее. Если посмотреть сравнительную таблицу аудиоформатов в «Википедии», в глазах начнёт рябить от столбиков молчаливых цифр. Попробуем разобраться, что за этим стоит.

Cразу оговоримся, что статья говорит ТОЛЬКО об общих характеристиках и не будет включать в себя некоторые подробности. В будущем Лайфхакер проведёт собственное беспристрастное исследование. А сегодня попробуем обобщить уже так или иначе известный опыт.

Есть аналог и цифра.

Аналог — хорошо, но недолговечно и неудобно. Поэтому аналоговые носители, несмотря на высокие продажи винила, не вернутся.

Аудиоцифра может быть трёх основных типов:

  • в формате, не использующем сжатие;
  • в формате, использующем сжатие без потерь (lossless);
  • в формате, использующем сжатие с потерями (lossy).

На первый взгляд, более перспективны форматы, использующие сжатие без потерь. Это не всегда так, о чём мы подробнее расскажем в одном из следующих материалов. Форматы без сжатия не имеют какого-либо смысла, кроме хранения мастер-записей, необходимых при создании аудиоконтента. Они легче поддаются восстановлению. Для хранения и прослушивания домашних записей излишни.

Из множества параметров цифрового аудио пользователя в первую очередь должны волновать частота дискретизации (точность оцифровки аналогового сигнала по времени), разрядность (точность оцифровки по амплитуде — громкости), битрейт (количество содержащейся в файле информации в пересчёте на секунду).

Сегодня поговорим о lossy.

Для сжатого звука очень важно понятие психоакустической модели — представления учёных и инженеров о том, как человек воспринимает звук. Ухо воспринимает весь спектр поступающих на него акустических волн. Однако обрабатывает сигналы мозг.

Справочная величина слышимого человеком диапазона составляет от 16 Гц до 20 кГц, но одновременно слышать и осознавать все поступающие звуки он не способен.

Слух дискретен, и его звуковая восприимчивость нелинейна.

Современные психоакустические модели достаточно точно оценивают человеческий слух и постоянно улучшаются. На деле, несмотря на заверения любителей музыки, музыкантов и аудиофилов, для среднестатистического нетренированного слуха первоначальный вид MP3 в максимальном качестве стал предельно воспринимаемым. Исключения есть, их не может не быть. Но они не всегда легко заметны при слепом прослушивании.

Форматы, использующие психоакустические модели сжатия

Таких форматов для сжатия аудио с потерями довольно много. Наиболее распространены сегодня следующие.

OGG (Vorbis)

Вообще, файл с расширением *.ogg является «контейнером»: внутри могут находиться несколько звуковых записей с собственными тегами и характеристиками. Чаще всего хранимые в нём файлы сжимаются кодеком Ogg Vorbis, хотя могут использоваться и другие, в том числе MP3 или FLAC.

В качестве его основных преимуществ стоит назвать большой диапазон возможных параметров при кодировании: частота дискретизации звука может достигать 192 кГц, разрядность — 32 бит. По умолчанию OGG использует переменный битрейт (хотя при отображении свойств это не указывается), который может достигать 1 000 кбит/с.

MP3

В отличие от свободного OGG, MP3 разработан очень важным для современной акустики Обществом Фраунгофера — объединением институтов прикладных исследований Германии. В среде аудиофилов, кстати, это крайне уважаемая контора, правда, признаваться они в этом не любят. Но за их разработками пристально следят.

В отличие от OGG, может обладать как переменным (VBR), так и постоянным битрейтом (CBR). Кстати, именно благодаря MP3 обнаружилось, что не всякая запись может быть качественно кодирована с переменным битрейтом (причины смотрите выше, алгоритмы кодирования и их результаты в данном случае могут быть различны при кодировании одного и того же источника).

Ввиду преклонного возраста MP3 имеет значительные ограничения: разрядность может быть 16—24 бита, частота дискретизации выражается только в дискретных значениях (8, 11,025, 12, 16, 22,05, 24, 32, 44,1, 48), битрейт ограничен 320 кбит/с. К тому же в обычной версии MP3 число каналов ограничено двумя.

AAC

Те же грабли, только в профиль. Тоже разработка Общества Фраунгофера. Более поздняя и использует другую психоакустическую модель, более современную. Общедоступная информация позволяет сделать вывод: да, им удалось улучшить собственное творение.

Даже если опираться на самые простые цифры, AAC — более гибкий формат. Разрядность файлов, полученных при помощи этой разработки, составляет от 16 до 24, частота дискретизации тоже при желании позволит не потерять звуковой картины и лежит в диапазоне 8—192 кГц. Поток данных вообще приближается к таковым у lossless-форматов (до 512 кбит/с), при том что максимальное число каналов AAC-файлов достигает 48.

Какой формат стоит назвать однозначно лучшим

Если учесть, что AAC — переосмысленный спустя десяток лет MP3, то выбор в его пользу. При желании имеет смысл сравнивать только MP3 и OGG. Давайте посмотрим на картинки, сделанные уважаемым Андреем Аспидовым с ixbt.com:

На графиках — хороший AudioCD, сжатый OGG с переменным битрейтом 350 кбит/с и MP3 с использованием Lame. Чем ниже располагается график, тем ближе звучание к оригиналу. Получается очень интересная картина. Несмотря на то, что MP3 обладает явно срезанными высокими частотами, в отличие от OGG, в котором видно завал ниже 2 кГц.

Частотно-временное распределение звука говорит о не менее интересных вещах. При постоянном битрейте 320 кбит/с MP3 почти совпадает с оригинальной записью. Кажется, теперь всё встаёт на свои места. Но... На самом деле всё ещё больше запутывается.

Зачем вообще пользоваться lossy, когда есть доступный lossless

Здравый смысл.

Дело в том, что большая часть аналоговых записей не содержит того количества информации, которое необходимо было бы хранить в высококачественных форматах. Не стоит забывать, что родной частотой дискретизации для CD является 44,1 кГц, квантование — всего 16 бит.

Предыдущие графики неплохо демонстрируют высокую точность передачи MP3. А ведь для аудиокассеты, магнитной ленты (если, конечно, это не мастер-тейп) характеристики AudioCD недостижимы. Да и для массового студийного оборудования возможность записи аналогового звука, соответствующего AudioCD, появилась относительно недавно. Нет никакого смысла оцифровывать во FLAC (и тем более в WAV) концертную запись или пластинку из доцифровой эпохи, в особенности сделанные с магнитных носителей. Они не содержат тех спектров и того количества информации, которые могут хранить контейнеры без сжатия.

Что изменилось сегодня

Редкий звукорежиссёр делает цифровую мастер-запись (с которой затем производится размножение на физические носители), используя современные технологии на полную катушку. Поэтому шанс того, что 24-битный трек на самом деле всего лишь 16-битный, крайне высок.

Аналоговую высококачественную запись на высококачественном оборудовании сегодня встретить ещё сложнее — если только у фанатов подобного звучания. Таким, например, является Джек Уайт, экс-лидер группы White Stripes. При этом часть его записей относится к вариациям lo-fi, и искать там запредельные звуковые характеристики дорожки становится своеобразным удовольствием для гурманов.

Если представить себе идеальный исходник, то только тренированный слух или прослушивание на качественном аудиооборудовании позволит найти сжатый файл. И уже опираясь на это (и не забывая про восприятие), стоит сделать следующий вывод:

Необходимым и достаточным для среднеценового оборудования является AAC, в отсутствие которого (и при отсутствии исходников, которые можно кодировать в AAC) — MP3 с постоянным битрейтом 320 кбит/с, созданный при помощи кодека Lame 3.93 (рекомендуемые ключи при декодировании: —cbr -b320 -q0 -k -m s).

Исключение составляют записи, изначально полученные в высоком качестве, скажем, записанные на DVD-Audio, SACD, или записи, изначально собранные в DSD (или аналогичном формате) с высоким битрейтом.

Хотя кое-какие особенности у lossless есть. И о них мы расскажем в следующий раз.

Автор не любит Apple. Автор очень ценит достижения «фраунгоферов» и был предельно удивлён, узнав, что AAC — их работа. :)


← назадоглавлениедалее →

Оставить комментарий


Ваш комментарий будет опубликован после модерации.


Rambler's Top100
ErgoSolo
© 1997— «ЭргоСОЛО»
Дизайн: Алексей Викторович Андреев
Вебмастер: Евгений Алексеевич Никитин
Пишите нам:
Звоните нам по тел. +7 (495) 995-82-95. Мы работаем круглосуточно. Прямо сейчас на все Ваши вопросы готова ответить наша служба поддержки:
Круглосуточная трансляция из офиса «ЭргоСОЛО»

Поможем бросить курить
Все права на материалы, находящиеся на сайте ergosolo.ru, охраняются в соответствии с законодательством РФ, в том числе, об авторском праве и смежных правах.
Использование материалов сайта без разрешения ООО "ЭргоСоло" ЗАПРЕЩЕНО!
return_links(); ?>