Форматы сжатия звука
Сейчас существует много форматов сжатия звука, изначально
разрабатывавшихся для компьютера, но впоследствии перекочевавших и в
бытовую технику. Часть из них устарела и практически не используется,
некоторые появились недавно и еще не успели занять свою нишу. Здесь я
остановлюсь лишь на форматах, использующих сжатие с потерями, которые
позволяют добиться наибольшей степени компрессии аудиоданных. Что значит
“сжатие с потерями”? Только то, что после кодирования из .wav файла в
сжатый формат, а потом при перекодировании обратно из сжатого формата в
.wav файл оригинал и итоговый файл будут отличаться. Возможно, не в лучшую
сторону.
Сжатый формат звука подразумевает, что изменений в качестве звука
практически нет, несмотря на уменьшение объема файла в несколько раз.
Каким же образом удается добиться подобного результата? На это отвечает
наука психоакустика. Человеческий мозг устроен так, что мы не замечаем
звука шелеста книг на фоне разговора, хотя на компьютере при внимательном
прослушивании мы можем отследить этот звук. Вот и получается, что вроде бы
он есть, а вроде бы его и нет…
Сочетание обычных методов компрессии данных и знание того, какая
информация воспринимается нашим мозгом, а какая нет, позволяет добиться
степени сжатия музыки до 10 раз при приемлемом качестве звучания. Ниже я
привел краткое описание наиболее распространенных и известных форматов
сжатия музыкальных файлов, которые могли бы быть использованы для создания
домашней музыкальной коллекции.
MP3
MPEG 1 Layer III (реже MPEG 2 Layer III), также иногда именуемый людьми
некомпетентными MPEG 3 (такого формата не существует), уже долгие годы
является для многих пользователей единственной ассоциацией со
словосочетанием “компьютерная музыка”. Разработанный в конце 80-х годов
формат, позволявший сжимать музыку до 10 раз без катастрофических потерь
качества, быстро прижился на домашних компьютерах.
Оптимальный битрейт сжатия – около 192 Кb/s. Хотя у всех уши разные:
кто-то различает искажения лучше, кто-то хуже. Пристойный минимум – 128
Кb/s. Возможно использование переменного битрейта. То есть в тот момент,
когда диапазон звучащих частот невелик, битрейт снижается, а когда звучит
много всего сразу, то, наоборот, повышается. Постоянный битрейт больше 320
Кb/s зачастую оказывается избыточным и приводит к бессмысленной трате
места. Также MP3-файл включает в себя определенную зону-заголовок Id3 тег.
В нем содержится основная информация о файле. Есть 2 разные версии этого
тега. Вторая, соответственно, более обширная, но ничего революционного не
добавлено. Качество звучания MP3-файла может сильно зависеть от выбранных
кодировщика и проигрывателя. Для создания MP3-файлов идеально подходит
бесплатный LAME, а для воспроизведения – одна из последних версий Winamp.
MP3pro
Данный формат был создан вовсе не для того, чтобы “убить” или
“заменить” MP3, позволяя лишь добиться приемлемого качества звучания на
низких битрейтах. Если “классический” битрейт в 128 Кb/s некоторыми
слушателями и воспринимается как дающий качество, близкое к идеальному, то
даже незначительное его понижение вызывает появление большого количества
отчетливо слышимых искажений. Для передачи музыки в Интернете используются
обычно именно низкие битрейты, которые являются далеко не сильной стороной
“обычного” MP3. Здесь MP3pro и проявляет себя с лучшей стороны. Для
хранения музыки высокого качества MP3pro совершенно не годится: даже при
использовании максимально доступного для большинства кодеков битрейта 96
Кb/s слышны искажения, хотя по сравнению с многими другими форматами,
поддерживающими низкие битрейты, результаты работы кодека MP3pro заметно
лучше. При повышении битрейта качество файлов падает по сравнению с
остальными форматами и уже при битрейтах 128 Кb/s разумнее использовать
MP3 или OGG Vorbis.
MPEGplus/Musepack (MP+/MPC/MPP)
Данный кодировщик похож по принципу действия на MPEG Layer II (MP2), но
использует более совершенный алгоритм. В отличие от большинства других
современных кодеков, целью создателей Musepack было вовсе не стремление
получить максимально возможное качество на низких битрейтах. Лучше всего
формат показывает себя на средних и высоких битрейтах (типичный битрейт
файлов обычно находится в диапазоне 160-180 Кb/s). Великолепная
психоакустическая модель, использующая VBR-кодирование, позволяет добиться
прекрасного качества звучания. В итоге кодек показывает результаты более
высокие, чем большинство его соперников на аналогичных битрейтах. Качество
файлов, получаемых при сжатии в MPC, значительно превышает качество
аналогичных файлов MP3. Одним из серьезных недостатков нынешней версии
Musepack является ограничение на формат файла: 44 kHz, 16 bit, стерео, что
делает его неприменимым, например, для сжатия звуковых дорожек к фильмам
на DVD. Если совместимость с MP3 для вас не слишком важна, а качество
итогового файла желательно получить максимально высоким, выбор Musepack
может оказаться идеальным решением. Использование этого формата является
реальной альтернативой использованию сжатия без потерь для кодирования
музыки с компакт-дисков для тех, кто уже разочаровался в возможностях
формата MP3.
AAC
Формат Advanced Audio Coding (расширенное аудиокодирование), также
известный как MPEG2 nbc (not backwards compatible, не обратно
совместимый), является преемником формата MP3. Сочетая в себе алгоритмы
кодирования MPEG2/MPEG4, AAC имеет более широкие, чем MP3, возможности,
например, возможность кодирования нескольких звуковых каналов с частотой
дискретизации до 96 kHz. Более высокое, чем у MP3, соотношение
“качество/размер” делает его весьма привлекательным как для создания
музыкальной коллекции, так и для кодирования многоканальных звуковых
дорожек. Качество звучания файлов, сжатых при помощи AAC, оценивается как
отличное. Тем не менее в использовании AAC есть свои трудности: алгоритмы
кодирования, используемые в данном формате, достаточно сложны, поэтому для
создания AAC-файла требуется значительное количество времени и системных
ресурсов.
TwinVQ (VQF)
VQF (Vector Quantisation Format) является частью спецификации MPEG4.
Как формат сжатия музыки, VQF ныне мертв. Так что же представляло собой
данное детище Yamaha? VQF был форматом сжатия музыки, изначально
ориентированным на использование низких битрейтов. По заявлениям
разработчиков, качество звучания VQF-файла с битрейтом 80 Kb/s близко к
128 Kb/s MP3, а битрейт 96 Kb/s дает более высокие результаты.
Психоакустическая модель VQF существенно отличалась от всех
использовавшихся до этого, позволяя получать более высокое качество, чем
прежде. Несмотря на данные достоинства, практическое использование формата
было несколько затруднено по ряду причин: воспроизведение VQF-файлов
требовало большей мощности процессора, чем MP3; поиск по файлу
осуществлялся медленно, а кодирование одной композиции проходило
достаточно долго. Разница в размере файлов по сравнению с MP3 никак не
могла компенсировать все недостатки формата, а отсутствие поддержки
высоких битрейтов лишь усугубило положение.
WMA
Формат Windows Media Audio был разработан всенародно любимой Microsoft
в качестве очередного “заместителя” MP3. Помимо обычных для разработчиков
обещаний “качество звука, как у MP3, при вдвое меньшем размере файла”,
создатели позаботились о защите данных внутри музыкального файла. На
практике для рядового пользователя это оборачивалось невозможностью
редактировать теги уже готового WMA-файла, а также множеством проблем,
связанных с так называемыми “защищенными” WMA-файлами. Для того чтобы
проиграть защищенный файл, часто требовалось загрузить из Интернета
специальный сертификат, обычно позволявший прослушивать композицию в
течение ограниченного времени, по окончании которого вам нужно было либо
заплатить за использование файла и получить возможность слушать его в
дальнейшем, либо купить компакт-диск с понравившейся композицией. В общем,
Microsoft действует в своем духе. Формат постоянно совершенствуется,
постепенно появляется поддержка более высоких битрейтов. Качество звучания
WMA-файла вполне сравнимо с качеством MP3-файла с тем же битрейтом, иногда
превышая MP3 на низких битрейтах. Немалым плюсом можно считать то, что
кодировщики WMA уже встроены в Windows, а последние версии Windows Media
Player позволяют кодировать компакт-диски сразу же в новый формат. На
своем сайте Microsoft регулярно проводит тестирование новых версий кодека,
противопоставляя им устаревшие или низкокачественные кодировщики MP3. Не
удивительно, что WMA выходит в подобных тестах победителем.
OGG Vorbis
Еще до выхода финальной версии кодировщика не утихал шум вокруг этого
нового формата сжатия музыки. Заявления разработчиков выглядят
заманчивыми: полная открытость формата и его свобода от различных патентов
(в отличие от MP3 и многих других форматов), поддержка широкого диапазона
частот дискретизации (8-48 kHz) и битрейтов (от 16 до 256 Kb/s на канал),
возможность кодирования не только стереосигнала, но и нескольких каналов
аудиоданных, высокое качество звучания и многое другое. Считается, что
битрейта 160-190 Kb/s достаточно для обеспечения звучания, на слух не
отличимого от компакт-диска. Лично у меня никаких нареканий по поводу
качества не возникало за все время использования формата. Информация об
исполнителе, названии композиции и т. д. хранится в Unicode, что позволяет
избежать в тегах проблем с символами, отличными от латиницы, да и сама по
себе организация тегов реализована более грамотно, чем в ID3V2. У
разработчиков поистине наполеоновские планы: сделать OGG единственным
форматом для хранения музыки и передачи ее через Интернет, вытеснив все
остальные “коммерческие” форматы. Не знаю, сумеет ли Vorbis потеснить
позиции MP3, но то, что у него есть для этого весьма веские основания –
несомненно. По качеству звучания OGG-файлы превосходят MP3 на аналогичных
битрейтах, а на низких битрейтах (до 64 Kb/s) способны соревноваться с
MP3pro.
Итог
Оптимальным вариантом для создания домашней коллекции музыки является
MP3. Данный формат наиболее распространен, а наличие большого числа
бесплатных кодировщиков и проигрывателей под большинство современных
операционных систем будет содействовать тому, что он останется лидером по
популярности в ближайшие годы. К тому же подавляющее большинство
аппаратных MP3-проигрывателей поддерживают только этот формат. К
недостаткам MP3 можно отнести низкий коэффициент “качество/размер”. WMA
как закрытый коммерческий стандарт вряд ли сможет вытеснить MP3, тем более
что обычному пользователю возможность работы с тегами и декодирования
файла в WAV (с целью последующей записи на CD-R/CD-RW диск) обычно дороже
защиты музыкального файла и сомнительного выигрыша в размере. На данный
момент единственным аргументом в пользу WMA является наличие аппаратных
проигрывателей, все же остальные “достоинства” формата носят исключительно
рекламный характер. AAC еще не получил достаточного распространения, хотя
имеет немалые перспективы, особенно учитывая поддержку формата со стороны
крупнейших компаний. OGG Vorbis только начал набирать популярность, хотя
уже на данный момент он имеет значительное число поклонников. Этот формат
можно порекомендовать всем, для кого размер итогового файла имеет решающее
значение. Musepack, не слишком популярный, но весьма неплохой формат для
хранения высококачественной музыки, может успешно заменить MP3 любителям
качественного звука, позволяя добиться непревзойденных результатов. На
данный момент Musepack является форматом, позволяющим добиться максимально
высокого качества при использовании сжатия с потерями.
Автор: Василий Михайлов
Источник: www.infocity.kiev.ua
|