WebSound.ru Home
    Главная | Комментарии | Архив выпусков | Форум и чат | AudioTag.info | Музоблог | reTracked | Авторский блог  



  Поиск:

Поиск по WebSound.Ru:
Поиск в Интернете:
Powered by




  Партнеры, реклама:




Audio watermarking
TrustedAudio.com



 

Экспресс-тестирование кодеков (часть 1):
Windows Media Audio (.WMA), MPEG-1 Layer III (.MP3, Lame Encoder) и Ogg Vorbis (.OGG)

Автор: Александр Радзишевский (Alex Y. Radzishevsky)
Copyright (C) 2000, Alex Y. Radzishevsky
дата создания документа: 20.Sep.2000

Все права в отношении данного документа принадлежат автору. Воспроизведение данного текста или его части разрешается только с письменного разрешения автора.

Современная тенденция развития различных алгоритмов компрессии аудио информации сбивает с толку как любителей, так и профессионалов. Кодеки растут как грибы и чем пользоваться уже не знает никто. MP3 по старинке используется повсеместно не смотря на существование гораздо более качественных алгоритмов. Данное тестирование не будет детальным, оно лишь продемонстрирует практические результаты использования некоторых современных кодеков, а именно: Windows Media Audio (.WMA) WMA, MPEG-1 Layer III (.MP3, Lame Encoder) и Ogg Vorbis (.OGG). Я остановился на выборе именно этих кодеков по одной очень важной причине: все они бесплатны для конечного пользователя и, значит, имеют очень хорошие перспективы развития и распространения. В тестировании не участвует такая очень важная ветвь кодеков, как MPEG-2 AAC (Advanced Audio Coding) по причине разрозненности и несовместимости разновидностей этого алгоритма между собой. На сегодня существуют следующие разновидности MPEG-2 AAC: Homeboy AAC, AT&T a2b AAC, Liquifier AAC, Astrid/Quartex AAC и Mayah AAC. Единственным лидером среди всех перечисленных является Liquifier AAC (.LQT), однако ПО для него не бесплатно, распространение тем более и кроме того, фирма-изготовитель недавно пошла на уступки перед Microsoft, сдав тем самым позиции WMA. По этой причине Liquifier AAC в тестировании не участвовал.

Итак, тестируемые кодеки: WMA, MP3, Ogg Vorbis.

Метод тестирования: кодирование оригинального .WAV-фрагмента каждым из кодеком, обратное декодирование в .WAV и сравнение результирующих АЧХ оригинального и полученного .WAV-файлов. Так как Ogg Vorbis кодирует только на VBR и не позволяет явным образом указать битрейт, подбор параметров кодирования для всех кодеков осуществлялся таким образом, чтобы сжатые файлы были приблизительно одного размера.

Использованные енкодеры: OggEnc v0.4 (Ogg Vorbis), Windows Media Audio V7 (в комплекте Windows Media Encoder), Lame Encoder v3.86.

Фрагменты, взятые для тестирования: первый фрагмент (tst1.wav, 7056 Kb, PCM WAV 44.1 KHz, 16 bit, stereo) имеет продолжительность 40 секунд, спектральный состав с преимущественно средними частотами; второй фрагмент (tst2.wav, 7079 Kb, PCM WAV 44.1 KHz, 16 bit, stereo) 40 секунд, насыщенный спектр на всех частотах, третий фрагмент (tst3.wav, 10058 Kb, PCM WAV 44.1 KHz, 16 bit, stereo), продолжительность 1 минута,  очень насыщенный спектр, особенно на высоких частотах (Jean Michel Jarre, Oxygene VII)

Примечания: CBR - Consatnt Bitrate (постоянный скорость бит-потока), VBR - Variable Bitrate (переменная скорость бит-потока).


Тест 1 

Исходный файл tst1.wav (40 sec, 7056 Kb, PCM WAV 44.1 KHz, 16 bit, stereo)
Результат и параметры кодирования в MP3 OGG WMA
битрейт VBR 112-160 Kbps Mode 2 (VBR около 128 Kbps) CBR 128 Kbps
размер файла 669 Kb 661 Kb 651 Kb
размер декодированного .WAV 7064 Kb 7056 Kb (точное совпадение с оригиналом) 7061 Kb

Результирующая АЧХ для левого канала:



Тест 2 

Исходный файл tst2.wav (40 sec, 7079 Kb, PCM WAV 44.1 KHz, 16 bit, stereo)
Результат и параметры кодирования в MP3 OGG WMA

битрейт

VBR 112-160 Kbps Mode 2 (VBR около 128 Kbps) CBR 128 Kbps
размер файла 721 Kb 725 Kb 651 Kb
размер декодированного .WAV 7091 Kb 7079 Kb (точное совпадение с оригиналом) 7086 Kb

Результирующая АЧХ для левого канала:



Тест 3 

Исходный файл tst3.wav (1 min, 10058 Kb, PCM WAV 44.1 KHz, 16 bit, stereo)
Результат и параметры кодирования в MP3 OGG WMA
битрейт CBR 128 Kbps Mode 2 (VBR около 128 Kbps) CBR 128 Kbps
размер файла 960 Kb 984 Kb 986 Kb
размер декодированного .WAV 10058 Kb (точное совпадение с оригиналом) 10058 Kb (точное совпадение с оригиналом) 10058 Kb (точное совпадение с оригиналом)

Результирующая АЧХ для левого канала (полностью):

Результирующая АЧХ для левого канала (увеличенная):



Тест 4 

Исходный файл tst1.wav (40 sec, 7056 Kb, PCM WAV 44.1 KHz, 16 bit, stereo)
Результат и параметры кодирования в MP3 OGG WMA
битрейт VBR 160-192 Kbps Mode 3 (VBR около 160 Kbps) CBR 160 Kbps
размер файла 800 Kb 817 Kb 813 Kb
размер декодированного .WAV 7064 Kb 7056 Kb (точное совпадение с оригиналом) 7061 Kb

Результирующая АЧХ для левого канала:



Тест 5 

Исходный файл tst3.wav (1 min, 10058 Kb, PCM WAV 44.1 KHz, 16 bit, stereo)
Результат и параметры кодирования в MP3 OGG WMA
битрейт VBR 128-192 Kbps Mode 3 (VBR около 160 Kbps) CBR 160 Kbps
размер файла 1317 Kb 1241 Kb 1231 Kb
размер декодированного .WAV 1059 Kb 1058 Kb (точное совпадение с оригиналом) 1058 Kb

Результирующая АЧХ для левого канала:

Результирующая АЧХ для левого канала (увеличенная): 

 

Остановимся на этом и сделаем краткие выводы. Однако сначала одно замечание. Важно отметить, что использованный в данном обзоре метод тестирования (сравнение результирующих графиков АЧХ) не может сделать нас абсолютно уверенными в точности полученных результатов и сделанных на их основе выводов. В действительности случается, что два сигнала с почти идеально совпадающими результирующими АЧХ звучат заметно отлично друг от друга даже на слух. Такой феномен может быть объяснен, в частности, использованием в различных кодеках "хитрых" психоакустических моделей, использование которых приводит к тому, что общая частотная картина после сжатия сигнала не изменяется, однако звучание сжатого сигнала может резко отличаться от оригинала. Однако, именно этот метод тестирования был выбран потому, что остальные методы не столь наглядны и дают не более точные результаты.

Во-первых, WMA показывает наилучшие результаты даже на самом низком протестированном битрейте (Microsoft надо отдать должное), хотя и обрезает сигнал на 20 Khz. Да и вообще, WMA, честно сказать, меня просто поразил (приятно). Ogg Vorbis не менее сильный конкурент так как хотя он и отстает от WMA совсем немного, но имеет при этом более гибкий механизм кодирования (поддержка всех без исключения битрейтов в диапазоне от 8 до 512 Kbps, заявленная поддержка кодирования более 2 каналов), а также не обрезает сигнал на 20 Khz даже на самом низком битрейте. MP3 же в исполнении Lame Encoder доживает похоже последние деньки на моем компьютере - по всем проведенным мною тестам MP3 хуже остальных протестированных кодеков. Остальные выводы предоставлю делать вам, графики более чем красноречивы, но не забывайте - ничто не может быть более точным аргументом, как собственные уши! ;-)

 

Если у вас есть замечания, предложения или дополнения, присылайте их на e-mail.