MP3: лавинообразные искажения
Начинаем с самого популярного формата. МР3 — чудовище из института Фраунгофера, которое захватило Землю. Из-за него сегодня никому не приходит в голову использовать чистый WAV для записи звуков. Даже если выдирают изуродованное аудио из YouTube, то все равно крошат его еще раз в МР3, да еще и с похабным битрейтом 128 кб/с. Мы так делать не будем, и для теста используем самую актуальную на сегодня версию кодера LAME 3.100 с пресетом insane и битрейтом 320 кб/с.
На самом первом рисунке было видно, что спектр в МР3 ожидаемо испытывает колебания в области ВЧ и окончательно отфильтровывается на границе 20 кГц. Разумеется, это предел синтетического теста, на реальном музыкальном сигнале она наверняка окажется еще ниже. Размеры динамического диапазона в МР3-файле не изменились по сравнению с оригиналом. Т.е. кодер LAME 3.100 на битрейте 320 кб/с не добавляет в запись никаких собственных шумов.
Искажения формы сигнала 1 кГц при кодировании в МР3 в сравнении с оригиналом WAV
Конвертация в МР3 одиночного сигнала 1 кГц показала появление множества мелких гармонических искажений. И хотя формально их доля невелика (0,0009%) — т.е. раза в полтора-два меньше, чем на выхлопе у хорошего ЦАПа, — в динамичном спектре реальной фонограммы их число будет расти в лавинообразном и непредсказуемом порядке. Также «утолщение» основания узкого в оригинале пика 1 кГц указывает на определенные проблемы, обрастание паразитными колебаниями. Эту особенность наглядно иллюстрирует «квадратная» 100 Гц волна после ее конвертации в МР3. Как видите, по горизонтальной оси ее контур теряет четкость. Все это в конечном итоге отрицательно сказывается на утомляемости слуха при прослушивании МР3, увы, даже самых максимальных битрейтов.
«Квадратная» волна 100 Гц после конвертации в МР3 (вверху) и AAC (внизу)
Битрейт аудио
Аудиофайлы со сжатием с потерями можно кодировать с разными уровнями качества. Качество этого формата файла определяется битрейтом или количеством данных, кодируемых за секунду. При более низких настройках битрейта сжатые файлы будут намного меньше, но могут звучать хуже.
В прошлом это было необходимо, поскольку носители информации имели ограниченную емкость, а сети не могли легко передавать большие файлы. Но в современном цифровом мире объем памяти и пропускная способность не так важны. Вот почему файл большего размера с более высоким битрейтом почти всегда лучший выбор, когда вам нужно использовать формат с потерями.
Стандарт высокого качества для сжатия MP3 – 320 кбит / с. При таких настройках очень сложно отличить сжатый звук от несжатого в обычных тестах прослушивания .
Аудиофайлы без потерь и с потерями
Разница между ними связана со сжатием данных. Сжатие данных означает, что файлы занимают меньше места на жестком диске. Это не то же самое, что сжатие динамического диапазона, используемое в производстве музыки.
Некоторые методы сжатия данных уменьшают размер файла, но при этом сохраняют 100% информации в необработанном аудиопотоке. Эти форматы известны как сжатые без потерь. Другие типы сжатия работают, удаляя данные в аудио, которые не оказывают большого влияния на звук. При использовании этого метода некоторая информация удаляется, поэтому они известны как форматы со сжатием с потерями .
Наиболее редкие
.RAW – необработанный файл может содержать аудио в любом формате, но обычно используется с аудиоданными PCM. Он используется редко, за исключением технических испытаний.
.SLN – утвержденный линейный формат PCM, используемый Asterisk. До версии v.10, стандартными типами аудио были 16-битные Signed Linea.
.Vox- чаще всего использует кодек Dialogic ADPCM (Adaptive Differential Pulse Code Modulation). Подобно другим форматам ADPCM, он сжимает данные до 4 бит. Файлы формата Vox подобны волновым файлам, за исключением того, что они не содержат информации о самом файле, поэтому форматы воспроизведения аудио могут отличаться. Для этого понадобится сначала указать частоту дискретизации кодека и количество каналов.
Несжатые аудио форматы
Несжатый звук — это именно то, на что он похож: настоящие звуковые волны, которые были захвачены и преобразованы в цифровой формат без какой-либо дальнейшей обработки. В результате несжатые аудиофайлы, как правило, являются наиболее точными, но занимают МНОГО дискового пространства — около 34 МБ в минуту для 24-битного стерео 96 кГц.
PCM
PCM расшифровывается как Pulse-Code Modulation, цифровое представление необработанных аналоговых аудиосигналов. Аналоговые звуки существуют в виде сигналов, и чтобы преобразовать сигнал в цифровые биты, звук должен быть дискретизирован и записан через определенные интервалы (или импульсы).
Таким образом, этот цифровой аудиоформат имеет «частоту дискретизации» (как часто делается выборка) и «битовую глубину» (сколько битов используется для представления каждой выборки). Сжатия нет. Цифровая запись является почти точным представлением аналогового звука.
PCM — самый распространенный аудиоформат, используемый на CD и DVD. Существует подтип PCM, называемый линейной импульсной кодовой модуляцией, где выборки берутся через линейные интервалы. LPCM является наиболее распространенной формой PCM, поэтому на данном этапе два термина почти взаимозаменяемы.
WAV
WAV расшифровывается как Waveform Audio File Format (также называемый Audio for Windows в некоторый момент, но не больше). Это стандарт, разработанный Microsoft и IBM еще в 1991 году.
Многие люди предполагают, что все файлы WAV являются несжатыми аудиофайлами, но это не совсем так. WAV на самом деле просто контейнер Windows для аудио форматов. Это означает, что файл WAV может содержать сжатый звук, но он редко используется для этого.
Большинство файлов WAV содержат несжатый звук в формате PCM. Файл WAV является просто оболочкой для кодировки PCM, что делает его более подходящим для использования в системах Windows. Однако системы Mac обычно могут открывать файлы WAV без каких-либо проблем.
AIFF
AIFF расшифровывается как Audio Interchange File Format. Подобно тому, как Microsoft и IBM разработали WAV для Windows, AIFF — это формат, разработанный Apple для систем Mac еще в 1988 году.
Также как и файлы WAV, файлы AIFF могут содержать несколько видов аудио. Например, есть сжатая версия под названием AIFF-C и другая версия, называемая Apple Loops, которая используется GarageBand и Logic Audio — и все они используют одно и то же расширение AIFF.
Большинство файлов AIFF содержат несжатый звук в формате PCM. Файл AIFF является просто оболочкой для кодировки PCM, что делает его более подходящим для использования в системах Mac. Однако системы Windows обычно могут открывать файлы AIFF без каких-либо проблем.
MIDI
Как ни странно, MIDI тоже можно отнести к тому, что принято называть «аудио-форматы». Хоть и принято считать (а многие, собственно, так и думают до сих пор), что система MIDI это всего лишь набор команд, с этим можно поспорить. Расшифровка аббревиатуры MIDI — это Собственно, это система записи и редактирования неких нажатия клавиш, высоты тона, темпа, тональности, эффектов и т. д.
Тем не менее существуют файлы с расширением.mid или.midi, которые совершенно просто воспроизводятся в современных секвенсорах или студийных программах звукозаписи, используя стандартный набор звуков формата GM (General MIDI), GS (что то же самое) от компании Roland или XG (Extended MIDI) от корпорации Yamaha. В первых двух наборах присутствует 128 стандартных звуков, не считая эффектов, в третьем — почти втрое больше.
Так что вы должны использовать?
Теперь, когда вы понимаете разницу между каждым форматом, что вы должны использовать для копирования или загрузки музыки? В общем, мы рекомендуем использовать MP3 или AAC. Они совместимы почти с каждым проигрывателем, и оба они неотличимы от исходного, если закодированы с высоким битрейтом. Если у вас нет особых потребностей, которые предполагают иное, MP3 и AAC — это лучший выбор.
Однако есть кое-что, что можно сказать о том, чтобы хранить свою музыку в формате без потерь, таком как FLAC. В то время как вы, вероятно, не заметите более высокого качества, lossless отлично подходит для хранения музыки, если вы планируете впоследствии ее преобразовывать в другие форматы, поскольку преобразование формата с потерями в другой формат с потерями (например, AAC в MP3) приведет к появлению файлов заметно более низкое качество. Поэтому для архивных целей мы рекомендуем FLAC. Однако вы можете использовать любой формат без потерь, так как вы можете конвертировать между форматами без потерь, не изменяя качество файла.
Также мы рекомендуем хранить музыку в формате FLAC или ALAC если вы используете высококлассное аудио оборудование, которое способно показать вам артефакты форматов хранения музыки с сжатием.
Первый формат аудио в компьютерных играх
Самое первое упоминание о компьютерном звуке пошло от создания примитивных на тот момент игр, в которых саунд воспроизводился посредством системного динамика. Но как ни старались разработчики такого ПО (программного обеспечения), нужного качества, совместимого с бобинными или кассетными магнитофонами или пластинок, добиться так и не удалось.
Цифровая музыка в высоком разрешении уже давно существует. Почему кажется, что сейчас он становится модным? Помимо тяги у них могут быть такие устройства, как один, ответ на рынке. Преступнику этого исчезновения не нужно искать его очень далеко. За исключением особых случаев, большинству пользователей более чем достаточно, чтобы их смартфон прослушивал музыку. Даже игроки, которые поселились, как они видят, уменьшают местность, которые они пробивают из года в год.
Именно поэтому многие производители занялись поиском решения, как поменять формат аудио, чтобы звук был натуральным. Откровенно говоря, это и привело к дальнейшей конкуренции, которую мы имеем сейчас. Это касается не только воспроизводимого материала, но также и студийного звука, «живых» выступлений, качества или настройки основных параметров с точки зрения знаний физики, акустики и т. д.
Мы приходим к миллионному вопросу. Это требует чувствительного уха и определенного образования. Если вы высокопоставленный энтузиаст, вы, вероятно, сначала узнаете разницу, но для обычных смертных, которые просто слушают музыку с помощью фонового метра, вероятно, слишком сложно заплатить разницу цен только для того, чтобы иметь такое качество.
Речь идет не только о музыкальном проигрывателе. Те, кто соответствует этому оборудованию, не дешевы. В довершение всего, есть музыка, которая продается в форматах высокой четкости, что также немного дороже. Наконец, это технический раздел
Между самими аудиоспециалистами нет даже единого мнения относительно того, делают ли эти устройства такое важное различие. По крайней мере, на бумаге кажется, что музыка высокой четкости лучше слышится, но за этим стоит сильный маркетинговый компонент
Готовы ли мы платить за то, чтобы смотреть на публику как любителей музыки?
Несжатые аудиоформаты
Существуют и другие форматы аудиофайлов, в которых не используется сжатие данных. Это так называемые несжатые аудиоформаты. Эти типы файлов действуют как контейнер для необработанных аудиоданных, никоим образом не уменьшая их размер или качество.
Это самые большие файлы для работы, но они обеспечивают высочайший уровень детализации аудиоинформации. Несжатые аудиофайлы – это тип, наиболее часто используемый для записи и микширования музыки в DAW.
Даже в этом случае несжатые аудиофайлы также бывают разных уровней качества. Они основаны на точности и точности, с которой аналоговый аудиосигнал был преобразован в цифровой. Чем выше частота дискретизации и битовая глубина, тем больше информации захватывается в процессе преобразования.
Битовая глубина представляет собой точность аналого-цифрового преобразователя для измерения амплитуды или уровня громкости сигнала. Вы можете думать об этом как о количестве делений на линейке – чем ближе они расположены, тем реже измерение будет попадать между двумя отметками.
Частота дискретизации означает количество измерений, выполняемых за секунду. Более высокая частота дискретизации означает выполнение большего количества индивидуальных измерений.
Вот список распространенных уровней качества для несжатого звука:
Что выбрать
Выбирая наиболее подходящий для себя вариант звучания, нужно определиться с целями использования. Для того, чтобы просто слушать музыку, просто смотреть фильмы, используя при этом непрофессиональное оборудование будет достаточно MP3 качества, тем более с использованием обычной техники звук хоть и теряет качество, но для простого обывателя это практически незаметно. Именно этот аудиоформат чаще всего можно встретить в интернет пространстве – за счет своего легкого веса его легко скачивать, им легко делиться с друзьями в сети.
Если человеку необходимо скачать себе музыку в дорогу, то на помощь опять придет этот формат, потому что он позволит скачать множество различных композиций и при этом они не займут слишком много места на устройстве.Но, если вы решите послушать, например, музыку в MP3 формате с использованием профессиональной звуковой системы, то вас будет ждать разочарование. Не зря этот формат использует алгоритм сжатия с потерями.
Основная же область использования WAV – сфера услуг по профессиональной обработки аудиозвука. Кинематограф, студийная музыка, индустрия видеоигр – вот где чаще всего можно встретить звук в медиаформате WAV. Но за свое качество звучания этот вариант обработки цифрового звука полюбили ценители качественного звучания, поэтому иногда можно встретить медиафайлы в WAV формате и в обычной жизни – например, при использовании хороших музыкальных колонок или просмотра фильма на домашнем кинотеатре. Ведь и среди обывателей встречаются люди с тонким музыкальным чутьем, способные на слух определить в каком качестве воспроизводится музыка.
Сжатый аудиоформат с потерями
Это позволяет еще больше уменьшить размер файла, удалив часть аудиоинформации и упростив данные. Это, конечно же, приводит к тому, что качество аудио-форматов становится значительно хуже. При этом используются различные методы (чаще путем использования психоакустики), чтобы удалить части звука, которые наименее влияют на воспринимаемое качество, и минимизировать количество слышимого шума, добавленного во время процесса сжатия. Популярный MP3-формат, пожалуй, выступает самым известным примером. Кроме того, AAC, который можно найти в iTunesMusicStore, также широко распространен. Большинство форматов предлагают разный диапазон степеней сжатия, обычно измеряемый в битовой скорости. Чем ниже скорость, тем меньше файл, и тем значительнее потеря качества.
WAV
Следует начать с WAV (WAVE) – это сокращение от английского слова Waveform. Это разновидность файла-контейнера, созданная компаниями IBM и Microsoft для хранения оцифрованной записи звука. WAV является подвидом RIFF (Resource Interchange File Format) – файла-контейнера для хранения потоковых мультимедиа-данных.
Суть формата WAV заключается в том, что звук хранится в несжатом варианте, а учитывая то, что форматов для записи и хранения несжатого аудио, который может воспроизводиться практически на любом устройстве без специальных программ нет, то WAV в сфере профессионального звуковоспроизводства стоит в выигрышной позиции. Что стоит уяснить и запомнить об этом виде хранения, так это то, что звуковой сигнал представлен максимально качественно. Но за это преимущество приходится расплачиваться размером медиафайла, ведь для хранения подобного звука нужно много свободной памяти.
Что такое форматы аудиофайлов?
Форматы аудиофайлов – это цифровые стандарты для хранения аудиоинформации. Необработанные данные в потоке звука от аналого-цифрового преобразователя в вашем аудиоинтерфейсе кодируются с использованием метода, называемого PCM или импульсной кодовой модуляцией. Аудио PCM необходимо организовать в файл, чтобы вы могли работать с ним или воспроизводить его в системе.
В разных форматах аудиофайлов используются разные контейнеры и разные методы сжатия данных для организации потока PCM. В зависимости от того, что вы выберете, каждый формат представляет одну и ту же информацию в разных размерах хранилища или разных уровнях качества. В дополнение к этому, некоторые форматы аудиофайлов несут метаданные, которые предоставляют информацию о файле или его содержимом.
Формат OGG
Музыка в формате аудио.ogg тоже встречается достаточно часто. Этот стандарт был разработан компанией Vorbis. Однако стоит заметить, что он имеет ряд существенных недостатков. Во-первых, это неоправданная нагрузка на системные ресурсы компьютера, несмотря на минимальный размер. Во-вторых, использование собственных кодеков и декодеров, которые система автоматически может и не устанавливать. К примеру, при работе в программе FL Studio Producer Edition (или XXL) в версиях ниже 9.x.x имелась папка с установочным файлом в формате.inf, который нужно было активировать для инсталляции после установки основного приложения вручную (иначе пресеты в таком формате просто не проигрывались).
Тем не менее сейчас аудио-форматы такого типа встречаются, а сам звук выглядит очень неплохим.
Форматы хранения звука с сжатием: MP3, AAC, OGG и другие
битрейт
- MP3: MPEG Audio Layer III, или MP3, является наиболее распространенным форматом хранения звука с потерями. Настолько, что он стал синонимом загружаемой музыки. MP3 — не самый эффективный формат из всех, но, безусловно, наиболее хорошо поддерживаемый, что делает его лучшим выбором для хранения аудио с сжатием.
- AAC: Advanced Audio Coding, также известный как AAC, похож на MP3, хотя он немного эффективнее. Это означает, что вы можете иметь файлы, занимающие меньше места, но с тем же качеством звука, что и MP3. Лучшим евангелистом этого формата сегодня является iTunes от Apple, сделавший AAC настолько популярным, что он стал почти так же широко известен, как MP3. За очень долгое время у меня было только одно устройство, которое не могло играть AAC, и это было несколько лет назад, так что вы можете смело использовать этот формат для хранения своей музыки.
- Ogg Vorbis: формат Vorbis, известный как Ogg Vorbis из-за использования контейнера Ogg, является бесплатной альтернативой MP3 и AAC. Его главная черта состоит в том, что он не ограничен патентами, но на вас, как на конечного пользователя, это совершенно не влияет. Фактически, несмотря на его открытость и сходное качество, он гораздо менее популярен, чем MP3 и AAC, это значит, что меньшее количество программ его поддерживают. Таким образом, мы не рекомендуем его использовать, чтобы избежать проблем с совместимостью программного обеспечения.
- WMA: Windows Media Audio — собственный фирменный формат Microsoft, похожий на MP3 или AAC. Он не дает никаких преимуществ перед другими форматами, и также не очень хорошо поддерживается за пределами платформы Windows. Мы не рекомендуем вам копировать компакт-диски в этот формат, если только вы не будете точно знать, что всю музыку будут слушать на платформе Windows, или на совместимых с этим форматом проигрывателях.
Рекомендации по аудиофайлам
Ниже приведены рекомендации для звуковых дорожек на YouTube. Здесь описаны рекомендации по форматированию, обеспечивающие самое высокое качество звука в загруженных пользователями видео
Обратите внимание, что звуковая дорожка воспроизводится на YouTube только в том случае, если вы добавили ее в программу Звукозамены. Обычно рекомендуется добавлять аудиодорожку в самом высоком качестве
Поддерживаемые форматы файлов:
- MP3 в контейнере MP3/WAV
- PCM в контейнере WAV
- AAC в контейнере MOV
- FLAC
- Минимальный битрейт аудио для форматов с потерями: 64 Кбит/с
- Минимальная длительность звука: 33 секунды (исключая тишину и фоновый шум)
- Максимальная длительность: нет
Разновидности аудиоформатов
Следует выделить несколько основных форматов музыки и аудиоформатов:
- Аудиоформаты без сжатия – такие как PCM, WAVE, AIF (AIFF).
- Аудиоформаты со сжатием без потерь – к примеру, FLAC, ALAC (.m4a), Windows Mediа Audio Lossless (WMA без потерь).
- Аудиоформаты с использованием сжатия с потерями качества – например, MP3, AAC, OGG, Windows Media Audio Lossy (сжатые WMA).
Показатель сжатия рассчитывается, как соотношение размера до сжатия к размеру после, помноженное на 100%. Следовательно, чем меньше величина, тем качественнее звук.
Форматы аудио файлов без сжатия, предназначены для работы на высокопрофессиональном оборудовании высокого качества. С дешевого планшета или смартфона невозможно прослушать звук высокого качества, программное обеспечение и динамики не смогут воспроизвести его. А если и воспроизведут, то пользователь не услышит качественного звучания.
Специальные профессиональные аудиоусилители смогут воспроизвести записи MP3, но будет слышен скрежет и шум, что тоже является бесполезным.
Итоговое сравнение
Попробуем сделать некое сравнение между используемыми форматами (хотя это еще далеко не все, что есть в мире звука).
Итак! Формат WAV хоть и «тяжеловесен», все равно может использоваться в качестве промежуточных файлов при последующем конвертировании в некоторых аудиореакторах. Форматы аудио-файлов такого типа чаще всего присутствуют при сохранении открытых проектов или при записи живых инструментов в студии. Понятно, что секвенсор потом обработает входящую информацию в виде звукового потока. А потом поменять формат аудио-файла или сохранить его в виде пресета или дорожки можно будет как угодно.
Форматы типа аудиодисков сегодня тоже неактуальны. Если взять в расчет AIFF или OGG, их лучше использовать в виртуальных студиях. О формате AMR вообще говорить не приходится. MIDI пригодится только музыкантам, знающим в этом толк.
Как считается, сегодня лучший аудио-формат — это все-таки FLAC. По мнению многих специалистов и музыкантов, он является не просто самым «продвинутым», но и даже революционным по сравнению с тем, что существовало или существует на сегодняшний день.
Однако стоит отметить, что и MP3 со счетов сбрасывать нельзя, ведь практически весь кодированный звук на тех же DVD-дисках или в MKV-файлах имеет именно этот формат. Разница только в версии кодека и декодера. Но и индустрия звука и видео в своем развитии на месте не стоит. Весьма вероятно, что мы скоро увидим и еще что-то новое.