Понимание частоты дискретизации, битовой глубины и битрейта
И как это влияет на качество звука.
Неврология??
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
В аудиофильской индустрии существует бесконечный список тем, вызывающих споры. Спорные темы, такие как дорогие кабели и звук высокого разрешения (hi-res), особенно раздражают сообщество.
Определение аудио высокого разрешения гласит, что любой музыкальный файл, записанный с частота дискретизации и разрядность выше чем 44,1 кГц/16 бит считается звуком высокой четкости (HD).
Изображение из Сони
В этой статье мы рассмотрим основы частоты дискретизации и разрядности, а также их влияние на воспринимаемое качество звука.
Мы также коснемся еще одного понятия: битрейт. Битрейт или битрейт обычно используется для описания качества аудиопотока для сервисов потоковой передачи музыки.
Как звук записывается в цифровом виде?
При воспроизведении звука создается волна давления, которая распространяется по воздуху. Если диафрагма записывающего устройства, например микрофона, находится поблизости, волны давления в воздухе создают вибрацию в диафрагме. Благодаря магии преобразователей эта вибрация, в свою очередь, создает электрический сигнал, который постоянно меняется вместе с волнами в воздухе.
Это непрерывное и пропорциональное изменение — то, откуда происходит термин «аналог».
Сигнал, создаваемый диафрагмой, часто сам по себе недостаточно силен. Обычно предварительный усилитель сначала усиливает сигнал, чтобы его можно было записать несколькими способами.
На протяжении всей истории для записи и хранения аналоговых сигналов использовались различные материалы. Сюда входят воск, виниловые диски и магнитные ленты. В конце концов, цифровые записи были введены и стали обычным явлением.
Цифровые системы (единицы и нули) записывают аналоговые сигналы (непрерывно изменяющиеся значения) путем выборка их.
Разница между низкой частотой дискретизации и высокой частотой дискретизации
Захватив достаточно выборок входящего аналогового сигнала и сохранив его в памяти, цифровые записи могут захватить и позже воспроизвести указанный сигнал.
Типичная цифровая аудиозапись содержит до 44 100 отсчетов каждую секунду. Однако нередко можно увидеть 96 000 выборок в секунду для некоторых цифровых аудиоформатов.
Существует несколько типов методов выборки, но Импульсно-кодовая модуляция (ИКМ) является стандартом де-факто.
Что такое импульсно-кодовая модуляция?
PCM служит отраслевым стандартом для хранения аналоговых сигналов в цифровом формате. В потоке PCM амплитуда звука дискретизируется с одинаковым интервалом. PCM не является собственностью, поэтому каждый может использовать его бесплатно!
Однако аудио в формате PCM редко можно найти по двум причинам:
- Размер файла
- Совместимость с воспроизведением
Размер файла
Поскольку PCM не сжат, размер файла записанного звука огромен. Можно сжимать аудиофайлы, используя алгоритмы сжатия с потерями или даже без потерь, чтобы сохранить точность звука при уменьшении размера файла.
Долби и ДТС – это сжатие звука с потерями, которое часто используется для этой цели, поскольку оно способно уменьшить размер аудиофайла PCM на целых 90%.
К сожалению, способ, которым Долби и ДТС кодировать каналы PCM в битовый поток для хранения, а затем декодировать его обратно для воспроизведения не идеально. Полученный звук, хотя и меньше по размеру файла, не всегда такой чистый и четкий, как оригинал, что приводит к снижению точности и качества.
Вот где форматы без потерь, такие как Долби цифровое TrueHD и Мастер аудио DTS-HD войти. Они способны декодировать аудиосигналы PCM точно так, как они были первоначально захвачены.
Совместимость с воспроизведением
К сожалению, популярные операционные системы (ОС) изначально не поддерживают воспроизведение файлов PCM. IBM и Microsoft определили формат Waveform Audio Format (WAV) для ОС Windows, в то время как Apple использовала формат аудиообмена (AIFF) для ОС Macintosh. Оба формата являются просто оболочкой аудиоформата PCM с дополнительной аудиоинформацией, такой как профиль автора, название трека и т. д.
Представительство верности
Верность/качество потока PCM представлены двумя атрибутами:
Эти два атрибута показывают, насколько цифровая запись соответствует исходному аналоговому сигналу.
Что такое частота дискретизации?
Вспомните анимационные фильмы, снятые пару десятков лет назад.
Фильмы представляли собой просто слайды из неподвижных изображений, которые показывались одно за другим, чтобы создать иллюзию движения. Скорость перехода определяла плавность полученной анимации. Чем быстрее переход, тем лучше иллюзия анимации.
Скорость смены слайдов такая же, как частота кадров, когда речь идет о современном видео.
Цифровая звуковая волна подобна снимку исходного звукового сигнала. Чем ближе дискретизированная звуковая волна выглядит как оригинальная звуковая волна, тем выше верность цифровой звуковой волны.
В цифровых аудиозаписях частота дискретизации аналогична частоте кадров в видео. Чем больше звуковых данных (сэмплов) собрано за период времени, тем ближе к исходному аналоговому звуку становятся захваченные данные.
Более высокая частота дискретизации даст вам более точный захват исходного аудиосигнала.
В типичной записи цифрового аудио компакт-диска частота дискретизации составляет 44 100 или 44,1 кГц. Если вам интересно, почему частота такая высокая, когда человеческое ухо может слышать только частоты до 20 кГц в лучшем случае. Это из-за теоремы выборки Найквиста-Шеннона.
Теорема Найквиста
Обычно называемая теоремой Найквиста или частотой Найквиста, она гласит, что для предотвращения потери информации при цифровой выборке сигнала вы должны производить выборку с частотой, по крайней мере, в два раза превышающей максимальную ожидаемую частоту сигнала.
В этом случае использование частоты дискретизации 44 100 выборок в секунду или 44,1 кГц позволяет точно воспроизводить частоты около 22 кГц.
Другими примерами распространенных частот дискретизации являются 8000 Гц для телефонов и от 96 000 до 192 000 Гц для аудиодорожек Blu-ray. Частота дискретизации 384 000 Гц также используется в некоторых особых ситуациях, например, при записи животных, издающих ультразвук.
Что такое битовая глубина?
Компьютер хранит информацию в единицах и нулях. Эти двоичные значения называются биты. Чем выше число битов, тем больше места для хранения информации.
4-битное двоичное число. Время викторины: что представляет приведенный выше двоичный файл?
Когда сигнал дискретизируется, он должен хранить дискретизированную аудиоинформацию в битах. Вот где битовая глубина встает на место. Разрядность определяет, сколько информации может быть сохранено. Выборка с 24-битной глубиной может хранить больше нюансов и, следовательно, является более точной, чем выборка с 16-битной глубиной.
Чтобы быть более точным, давайте посмотрим, какое максимальное количество значений может хранить каждая битовая глубина.
- 16-бит: Мы можем хранить до 65 536 уровни информации
- 24-битный: Мы можем хранить до 16 777 216 уровни информации
Вы можете увидеть огромную разницу в количестве возможных значений между двумя разрядностями.
Динамический диапазон
Другим важным фактором, на который влияет битовая глубина, является динамический диапазон сигнала. 16-битный цифровой звук имеет максимальный динамический диапазон 96 дБ, а 24-битная глубина даст нам максимум 144 дБ.
Аудио CD-качества записывается с глубиной 16 бит, потому что, как правило, мы хотим иметь дело только со звуком, достаточно громким для того, чтобы мы его слышали, но в то же время недостаточно громким, чтобы повредить оборудование или барабанные перепонки.
Разрядности 16 бит при частоте дискретизации 44,1 кГц достаточно для воспроизведения слышимой частоты и динамического диапазона для обычного человека, поэтому он стал стандартным форматом компакт-диска.
Нужно ли всегда записывать в формате 192 кГц/24 бит?
Хотя ограничений на частоту дискретизации и битовую глубину нет, 192 кГц/24 бит является золотым стандартом для аудио высокого разрешения. (Есть производители, которые уже рекламируют возможность 32-битной глубины, э-э-э-э!) Мы будем использовать 192 кГц/24 бита в качестве эталона для вершины точности записи.
Так когда же требуется такая верность?
Мы знаем, что чем выше частота дискретизации и разрядность, тем больше наш цифровой сигнал будет похож на исходный аналоговый сигнал. Но это также дает нам дополнительный запас прочности.
Дополнительный запас
Запас относится к разнице между динамическим диапазоном аудиосигнала и тем, что разрешено битовой глубиной. Это как проехать на грузовике высотой 3 метра по эстакаде с вертикальным просветом 5 метров. Это дает вам 2 метра над головой для работы, на тот случай, если вам нужно буксировать необычно высокий груз.
16-битная выборка дает звукоинженерам динамический диапазон 96 дБ для работы. С другой стороны, 24-битный формат расширяет динамический диапазон до 144 дБ, хотя на самом деле большинство аудиооборудования может достигать только 125 дБ.
Благодаря дополнительному запасу звуковые инженеры могут свести к минимуму, если не устранить, возможность чрезмерного шума или вырезкакогда звуковые волны по существу становятся плоскими и вызывают слышимые искажения.
Отсечение происходило, когда входящий электрический сигнал не мог быть представлен полностью численно. Это может произойти, когда битовая глубина невелика.
Поскольку возможный диапазон сигналов профессионального звукового оборудования намного больше, чем то, что может услышать средний человек, использование 24-битного звука позволяет профессионалам в области звука аккуратно применять тысячи эффектов и операций, связанных с микшированием и мастерингом звука, чтобы подготовить его к воспроизведению и распространению. .
Увеличенный размер файла
Помимо потенциально избыточного запаса, запись с более высокой точностью создает гораздо больший размер файла.
Просто чтобы дать вам представление о разнице в размере файла, давайте попробуем придумать гипотетический сценарий с пятиминутным несжатый песня.
1) Сначала рассчитаем битрейт по формуле частота дискретизации * разрядность * количество каналов.
Предположение: 2-канальный стереозвук
- 44,1 кГц/16 бит: 44 100 х 16 х 2 = 1 411 200 бит в секунду (1,4 Мбит/с)
- 192 кГц/24 бит: 192 000 х 24 х 2 = 9 216 000 бит в секунду (9,2 Мбит/с)
2) Используя рассчитанный битрейт, мы умножьте на длину записи в секундах.
Разделите мегабит (МБ) на 8, чтобы получить мегабайт (МБ)
- 44,1 кГц/16 бит: 1,4 Мбит/с * 300 с = 420 Мбит (52,5 МБ)
- 192 кГц/24 бит: 9,2 МБ/с * 300 с = 2760 МБ (345 МБ)
Аудио, записанное в формате 192 кГц/24 бит, займет В 6,5 раз больше места для файлов чем один с частотой дискретизации 44,1 кГц/16 бит.
Итак, когда вам нужно записывать в формате 192 кГц/24 бит?
Все зависит от того, что вы хотите делать с аудиозаписью. Вы хотите манипулировать записью и у вас есть неограниченная память? Тогда 192 кГц/24 бита не составит труда. Но если вы собираетесь транслировать свою музыку своим слушателям, 192 кГц/24 бит будет поглощать полосу пропускания вашего слушателя и увеличивать его счета за Интернет.
Обеспечивает ли 192 кГц/24 бит превосходное качество прослушивания?
Не совсем.
Крис Монтгомери, профессиональный звукоинженер и основатель Фонд Xiph.Orgдает подробное техническое объяснение того, почему выборка в формате 192 кГц/24 бит не обязательно приводит к превосходному восприятию звука.
Он использует комбинацию обработки сигнала и того, как мы, люди, воспринимаем звук, чтобы помочь объяснить, почему выборка в 192 кГц/24 бита не имеет смысла, а также дать читателям представление о том, как проводить собственные тесты на прослушивание дома, чтобы попробовать и проверить что-то самостоятельно. .
Суть в том, чтобы наслаждаться музыкой, верно? Современная точность воспроизведения непостижимо лучше, чем у уже превосходных аналоговых систем, доступных поколение назад. Является ли логическая крайность чем-то большим, чем просто еще одним первая мировая проблема? Возможно, но меня беспокоят плохие миксы и кодировки; они отвлекают меня от музыки, и я, наверное, не один такой.
Зачем сопротивляться 24/192? Потому что это решение несуществующей проблемы, бизнес-модель, основанная на умышленном невежестве и обмане людей. Чем больше лженаука выходит из-под контроля в мире в целом, тем труднее истине победить правдивость… даже если это небольшой и относительно незначительный пример.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Ты можешь проверить статью Крис.
Наше мнение состоит в том, что закон убывающей отдачи применяется к частоте дискретизации/битовой глубине. Как только вы достигаете определенного порога, незначительное улучшение качества звука становится все меньше и меньше, пока не станет незначительным.
Что такое битрейт?
Битрейт (или битрейт, если хотите) относится к количеству битов, передаваемых или обрабатываемых в секунду, минуту или любую другую единицу времени, используемую в качестве измерения.
Это похоже на частоту дискретизации, но вместо этого измеряется количество битов, а не количество выборок.
Битрейт чаще используется в контексте воспроизведения/потоковой передачи, чем в контексте записи.
Термин «битрейт» используется не только в аудиоиндустрии. Он также распространен в мультимедиа и сетях. Однако в музыке более высокий битрейт обычно ассоциируется с более высоким качеством. Это связано с тем, что каждый бит в аудиофайле фиксирует часть данных, которые мы можем использовать для воспроизведения исходного звука.
По сути, чем больше битов вы можете уместить в единицу времени, тем ближе будет воссоздание исходной непрерывно изменяющейся звуковой волны, и, следовательно, тем точнее будет представление песни.
К сожалению, более высокий битрейт также означает больший размер файла, что является большим запретом, когда возникают проблемы с объемом памяти и пропускной способностью, например, с сервисами потоковой передачи музыки, такими как Apple Music и Spotify.
Музыкальные потоковые сервисы
Из приведенного выше раздела мы видим, что для потоковой передачи несжатой 5-минутной песни, записанной в 44,1 кГц/16 битпотребуется битрейт 1,4 Мбит/с что является значительной пропускной способностью.
Apple Музыка и Спотифай обойти эту проблему пропускной способности, сжимая звук. Конечно, сжатие файлов не проходит без последствий. Для начала Spotify ограничивает битрейт аудиофайлов до 160 кбит/с для пользователей настольных компьютеров и 96 кбит/с для мобильных пользователей. Однако у премиум-подписчиков есть возможность слушать звук со скоростью 320 кбит/с на настольном компьютере. Тем временем, Apple Музыка абоненты «ограничены» битрейтом 256 кбит/с.
Качество потоковой передачи Spotify
Apple Music и Spotify используют формат AAC (Advanced Audio Coding) и формат Ogg Vorbis соответственно для своих служб потоковой передачи звука.
Spotify экспериментировал с потоковой передачей без потерь в 2017 году, но официально она еще не выпущена.
Есть также сервисы потокового аудио для тех, кто предпочитает слушать музыку с более высоким битрейтом.
Оба ПРИЛИВ и Кобуз Возвышенный+ широко считаются услугами потоковой передачи звука для тех, кто предпочитает лучшее качество потоковой передачи звука, с опциями Hi-FI, доступными при ежемесячной подписке в размере 19,99 долларов США.
TIDAL поддерживает файлы FLAC 44,1 кГц/16 бит, которые можно передавать со скоростью 1411 кбит/с.
Таблица качества звука Tidal
Из этих двух подписка TIDAL Hi-Fi предлагает лучшее соотношение цены и качества. Это потому, что вы получаете доступ к огромной библиотеке высококачественных файлов FLAC, а также к 50 000 песен мастер-качества, сжатых с использованием проприетарного Подтвержденное мастер-качество (MQA) Технология улучшения качества звука.
Гарантирует ли высокий битрейт превосходное качество прослушивания?
Учитывая наш предыдущий пример, типичная пятиминутная песня 44,1 кГц/16 бит имела бы несжатый размер файла более 50 мегабайт.
Кодек MP3 был разработан для решения этой проблемы, позволяя сжимать звук с качеством CD без потери качества. Ранние кодеры MP3 начинали со 128 или 192 кбит/с, а затем перешли на 320 кбит/с, чтобы конкурировать с другими кодеками. Однако в потоковом аудио используются Ogg Vorbis (Spotify) и AAC (Apple Music).
Это открытый источник, находящийся в общественном достоянии, и он обеспечивает высокое качество по сравнению с пропускной способностью, необходимой для его потоковой передачи. Мы опробовали несколько различных форматов файлов и провели еще одну съемку пару лет назад, и формат Ogg Vorbis оказался лучшим.
Неизвестность формата не так важна, поскольку пользователи никогда не видят сами файлы, поэтому, если по какой-то причине стал известен другой формат, обеспечивающий более высокую рентабельность инвестиций, перейти на этот новый формат несложно — бывший вице-президент Spotify.
Возвращаясь к объяснению Криса Монтгомери, мы теперь знаем, что все, что выше 192 кбит/с на приличном кодировщике, на самом деле не имеет значения — среднее человеческое ухо просто недостаточно точное, чтобы заметить разницу.
Это означает, что любая музыка с битрейтом 192 кбит/с или выше становится неотличимой от исходного аудиоаналога, если она правильно закодирована в аудиофайл Ogg, MP3, AAC или FLAC.
Конечно, это не означает, что высокий битрейт бесполезен. Это помогает гарантировать превосходное качество прослушивания. Однако это применимо только в определенных ситуациях. Например, если у вас есть полноценная аудиосистема Hi-Fi, которая может воспользоваться небольшими улучшениями качества звука при потоковой передаче аудиофайлов Hi-Fi.
В целом, случайный слушатель, использующий обычные наушники, не выиграет от потоковой передачи звука со скоростью выше 192 кбит/с.
Заключение
Таким образом, частота дискретизации — это количество аудиосэмплов, записанных в единицу времени, а битовая глубина измеряет, насколько точно были закодированы сэмплы. Наконец, битрейт — это количество битов, записываемых в единицу времени.
Теперь это было не так сложно, не так ли?
Надеемся, что с помощью нашего руководства мы помогли прояснить некоторые загадки, связанные с частотой дискретизации, битовой глубиной и битрейтом.
Забегая вперед, теперь вы должны быть в состоянии критически мыслить, когда кто-то говорит вам, насколько «чище» звучит аудиофайл в зависимости от процесса его кодирования. Что еще более важно, теперь вам должно быть легче находить соответствующие аудиоформаты и потоковые сервисы, отвечающие вашим слуховым потребностям.