Глубокое погружение в кривые Хармана – длинный путь (часть 1)

Мы представляем концепцию этой серии Harman Curve из трех частей, объясняем локализацию человеческого звука и ее связь с частотной характеристикой.

Это первая статья из серии из трех частей, целью которой является рассмотрение кривой Хармана в контексте последней части любопытной традиции, которая в значительной степени существовала на периферии аудиофилии.

Наушники — лучшие динамики, чем динамики; динамики делают наушники лучше, чем наушники.

Это не дзэнская загадка, а наиболее лаконичный и провокационный способ подытожить два параллельных направления аудиоисследований, которые незаметно продолжаются уже около полувека.

Более того, обе эти нити обещают научно обоснованные улучшения как тонального, так и пространственного воспроизведения звука. Оба утверждения, по-видимому, не могут быть одновременно правильными. Насколько нам известно, это самая первая серия статей, предназначенная для непрофессионала, чтобы выявить, объяснить и согласовать это.

Понимание предпосылок и вех этой любопытной исследовательской традиции важно, потому что она дает мощную линзу для понимания ее самого известного продукта последнего времени: кривой Хармана.

Быстрые ссылки
Нажмите и перейдите в раздел

Краткое изложение того, как сериал разделен

Часть 1 <- Вы здесь

В первой части этой серии сначала будут объяснены фундаментальные общие принципы человеческого слуха, из которых вытекают все эти подходы.

Часть 2

Во второй части рассматриваются различные технологии, которые были разработаны в ответ на эти идеи как для громкоговорителей, так и для динамиков. Отслеживание происхождения кривой Хармана помогает прояснить ее относительное положение в этом технологическом ландшафте.

Таким образом, мы можем сравнить кривые Хармана (поскольку несколько вариантов были разработаны и усовершенствованы для разных приложений) как с альтернативными кривыми прослушивания, так и с методами обработки в третьей части.

Охваченные кривые включают высоко абстрактные диффузный и свободное поле кривые и более нишевые производные от Sonarworks, Waves NX, Etymotic, Siegfried Linkwitz и David Griesinger.

Мы поговорим о сравнении с альтернативными методами обработки воспроизведения, включая:

  • подавление перекрестных помех
  • синтез связанной с головой передаточной функции (HRTF)
  • перекрестная подача

Часть 3

Эта третья часть также позволит нам различить, что осталось за пределами целевой кривой Harman для наушников и внутриканальных мониторов (каждый из которых имеет свои собственные соответствующие кривые).

Используя популярную фразу, уравнивание калибровочной кривой может граничить с убывающей отдачей.

Выбор корректирующей обработки сильно зависит от:

  • методы записи и мастеринга (такие как размещение микрофона и панорамирование),
  • тип используемых наушников
  • анатомия личности.

Кроме того, длины волн высоких частот, участвующих в синтезе и коррекции HRTF, очень малы.

Это влечет за собой значительную чувствительность к изменениям положения наушников при каждом ношении и даже в течение одного и того же сеанса прослушивания, поскольку положение немного меняется. Это сложная и динамичная проблема. Любые дальнейшие улучшения неудобны, поскольку дают неопределенную отдачу.

Скорее всего, потребуется гораздо большая прозрачность со стороны студий и звукорежиссеров в отношении их выбора, а также кропотливые эксперименты со слушателями. Надеемся, что больше знаний об этих проблемах усилит давление потребителей на производителей, чтобы решить эти проблемы и масштабировать свои решения для улучшения качества прослушивания, особенно в наушниках.

Что такое кривая Хармана?

Существует несколько вариантов целевых кривых Harman, в первую очередь из-за различий в предпочтениях слушателей (в пределах ограниченного диапазона), а также из-за различий между различными форматами (например, объемный звук по сравнению с ушным монитором).  (От: Харман)Существует несколько вариантов целевых кривых Harman, в первую очередь из-за различий в предпочтениях слушателей (в пределах ограниченного диапазона), а также из-за различий между различными форматами (например, объемный звук по сравнению с ушным монитором). (От: Харман)

Назван в честь производителя аудиооборудования, Харманс которым были связаны большинство его основных исследователей, кривая попала в центр внимания в 2013 году, после того, как (теперь на пенсии) гуру наушников Тилля Герцена из InnerFidelity опубликовано обширная тематическая статья обобщение основных статей, опубликованных по данной теме.

Кривая Хармана, по сути, представляет собой целевую частотную характеристику того, что пара «хороших» наушников должна демонстрировать при измерении с помощью специального оборудования.

На самом деле кривая представляет собой тщательный баланс между индивидуализацией и определенной концепцией массовой привлекательности, основанной на тех же психоакустических принципах, которые лежат в основе обоих направлений исследований. Но как был достигнут этот баланс, почему он был достигнут, что он ставит под угрозу и с чем он сочетается?

Чтобы ответить на эти вопросы, нужно взглянуть на кривые Хармана — длинный (но полезный) путь. Он дополняет замечательные статьи, в которых объясняется, что такое кривые Хармана — грубое приближение приемлемой в целом тональности, игнорирующее точную индивидуализацию пространственного звука и точную тональность (которые являются взаимосвязанными проблемами).

Описание локализации звука в организме человека

Первым шагом к пониманию кривых Хармана является понимание взаимосвязи между частотной характеристикой (для чего служат кривые Хармана) и локализацией человеческого звука.

Rtings и Википедия углубиться в тему более подробно, хотя и доступно, как это страница Университетом Саутгемптона.

По теме: Как мы слышим? Объяснение механизма человеческого слуха

Для простоты, вот резюме. Есть четыре типа сигналов, которые преобладают в направленной локализации:

  1. передаточная функция, связанная с головой (HRTF)
  2. межушная разница во времени (ITD)
  3. межушная разность фаз (IPD)
  4. межушная разница уровней (ILD)

Каждое ухо имеет свой HRTF

У каждого уха есть собственная передаточная функция головы (HRTF): изменения частотной характеристики внешних источников звука, в которые в совокупности вносят вклад наши плечи, туловище, голова и уши (как внешняя ушная раковина, так и внутренний канал), когда звук от источника в свободном поле отражается от них.

HRTF изменяется при изменении направления

HRTF изменяется при изменении направления. Мы сопоставляем эти изменения с определенным направлением в нашем мозгу, когда измененный звук попадает в наши барабанные перепонки. Мы адаптировались к этим изменениям.

Интерауральные сигналы (между двумя ушами) помогают сигналам HRTF. Поскольку два уха разделены головой, существует разница во времени, которую достигает звук, из-за разного расстояния от источника, усугубляемого тем, что звук «обертывается» вокруг головы по-разному в зависимости от частот, возбуждаемых источником. звук. Отсюда и разница в уровне громкости.

ILD становится более преобладающим, чем ITD на частоте 1 кГц и выше

Точка компромисса между какие сигналы становятся преобладающими, в настоящее время оценивается примерно в 1 кГц, при этом сигналы ITD становятся менее последовательными и точными при размещении на высоких частотах. Это связано с соответствующей длиной волны около 17-18 см на частоте 1 кГц, что приблизительно соответствует диаметру головы человека.

По мере того, как частота становится выше, а длина волны уменьшается относительно головы, они менее способны «оборачиваться» вокруг нее, что приводит к значительной разнице уровней. Таким образом, ILD становится более преобладающим сигналом выше 1 кГц, в то время как ITD в меньшей степени из-за его относительной нестабильности. По сути, мы триангулируем звук по различиям в громкости, фазе и синхронизации между каждым ухом.

Широкие функции HRTF могут предсказывать грубые тренды

Несмотря на очевидные различия в морфологии головы, есть некоторые общие особенности HRTF, которые позволяют нам определить грубые тенденции. Эта концепция имеет решающее значение для кривой Хармана.

Например, резонанс слухового прохода высокого уровня постоянно появляется около 3 кГцхотя точная центральная частота, интенсивность и добротность (технический термин для «резкости» или «узости» резонанса) и форма резонанса могут различаться. Это одна из наиболее характерных особенностей HRTF..

Точность в частотной области является необходимым, но недостаточным компонентом пространственного слуха.

Тональность и пространство связаны, но не синонимичны. Несмотря на это, предпосылкой точного пространственного воспроизведения является индивидуализация частотной характеристики, чтобы компенсировать индивидуальные различия в изменениях, вызванных HRTF, когда звук попадает на барабанную перепонку.

Что произойдет, если HRTF не соответствует?

Что субъективно влечет за собой несоответствие HRTF? Аудиофильский лейбл Чески отчеты выпустил чрезвычайно хорошо принятый бинауральный альбом певица и автор песен Эмбер Рубарт («Сеансы с 17й Сторожить”). Одна из песен была «Полнолуние в Париже».

Этот автор слышал восхваляемую пространственность записи как массу нечетких звуков, которые то входили, то исчезали с поверхности его головы. Несмотря на то, что запись была сделана с использованием бинаурального манекена, который должен генерировать правдоподобные интерауральные сигналы, звук ощущался как размытый ореол, прилипший к его черепу.

Тем не менее, фронтальная, внешняя локализация с наушниками сильно отставала, даже с высокопроизводительными наушниками Stax.

Этот комплект наушников Stax был использован автором для проверки результатов аудиофильских записей Chesky Records.  (От: Стакс)Этот комплект наушников Stax был использован автором для проверки результатов аудиофильских записей Chesky Records. (От: Стакс)

Бывший главный научный сотрудник Harman (не имеет отношения к исследовательским проектам кривой Хармана), а теперь независимый исследователь, Дэвид Гризингерпредлагает это объяснение:

Бинауральные демонстрации часто эффективны, особенно со звуками сбоку или сзади головы. Сигналы азимута, полученные из временной задержки между двумя ушами и затенения головы головы, эффективны, даже если тембр совершенно неправильный. Когда источник звука быстро перемещается, мозг склонен игнорировать неправильные сигналы высоты, если они противоречат ожидаемой траектории.

Если визуальный сигнал присутствует одновременно, он почти всегда будет доминировать над слуховым сигналом. При хорошем зрелище и наличии субъекта, который хочет быть убежденным, эти демонстрации могут быть весьма убедительными. Но при скептическом прослушивании фронтальная локализация стационарных источников достигается редко.

Тем не менее, даже объяснение Гризингера казалось слишком снисходительным для того, что испытал этот автор. Вероятно, это связано с тем, что этот автор был выходцем из Восточной Азии, и его морфология достаточно отличалась от HRTF. расходиться еще значительнее чем пользовались кавказские слушатели из HRTF муляжа головы.

Это стандартный тренажер головы и туловища, специализированное оборудование, предназначенное для достижения Это стандартный симулятор головы и туловища, специализированное оборудование, предназначенное для достижения «тех же акустических свойств, что и у среднего человека, включая отличительные черты лица», согласно GRAS, ведущему поставщику этого оборудования. Голова может поставляться отдельно от туловища. (От: ГРАС)

Это означало, что фронтальная экстернализация звука не была достигнута, не говоря уже о точном фронтальном позиционировании источников звука. К счастью, была проделана работа по придумать стандартизированную манекен-голову это больше напоминает общие тенденции в морфологии головы жителей Восточной Азии, что, как мы надеемся, несколько сократит разрыв.

Китайские исследователи определили четкое подмножество черт лица и структуры для выходцев из Восточной Азии, особенно китайского происхождения.  Это BHead210, получившийся макет головы.  Он явно отличается от GRAS, изображенного выше.  (От: Лин Тан, Чжун-Хуа Фу и Лэй Се)Китайские исследователи определили четкое подмножество черт лица и структуры для выходцев из Восточной Азии, особенно китайского происхождения. Это BHead210, получившийся макет головы. Он явно отличается от GRAS, изображенного выше. (От: Лин Тан, Чжун-Хуа Фу и Лэй Се)

Как Sennheiser добивается знаменитой «звуковой сцены»

Наклонные драйверы наушников Sennheiser HD800 и его варианта S обеспечивают более реалистичный HRTF, который напоминает звук, исходящий спереди.  Он также обеспечивает основу для коррекции HRTF и других корректирующих методов, поскольку неугловые драйверы создают HRTF, который нельзя быстро исправить.  (От: Sennheiser)Наклонные драйверы наушников Sennheiser HD800 и его варианта S обеспечивают более реалистичный HRTF, который напоминает звук, исходящий спереди. Он также обеспечивает основу для коррекции HRTF и других корректирующих методов, поскольку драйверы, не расположенные под углом, генерируют HRTF, который нельзя быстро исправить. (От: Sennheiser)

Дизайн наушников также может частично решить эту проблему. Sennheiser HD800(S) является ведущим представителем этого подхода. Большая часть его знаменитой «звуковой сцены» может быть приписана расположенным под углом драйверам. Наклон драйверов приводит к созданию приблизительной HRTF, которая больше напоминает фронтальную HRTF, а не боковую HRTF, перпендикулярную ушам, генерируемую нескорректированным воспроизведением в наушниках.

На этом графике показано, как HRTF изменяется от 30 градусов (под углом, как стереодинамик) до 90 градусов (перпендикулярно, как наушники).  (От: Intechopen.com)На этом графике показано, как HRTF изменяется от 30 градусов (под углом, как стереодинамик) до 90 градусов (перпендикулярно, как наушники). (От: Intechopen.com)

Насколько там отличается HRTF? Графики выше, от отличного глава в открытом доступе на эту тему являются иллюстративными. Это HRTF стандартного отраслевого симулятора головы и туловища, КЕМАР.

Самая верхняя кривая представляет собой измеренную HRTF для правого уха от источника, расположенного так, как если бы он был правым каналом стереодинамика (а также то, что измерено для левого уха от такого источника).

Вторая снизу кривая — это то, что было измерено для правого уха от источника, перпендикулярного ему (например, ненаклонного динамика наушников). Выемка в HRTF для перпендикулярного источника намного шире и глубже, охватывая от 8 до 10 кГц и около 20 дБ.

Измерение под углом 30 градусов, которое отражает то, как будет восприниматься громкоговоритель или драйвер наушников, расположенные под таким углом, имеет гораздо более узкую метку (от 8 до 9 кГц). Несмотря на то, что выемка примерно такая же глубокая, общий тренд кривой намного более плавный, чем в случае с перпендикуляром.

По словам Гризингера, его эксперименты также показали, что наушники, в которых отсутствуют угловые драйверы (таким образом, создается перпендикулярная HRTF), генерируют неестественный звук и делают дальнейшую коррекцию невозможной. Это связано с тем, что перпендикулярный источник звука особым образом взаимодействует с ухом, давая ответ HRTF, который является более слышимым (как показано выше), но все же «невозможно сравнять счет».

Прорези в частотных характеристиках, как правило, невозможно выровнять, потому что они вызваны множественными звуковыми сигналами, подавляющими друг друга. Повышение выемки просто повышает оба сигналы, которые компенсируют друг друга. Хотя HRTF под другими углами будут отличаться, фронтальные углы явно имеют гораздо менее заметную выемку.

Несмотря на это, из-за относительно неестественного «освещения» всей ушной раковины излучаемым волновым фронтом (и, следовательно, низкой точности HRTF, которые генерировали бы естественный фронтальный звуковой ландшафт), воспроизведение в наушниках (особенно стереозаписей, но даже для бинауральных) по своей природе скомпрометировано.

Это то, что RTing Измерения PRTF мера – полное, равномерное освещение области ушной раковины, как если бы оно исходило от источника в свободном поле. Даже HD800(S) далека от совершенства по сравнению с колонками. Волновой фронт динамиков в свободном поле обеспечивает полное освещение ушных раковин (площадь, по которой распространяются ушные раковины, мала по сравнению с площадью, по которой излучение динамиков практически однородно).

Еще один более сложный способ частичного преодоления несоответствия HRTF — использование динамических сигналов. изменение несовпадающего HRTF с движением головы (отслеживая голову слушателя с помощью технологий отслеживания движения, таких как Kinect). Однако коренная проблема тональной неточности относительно ушей испытуемого все еще сохраняется.

Подводить итоги:

«Если система звуковоспроизведения может генерировать такое же звуковое давление на барабанные перепонки слушателя, какое было бы создано там реальным источником звука, то слушатель не должен быть в состоянии определить разницу между виртуальным изображением и реальным источником звука». – источник

Заключение

Этот базовый обзор сложного явления, которым является человеческий слух, позволяет нам понять, как технология сформулировала корректирующие методы, которые устраняют избыточные искажения, возникающие между нашими ушами и записью. Во второй части мы расскажем об этих разработанных корректирующих технологиях, как популярных, так и малоизвестных.

Закрепите это изображение, чтобы сохранить эту статью

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *