Русский
Русский
English
Статистика
Реклама

Работа со звуком

Музыка фоном помогают ли сконцентрироваться Моцарт, белый шум и тяжелый рок?

11.01.2021 12:12:41 | Автор: admin

За время пандемии работы у разработчиков Учи.ру только прибавилось: по данным SimilarWeb за апрель, платформа стала вторым по популярности образовательным сайтом в мире. А вот сконцентрироваться на ней из дома получается с переменным успехом. Мы проверили на себе самые разные лайфхаки и хотим поделиться результатами. Сегодня разбираемся с одним из самых многообещающих способов музыкой.

Наверное, у каждого разработчика есть свой набор музыки на все случаи жизни: для учебы, спорта, работы. Причем для горящих дедлайнов выбираем что-то пожестче, для рутинных задач ритмичное, но без акцентов. Для домашних дел сгодятся подкасты, для обеда выпуск блогера на YouTube, под игру можно включить белый шум стрима на Twitch. Но мало у кого есть готовый плейлист, чтобы сосредоточиться.

При опросе коллег мнения разделились: примерно по 40% из них для лучшей концентрации выбирают тишину и любимую музыку. Еще у 15% есть специальные плейлисты или приложения именно на тот случай, когда необходима максимальная сфокусированность. Еще 4% и 3% соответственно слушают белый шум и звуки природы.

Интерес к влиянию музыки на концентрацию породил огромное количество исследований, мифов и коммерческих проектов. Миллионы людей ищут способ борьбы с прокрастинацией в аудио. Одно лишь приложение Endel, которое обещает генерировать звуки для концентрации внимания пользователя, скачали в общей сложности более 2 млн раз. А YouTube-канал ChilledCow с самыми популярными стримами лоу-фай хип-хопа насчитывает уже больше 7 млн подписчиков.

Главный миф музыкальной терапии

Одна из самых популярных спекулятивных теорий в области использования музыки для повышения результатов умственной деятельности так называемый эффект Моцарта. Утверждают, что музыка Моцарта жизнерадостная и позитивная помогает решать задачи и учиться.

Судя по всему, это мнение породило исследование, опубликованное в журнале Nature, в котором ученые анализировали влияние музыки разного темпа и тональности на состояние обучающихся. Проблема в том, что участникам эксперимента давали слушать одну и ту же сонату Моцарта в более быстром или более медленном темпе, в миноре или мажоре. Результаты показали, что быстрая и жизнерадостная музыка лучше способствует решению пространственных задач. Ну а выбор был: Моцарт или Моцарт. Так что победил Моцарт. Возможно, музыка великого композитора действительно позитивно влияет на состояние и помогает настроиться, однако метаанализ с говорящим названием Эффект Моцарта эффект Шмоцарта полностью опровергает красивую теорию. Скорее всего, это просто влияние позитивной мажорной музыки. Например, к таким выводам пришли организаторы исследования 2017 года.

Приятный джаз или тяжелый рок?

Исследователи изучали влияние на продуктивность не только произведений великого австрийского композитора. Так какую же музыку выбрать? Есть ли универсальные рецепты?

Для начала стоит сузить круг поисков и рассматривать только приятные мелодии. Непривлекательная музыка, прослушанная до работы, снижает производительность. Некоторые эксперты предлагают слушать саундтреки из видеоигр. Ведь эти композиции составляют специально, чтобы помочь человеку сосредоточиться и погрузиться в процесс.

Тяжелая музыка помогает сбросить напряжение и настроиться на высокий темп работы. Австралийские исследователи провели эксперимент, в котором людям включали панк-рок, скрим и метал и задавали раздражающие вопросы. Во время прослушивания музыки испытуемые успокаивались быстрее. Уверены, что многие присоединятся к популярному мнению, что жесткий активный блэк-метал помогает разогнаться и сделать работу быстрее.

Такие разные виды музыки, как техно, классика и бразильский поп, могут оказывать похожий эффект. Дело в различимой речи: она способствует рассеянности внимания, а ее отсутствие может стать одним из критериев при выборе фона для продуктивного дня (конечно, если вы не знаете португальский язык).

Шум: проблема или решение

Музыка не единственный звуковой допинг для борцов с прокрастинацией. Так называемый белый шум тоже пользуется популярностью. Например, этой весной сайт генератора офисного шума получил сотни тысяч просмотров. Его создатель, бельгийский инженер-исследователь, признался, что не ожидал такого внимания к проекту, запущенному в шутку.

На некоторых белый шум действительно оказывает позитивное влияние. Например, одно из исследований показало, что фоновый шум в 60 дБ улучшил концентрацию у экстравертов. В другом эксперименте ученым удалось выяснить, что белый шум помогает сосредоточиться невнимательным детям, которые часто отвлекаются.

Однако эти исследования показывают и обратную сторону шума. Он снижает показатели интровертов в сравнении с работой в тишине и отвлекает внимательных детей.

Громкий продолжительный шум наносит вред организму этот факт давно изучен и подтвержден опытами. Длительное воздействие шума негативно воздействует на вегетативную и центральную нервные системы: ухудшает психическое состояние и повышает тревожность. С громким шумом на фоне мы устаем быстрее на 1525%, чем обычно. По данным Роспотребнадзора, уровень шума не должен превышать 68 дБ. Для сравнения: в жилых домах мы слышим примерно 40 дБ, в офисах, в которые вернемся нескоро, 5565 дБ. Поэтому так тяжело работать удаленно родителям младенцев: плач ребенка звучит на уровне 7682 дБ.

Выход из этой ситуации хорошие наушники. Правильно подобранные шумоподавляющие наушники могут обеспечить защиту от негативного влияния извне, которое мешает работать и учиться.

Что слушать

Если вы верите, что фоновая музыка помогает настроиться и сосредоточиться, или просто хотите проверить, так ли это лично для вас, мы приготовили небольшую подборку приложений, в которых можно послушать специальную музыку:

Endel обещают, что приложение создаст персонализированный звуковой фон для любого занятия, в том числе для концентрации внимания. Синхронизируется с сердечным ритмом и учитывает уровень естественного света.

Noisli генерирует фон из звуков природы, в том числе для повышения продуктивности. Можно настроить количество и комбинации из 16 видов шумов.

Coffitivity синтезатор комфортных фоновых звуков кофейни. Это решение подойдет тем, кто считает небольшое кафе эталоном комфорта, кому нравятся звуки тихих разговоров людей, звон чайных ложек и фарфоровых чашек.

My Noise еще одно аудиокафе. Система позволяет смешать звуки прямо в браузере, в отличие от Coffitivity, здесь все делается прямо на первой странице сервиса, без загрузок и регистраций.

Brain.fm создатели приложения заявляют об искусственном интеллекте, который генерирует музыку для концентрации внимания, сна и других приятных дел. Обещают, что эффект будет длиться 15 минут после прослушивания. Много это или мало, каждый решает сам.

Rainy Mood в арсенале этого приложения около 400 разнообразных звуков дождя, призванных помочь расслабиться и улучшить концентрацию.

A Soft Murmur еще одна система для индивидуального смешивания фоновых звуков. Можно настроить уменьшение звука до тишины к нужному времени.

Расскажите: вы слушаете музыку во время учебы или работы? Помогает ли это вам?

Подробнее..

Как системы ИИ стремятся упростить звукорежиссуру

22.08.2020 12:20:38 | Автор: admin
На этих выходных мы решили рассказать о разработках двух американских университетов, которые помогают генерировать достаточно правдоподобный звукоряд для беззвучных видео.


Фото Free To Use Sounds / Unsplash

Трудная задача шумовика


Звуки для фильмов и сериалов например, шелест дождя очень сложно записать нужным образом прямо на площадке в момент съемки того или иного фрагмента. Будет много посторонних шумов, возможны конфликты с голосами актеров и другим оборудованием. По этой причине почти все звуки записывают отдельно и сводят уже при монтаже. Занимаются этим шумовики.

Если для фильма нужно воспроизвести звук разбитого окна, то звукооформители отправляются на студию и начинают бить стекла в контролируемых акустических условиях. Запись проводят до тех пор, пока звук не будет совпадать с происходящим на экране. В особо сложных случаях на это могут потребоваться десятки итераций, что усложняет и удорожает кинопроизводство.

Инженеры из Техасского университета предложили альтернативный вариант. Они разработали систему ИИ, которая определяет, что происходит в кадре, и автоматически предлагает звукоряд.

Как это работает


Принцип действия системы инженеры описали в своей работе для IEEE (PDF). Они спроектировали две модели машинного обучения. Первая выделяет из видеоряда признаки изображений например, цвет. Вторая модель анализирует движение объекта на разных кадрах и определяет его природу, чтобы выбрать подходящий звук.

Для формирования акустического ряда инженеры разработали программу AutoFoley. Она генерирует новый звук на основе тысячи коротких аудиосемплов с шумом дождя, тиканьем часов, галопирующей лошадью. Результат работы достаточно убедительный:


К сожалению, пока система имеет ряд серьезных ограничений. Она подходит для обработки записей, на которых звук не должен идеально совпадать с видеорядом. Иначе становится заметна рассинхронизация как на этом видео. Также объект должен постоянно присутствовать в кадре, чтобы модель МО могла его распознать. Сейчас разработчики занимаются оформлением патента, но потом они планируют исправить недостатки.

Кто еще занимается такими проектами


В 2016 году специалисты из MIT и Стэнфорда представили модель машинного обучения, способную озвучить немое видео. Она предсказывает звук на основе свойства объекта в кадре например, его материала. В качестве эксперимента инженеры загрузили в систему видеоролик, на котором человек ударяет барабанной палочкой по различным поверхностям: металлу, земле, траве и другим.


Эффективность алгоритма разработчики оценили с помощью онлайн-опроса. Наиболее реалистичными оказались звуки листьев и грязи (их назвали настоящими 62% опрошенных), а наименее дерева и металла. Металл звучал натурально только в 18% случаев.

Эта система также требует доработки. Она генерирует звуки, возникающие при столкновениях объектов, но не может воссоздать акустический ряд для шума ветра. Кроме того, алгоритм ошибается, если объекты движутся слишком быстро. Несмотря на этот факт у подобных решений есть потенциал они способны упростить работу шумовикам и преобразить киноиндустрию.



Дополнительное чтение в Мире Hi-Fi:

Ужасы киномана: ремастеринг и дубляж
Кто выбирает музыку для кино и сериалов? Музыкальный супервайзер
О, нет, опять: музыка в кино и сериалах, которую мы слышим слишком часто
Дождь, лязг доспехов и жидкий металл: как создается звук для кино
Звукоцех: Как создают звуковое оформление для кино


Подробнее..

Эй, диск-жокей, поставь мой floppy-диск

18.10.2020 20:21:07 | Автор: admin

Рассказываем, кто записывает и пытается слушать музыку на дискетах, какие технологии применяют для таких проектов и что из этого получается: от сжатия аудио до музыкальных инструментов.

Фотография: Karim Ghantous. Источник: Unsplash.comФотография: Karim Ghantous. Источник: Unsplash.com

3 дюйма для подкаста

Записать 33-минутный выпуск Шоу непрошеной точности на дискету попытался Теренс Иден, энтузиаст и эксперт по технологическим стандартам. В подготовительной части эксперимента он провел форматирование, после чего доступными остались ~11 тыс. килобит [HD-формат, 1440 Кб].

Теренс обработал аудиофайл с помощью Opus специального кодека для сжатия с потерями. Его представили IETF в 2012 году как открытый и бесплатный стандарт от разработчиков CELT и SILK. Opus использует преимущества обоих предшественников: сочетает сильные стороны CELT с точки зрения сжатия музыкального и разговорного контента, плюс специализацию SILK на работе с речью.

Формат видят практически все популярные плееры и бразуеры, а конвертацию можно осуществлять с помощью foobar2000 или в командной строке [вот компактный гайд], что и сделал Теренс:

opusenc in.wav --downmix-mono --bitrate 6 --cvbr --framesize 60 out.opus

Так он получил выпуск подкаста, который спокойно умещается на дискету: установил фиксированный битрейт в 6 кбит/с и размер аудиофрейма в 60 мс. Звучание выпуска после сжатия можно оценить здесь вместе с версиями для 4 кбит/с (удивительно, но разборчивая) и 2 кбит/с (не очень).

Фотография: Brian Kostiuk. Источник: Unsplash.comФотография: Brian Kostiuk. Источник: Unsplash.com

Есть вероятность, что автор эксперимента не знал о более совершенной версии Codec 2. Она способна выдавать еще более впечатляющие результаты. [На Хабре есть перевод заметки о кодеке.]

Флоппитроны

В качестве развития проекта Иден попробовал записать на дискету альбом A Hard Day's Night. Пусть звучание и получилось как на старом радиоприемнике с кучей помех, но идея была реализована. Прослушать гибкую пластинкуна Walkman'е он смог с помощью привода и Raspberry Pi Zero.

С дискетами и сопутствующей инфраструктурой чего только не делали. Так, пять лет назад на Хабре рассказывали об органе из дисководов. Посмотрите, как он выглядит, и послушайте, как звучит:

Его аналог называется Floppotron. Проект существует с 2012 года. За шесть лет с начала разработки количество используемых приводов для него увеличили с 2 до 64, а потом добавили и другое периферийное оборудование. Оцените кавер для легендарной Bohemian Rhapsody.

Как думаете, что если такую музыку еще и на дискету записать?

Делайте, что угодно

Попытки выпуска настоящих релизов на дискетах действительно предпринимали. Два года назад западные СМИ рассказывали о лейбле, который выбрал именно такой способ, чтобы на некоторое время вернуть интерес к Vaporwavе-музыке. [На Хабре есть перевод статьи об этом из Rolling Stone.]

Фотография: Bob Abednego. Источник: Unsplash.comФотография: Bob Abednego. Источник: Unsplash.com

Чуть более практичный подход к ностальгии по формату можно увидеть в проекте Diskplayer. Это бокс с дискетами, которые служат стартером для стриминга любимых альбомов. Здесь тоже задействована Raspberry Pi и цифро-аналоговый преобразователь HiFiBerry DAC+ Pro, а для переназначения альбомов разработан простой и удобный интерфейс. [Репозиторий проекта на GitHub и подробный материал об этом эксперименте, заслуживающий отдельного перевода.]

P.S. Обсуждение на Хабре: зачем искать музыку без помощи стриминговых сервисов.

Подробнее..

Доступные мониторы для домашней студии и обычного прослушивания музыки делимся обзорами акустики

16.01.2021 16:12:10 | Автор: admin

В прошлый раз мы начали говорить об аудиотехнике для стримов, записи треков и подкастов написали про охватывающие наушники on a budget. Сегодня продолжим тему сборки собственной студии и на этот раз остановимся на доступных мониторных стереосистемах.

Фотография: Omid Armin. Источник: Unsplash.comФотография: Omid Armin. Источник: Unsplash.com

[8 210] Behringer MS16 годятся для мультимедиа и творческих задач начального уровня. Это достаточно старая модель, которую все еще можно найти за очень небольшие деньги. Здесь есть вход для динамического микрофона на фронтальной панели, дополнительный вход mini-jack на тыловой части для плееров и других гаджетов, плюс аналогичный выход для наушников 3,5 мм.


PreSonus Eris E3.5 BT предлагают приличный, но обоснованный ценовой скачек по сравнению с моделью выше. Они ближе к профессиональной акустике по возможностям, а стоимость этих мониторов остается средней даже для крепких мультимедийников. В обзоре есть анпэкинг, показаны резиновые ножки-наклейки для развязывания колонок с поверхностью, возможности коммутации и настройки, плюс рассмотрены характеристики системы. Акустика годится для прямого подключения смартфона, планшета или портативного плеера. Кстати, она почти в два раза массивнее MS16, но это полезная нагрузка, которая вместе с виниловым покрытием корпуса производит приятное впечатление и добавляет солидности этой модели.


[14 940] M-Audio BX4 весьма примечательная модель в нише мониторов для мультимедиа. Она ближе к профессионалам, чем может показаться на первый взгляд. Однако подходит и для домашнего использования в самых различных ситуациях от фильмов до игр и фоновой музыки. В обзоре есть аккуратное ревю комплектации (присутствует minijack-2RCA и minijack-minijack), продемонстрировано качество сборки (кабинеты выполнены из ДВП) и эквалайзер на задней части. Стоит заметить, что BX4 мощнее PreSonus Eris E4.5, о которой мы расскажем далее в подборке, поэтому данную пару мониторов точно стоит рассматривать для домашней студии.


Фотография: Petri R. Источник: Unsplash.comФотография: Petri R. Источник: Unsplash.com

[15 490] Pioneer DJ DM-40 это еще одна компактная стереопара. Как видно из обзоров, она неплохо вписывается в интерьер, светлый корпус не оттягивает на себя внимание там, где в этом нет какой-либо необходимости например, на рабочем столе [хотя доступен и классический черный вариант]. Комплектация, внешний вид, впечатления от использования в формате домашней студии есть в обзорах, которые мы залинковали выше, а у нас вы найдете компактное описание и паспортные данные модели. Помимо этого, есть версия этой системы с поддержкой Bluetooth и кодеков SBC, AAC и aptX за нее придется доплатить 2500 рублей.


[20 207] PreSonus Eris E4.5 гораздо более массивный комплект, хотя по начинке он мало чем отличается от E3.5. Здесь есть кевларовый диффузор, который, конечно же, чуть крупнее; присутствует аналогичный дюймовый твитер; а на выходе полностью совпадающая мощность и звуковое давление. Поэтому смело берите чуть более компактный вариант, если располагаете небольшой площадью поверхностей для размещения акустики и ограничениями по бюджету.


[20 600] Mackie CR4-X точно конкурируют с E3.5, но и вынуждены соперничать и с M-Audio BX4, которые мы рассмотрели чуть выше. К сожалению, в комплекте отсутствуют какие-либо средства для развязывания колонок с поверхностью (в том или ином виде идут практически с каждой системой из нашей подборки), а система не выделяется чем-то особенным по характеристикам, дизайну и звучанию, что подтверждают обзоры. Поэтому мы рекомендуем обязательно слушать акустику перед покупкой ставить знакомые вам композиции, чтобы быстро обнаружить возможные недостатки. У нас аудиотехника всегда доступна для ознакомления без каких-либо обязательств с вашей стороны по договоренности нужная система будет ждать вас в шоуруме, а менеджеры помогут подобрать подходящие альтернативы, чтобы вы могли сразу сравнить их.



[24 400] Monkey Banana Gibbon AIR это мощные, яркие по своей внешности и достойные по всем параметрам мониторы. Одним словом альтернатива раскрученным брендам. Что интересно, от инженеров из Германии. Есть поддержка Bluetooth, что объясняет и заметную прибавку к стоимости. Однако для совсем небольшой комнаты мониторы могут не подойти эта система мощнее большинства сопоставимых по габаритам коллег из этой подборки и в полной мере раскрывает свои возможности на достаточно приличной громкости, что в ограниченном пространстве может вызывать дискомфорт и ненужные искажения. До покупки нужно слушать.


Что мы решили вынести за скобки:

  • [10 900] Мониторы Artesia M200 без обзоров

  • [25 040] BL Pro Control 2P Stereo конкуренты Gibbon AIR


Дополнительные подборки:


Подробнее..

Доступные мониторы для работы со звуком и мультимедиа делимся обзорами настоящих студийников

30.01.2021 14:20:43 | Автор: admin

Ранее мы посмотрели на охватывающие наушники и стереосистемы базового уровня. Сегодня поделимся обзорами и обсудим чуть более серьезную аудиотехнику для рабочих задач и нейтрального прослушивания музыки [кстати, по этому поводу получилось достаточно занимательное обсуждение в комментариях к прошлому материалу с обзорами].

Фотография: Tatonomusic. Источник: Unsplash.comФотография: Tatonomusic. Источник: Unsplash.com

[13 342] PreSonus Eris E5 одна из наиболее востребованных моделей в нише профессиональной акустики ближнего поля. Монитор обладает фронтальным фазоинвертором, который дает чуть более насыщенный нижний диапазон частот и позволяет поместить колонку ближе к стене без заметных искажений звучания, НЧ-диффузором из плетеного композитного материала 5,25 и классическим дюймовым ВЧ-динамиком с шелковым куполом. Мощность встроенного усилителя распределена следующим образом 45 Вт для НЧ- и 35 Вт для ВЧ-секции. На задней панели монитора есть плавная настройка эквалайзера и переключатель Acoustic Space для регулировки низких частот в зависимости от расположения акустики.

Кстати, у нас доступен витринный экземпляр по сниженной стоимости, однако стоит обратить внимание на обновленную версию E5 PreSonus Eris E5 XT с широкой горизонтальной дисперсией и старших коллег E7 XT и E8 XT с большей мощностью и звуковым давлением.

Дополнительные обзоры на английском для дальнейшего изучения: раз, два и три для E5 XT.


[14 283] Behringer NEKKST K5 стоит рассматривать вместе с его старшими коллегой монитором K8. В совместном обзоре появились сразу обе модели их спроектировал Кит Клавиттер, основатель KRK. Из особенностей стоит выделить технологию Advanced Waveguide для расширения горизонтальной дисперсии звука, что помогает быстрее расположить акустику и чувствовать себя свободнее при передвижениях на рабочем месте. Еще как и у PreSonus есть возможность подстройки частотного диапазона под характеристики помещения и input trim для входного канала. Задняя часть с регулировками у K5 и K8 выглядит похожим образом.

Кстати, в обзоре рекомендуют сразу смотреть на старшую модель и по возможности брать к ней в комплект сабвуфер K10S, а компактный K5 использовать в качестве резервной системы в ситуациях, когда основную роль играет совершенно другая аудиотехника, а вам необходимо проверить ошибки сведения и звучание микса на различных колонках.



[14 490] Pioneer DJ S-DJ50X еще один пример доступного монитора для домашней студии. Он может быть чуть массивнее некоторых моделей, представленных выше. НЧ-динамик здесь выполнен из арамидного волокна, а для твитера есть подсветка. На передней части щелевой фазоинвертор, на тыловой ручка регулировки фильтра верхних частот и три входных разъема, как и у большей части моделей из этой подборки. Еще данный монитор может автоматически переходить в режим ожидания, если более 25 минут на него не поступает сигнал. Pioneer DJ S-DJ60X обладает большей мощностью и согласно некоторым обзорам может дать более насыщенное звучание, но мы рекомендуем сравнивать и слушать акустику самостоятельно.


[14 990] Fluid Audio FX50 выделяется благодаря весьма необычному для этого сегмента акустики и ценового диапазона дизайн-решению. Твитер здесь находится в центре вуфера.

Монитор получился компактным и легким, его можно расположить даже на небольшом рабочем столе или полке над экраном компьютера. При этом эта акустика не отстает от конкурентов по всем параметрам она достаточно мощная, есть Acoustic Space для подстройки при размещении колонки возле стены или в углу комнаты, один небалансный и два балансных входа, классический фазоинвертор под НЧ-диффузором и панель настроек на задней части корпуса. Он выполнен из МДФ и с черным виниловым покрытием. Кстати, мы бы рекомендовали взглянуть на гораздо более полный обзор старшей модели Fluid Audio FX80. Этот монитор дороже на десять тысяч рублей, но у нас есть уцененный экземпляр практически по одной стоимости с FX50.


[15 800] Behringer TRUTH B2030A еще одна модель с интересным внешним видом и конструкторским подходом. Большой НЧ-динамик 6,75 и два щелевых фазоинвертора по бокам от твитера 0,75 в комплексе практически с десятью килограммами веса действительно производят впечатление [для сравнения Fluid Audio FX50 всего 3,8 кг]. Звучание монитора соответствует массивному виду пиковая мощность составляет 125 Вт. Еще здесь есть эмуляция стереосистемы малого размера и три стандартных переключателя на задней панели монитора для адаптации к окружению и предпочтениям слушателя. [Доп. обзор на английском.]


Отзыв для Yamaha HS5 одного из наших клиентов [из обзора студийных мониторов]Отзыв для Yamaha HS5 одного из наших клиентов [из обзора студийных мониторов]

[16 900] Yamaha HS5 не выделяется чем-то особенным среди конкурентов и по характеристикам находится ближе к условному Eris E5, чем можно себе представить. Единственное фазоинвертор находится на задней стороне кабинета, а цветовое решение построено на комбинации белого и черного цвета корпуса и сегментов вуфера. Старшая модель HS7 может показаться многим более интересным решением, учитывая небольшую разницу в цене.

Дополнительные обзоры и сравнения для дальнейшего изучения: раз, два, три.


[19 190] ADAM T5V это примечательный монитор ближнего поля, который по стоимости и мощности находится рядом с Denon SM50 [подходит для средних помещений и диджеинга]. Трубу фазоинвертора здесь вынесли на заднюю часть, где есть традиционные регулировки для моделей начального класса. Вуфер классические пять дюймов, а твитер типа U-ART 1,9 [практически в два раза больше, чем у аналогов]. Последний, по ряду обзоров, за счет конструкции позволяет получить более точное звучание и меньший объем искажений.

Кстати, в этом ролике пусть и в формате компактной нарезки показана начинка монитора.


Обзоры аудиотехники для домашней студии и другие темы:


Подробнее..

Система пространственного звучанияна бумаге что напечатали в Техническом университете Хемница

30.01.2021 22:09:23 | Автор: admin

Пока одни вспоминают ambisonic-проекты из журналов 80-х, другие развивают, модернизируют и доводят их до работающих прототипов. Например, так действуют специалисты Хемницкого технического университета. Рассказываем, с чего они начали и что осуществили на этот раз.

Фотография: Kelly Sikkema. Источник: Unsplash.comФотография: Kelly Sikkema. Источник: Unsplash.com

Первый ти-бук

Концепцию музыкальной книги или открытки сложно назвать новой. Другое дело реализация. Как показывает проект T-Book, она может быть не совсем стандартной и подразумевать полное отсутствие видимых акустических элементов и сенсоров. Такого эффекта смогла добиться та самая группа специалистов из университета Хемница еще в 2015-м. За три года до этого она предложила технологию музыкальной бумаги T-Paper [Tone paper], а потом интегрировала аудиосистему прямо в страничкипечатного издания с полноценной графикой и текстом.

Прототип работал на аккумуляторных батарейках, воспроизводил соответствующие треки на нескольких разворотах и удостоился ряда наград на конференциях и научных фестивалях.

Технология позволила послойно напечатать для него пьезоэлектрические излучающие элементы и заинтересовала общественность с точки зрения потенциального применения в других отраслях. Однако тогда производство гибкой акустики с ее помощью не смогли полностью автоматизировать процесс печати был слишком трудоемким и не самым эффективным с точки зрения времени и ресурсов. Поэтому группа решила продолжить работу над проектом.

Обновленный ти-пейпер

В начале этого года в известном научном издании Advanced Materials вышла статья с результатами апгрейда T-Paper до полноценной рулонной технологии [roll-to-roll, R2R]. В новом проекте приняли участие специалисты из шести отраслей от акустики до электротехники.

Они не только улучшили первоначальную разработку, но и смогли адаптировать сопутствующие технологии например, для ламинирования функциональных слоев. Так появилась возможность подготовки продукции в различных форм-факторах, чем и воспользовались сами разработчики.

Изображение: John Baer. Источник: Flickr.com Изображение: John Baer. Источник: Flickr.com

Прототип аудиосистемы пространственного звучания изготовили в форме замкнутого кольца. Его назвали T-Ring по аналогии с T-Book. Поверхность разбили на семь сегментов, на них напечатали 56 излучателей. Вес прототипа составил 141 грамм, длина окружности 387 см.

Что дальше

Для такой технологии печати и акустики можно найти множество вариантов применения от выставок до офисов и опенспейсов, где нужно привести в порядок экосистему звука. Кстати, на Hacker News сразу вспомнили похожий проект, который так и не смог собрать достаточный объем средств в ходе фандрайзинговой кампании на Kickstarter около четырех лет назад.

Какое будущее ждет разработку инженеров из Германии, покажет время, а пока мы подготовили небольшую подборку материалов о необычной акустике из нашего Мира Hi-Fi:


P.S. У нас на Хабре обзоры доступных мониторов для работы со звуком и мультимедиа.


Подробнее..

Луи, вот это музыка! опубликован ремастер саундтрека легендарного платформера из 90-х

06.02.2021 02:09:12 | Автор: admin

Речь о SMW, вышедшей тридцать лет назад и не нуждающейся в представлении. Профильные эксперты и издания продолжают включать ее в топы видеоигр всех времен, а энтузиасты с радостью берутся за реставрационное переосмысление музыкального оформления.

Фотография: Joao Tzanno. Источник: Unsplash.comФотография: Joao Tzanno. Источник: Unsplash.com

Минутка истории

Оригинальный OST написал Кодзи Кондо, японский композитор, поучаствовавший в подготовке десятков игр и музыкальных тем, в том числе и Ground Theme самой длинной и известной из первоначальной версии платформера 1985 года. SMW вышла только через пять лет, но и ее игровой мир был сложнее, а значит требовал более продвинутого музыкального оформления.

Кондо написал основную тему и несколько вариаций, отличающихся по тональности и темпу. Он выбрал фа мажордля стандартных локаций, фа минор для замков. Передал атмосферу подземных и подводных уровней с помощью фильтров и приподнял темп мелодий для воздушных и лесных сеттингов, чтобы придать игровому процессу дополнительную динамику и остроту.

SMW представили вместе с приставкой SNES, которая обладала продвинутой и автономной аудиосистемой. Ее построили на базе SONY SPC700 c встроенной оперативкой, куда основной процессор SNES передавал программу-плеер и сэмплы.

Далее в дело вступал DSP-процессор, генерировавший 16-битный сигнал.

Фотография: Ravi Palwe. Источник: Unsplash.comФотография: Ravi Palwe. Источник: Unsplash.com

Система расширила возможности для творчества, чем и воспользовался Кондо. Однако ограничения все еще были существенные и саундтрек он писал около полутора лет.

Что там за ремастер

Группа энтузиастов взялась за реставрацию игрового издания и по стечению обстоятельств смогла воспользоваться оригинальными сэмплами без сжатия, которые некоторое время назад утекли в сеть вместе с исходным кодом ряда других культовых игр 90-х, в том числе и различных спин-оффов SMW для других платформ. Итоговый ремастер музыкальной темы на днях опубликовали на YT-канале The Brickster. О релизе написали The Verge и другие медиа.

Как говорят инициаторы проекта, они планируют и далее заниматься ремастерингом музыки из этой и других игр. Что интересно, с ходом времени материала стало только больше, поэтому процесс они ведут достаточно открыто обсуждают его и результаты работы в соцсетях.

Кстати, в плейлисте саундтрека SMW было опубликовано достаточно интересное сравнение с сэмплами из Lego Island 1997 года выпуска первой видеоигры из этой серии для Windows.

Горячая тема

Ремастеринг игровых композиций, да и изготовление реплик аудиожелеза популярное хобби множества энтузиастов из разных уголков мира. В комментариях к заметке о SMW на The Verge сразу вспомнили канал StarBender и привели в качестве примера одну из тем к Super Mario 64. О том, как работает музыка в NES, в прошлом году подробно рассказывали на Хабре, да и мы делились материалами о реверс-инжиниринге и репликах карт вроде Sound Blaster 1.0.

Мы продолжим наблюдать за интересными новинками в этой области, а пока подготовили для вас пару материалов для дополнительного изучения по теме:


Подробнее..

На средний бюджет три не совсем обычных USB-микрофона для записи видеороликов и подкастов

06.03.2021 10:10:31 | Автор: admin

Ранее мы обсудили конденсаторные USB-микрофоны начального и среднего уровня. В голосовании по первой и второй категории уверенную победу одержали представители бренда Audio-Technica ATR2500x-USB и AT2020USB+. Посмотрим, какие модели вы посчитаете нужным выделить по итогам заключительной подборки примечательных USB-микрофонов.

На изображении: Shure MV51. Источник: Audiomania.ruНа изображении: Shure MV51. Источник: Audiomania.ru

[17 767] Shure MV51 обладает примечательным дизайном с отсылкой к внешнему виду Shure Model 51 Sonodyne из 1960-х. Высота микрофона 128 мм, у него солидный цельнометаллический корпус, поэтому и вес приличный 575 г. Микрофон обладает интегрированной подставкой в виде небольшой откидной ножки без возможности регулирования высоты. Она достаточно устойчивая, но для ряда задач может потребоваться крепление к стандартной микрофонной стойке [такая возможность здесь предусмотрена]. Кстати, последний вариант позволит захватывать меньше ненужных звуков при активной работе с клавиатурой и случайных ударах руками по столу. С нежелательными эффектами от чистых смычных звуков поможет справиться и ветрозащита она идет в комплекте [уточняйте этот момент].

Отличительная особенность модели огромный [по сравнению с устройствами из прошлых обзоров] 25-мм капсюль и поддержка до 24 бит/48 кГц встроенным аналого-цифровым преобразователем. Микрофон совместим с совместим с Android и iOS, но вышел уже достаточно давно, поэтому на всякий случай проверяйте список поддерживаемых версий ОС и моделей смартфонов. Кстати, для яблочной платформы есть приложение ShurePlus MOTIV обновление вышло всего пару месяцев назад.

Стоит заметить, Shure MV51, как большая часть его аналогов, содержит в комплекте кабели по одному метру, что подойдет для подключения к стационарному компьютеру далеко не всем. Еще он может потребовать адаптеры для различных моделей планшетов. Послушать сравнение со встроенным микрофоном iPad Pro можно тут, со смартфоном на Android здесь. В обзорах эту модель иногда сопоставляют как с Blue Yeti, так и с классическими продуктами Shure вроде динамического микрофона SM7B. Звучание MV51 без каких-либо сравнений вот и вот.

На фронтальной части корпуса есть удобные элементы управления они позволяют переключаться между пятью пресетами [Speech, Singing, Flat, Acoustic Instrument, Loud], которые помогут побороться с клиппингом и эффективнее адаптироваться к выбранному формату записи в зависимости от помещения и задач кардиоида продолжит действовать вне зависимости от смены режимов. Еще здесь есть кнопка Mute, которой часто не хватает на моделях USB-микрофонов базового ценового сегмента, и выход на наушники для мониторинга записи. Кстати, эту модель можно отнести к средней линейке, как минимум в рамках наших обзоров.

Для любителей более привычного форм-фактора есть MV7 [22 993] старший товарищ MV51 с дополнительным XLR-разъемом и комплектацией, включающей трехметровые кабели.


[16 900] Marantz Professional AVS комплексная система с легкой настольной конструкцией [1,04 кг, 485 мм], веб-камерой, освещением и микрофоном. Модель появилась несколько лет назад, поэтому здесь встроена Full HD камера [пишет в H.264], но с автофокусировкой и неплохим углом обзора. Хорошее out of the box решение для видеозвонков и вебинаров.

Для микрофона использована полукардиоида и аналого-цифровой преобразователь, поддерживающий запись в 16-битном формате с частотой дискретизации до 48 кГц. Что интересно, помимо выхода для наушников, присутствует и микрофонный выход на джеке. Устройство записывает еще и на флешки в комплекте есть кабель USB-C-to-USB-A.

Из потенциальных неудобств требует подключения к сети и питается от адаптера.

Старшая модель Marantz Professional Turret чуть интереснее за счет стойки-пантографа [860 мм] и выносного микрофона с поп-фильтром, но здесь вновь встроена лишь Full HD камера, поэтому для рабочих задач какого-либо смысла переплачивать практически и не остается.


[23 399] Apogee MiC Plus призван стать успешнее предшественника MiC 96k, достаточно популярной модели среди западных подкастеров и независимых музыкантов. Конкурентное преимущество этой линейки компактный размер и минимальных вес. Для MiC Plus это всего 124 мм высоты и 200 г, хотя вместе с аксессуарами и кейсом получится не менее 350 г.

В этой модели вы найдете 24-битный АЦП, позволяющий записывать с частотой дискретизации до 96 кГц и выход для мониторных наушников. Универсальное комбо для широкого спектра задач: от работы с музыкальными инструментами до разговорных передач и стримов. В комплекте кабели Lighting, USB-B и USB-B, небольшая тренога и адаптер для стойки.

Старший брат MiC Plus HypeMIC [31 530] обладает аналоговым компрессором с тремя режимами работы и выводит линейку на уровень настоящих студийников. Мы подготовили небольшой видеоролик о нем и сравнили его звучание с моделями из предыдущих обзоров.


Обзоры аудиотехники для домашней студии и другие темы:


Подробнее..

Стриминговая платформа, выкупившая подкаст за 100 млн, продолжает избавляться от его выпусков

11.04.2021 10:22:11 | Автор: admin

Речь, конечно же, о шоу Джо Рогана, и далее мы разберемся в ситуации чуточку подробнее. Всех, кого интересует происходящее в мире подкастинга и аудиоконтента, приглашаем под кат.

Фотография: Owlpacino. Источник: Flickr.com / CC BY NDФотография: Owlpacino. Источник: Flickr.com / CC BY ND

Что происходит

Сразу после завершения сделки с Джо, его подкаст вышел на Спотифай в эксклюзивном формате. Однако сервис сразу же снял ряд интервью с противоречивыми спикерами вроде конспирологов Алекса Джонса и Дэвида Симана. Но этими личностями дело не ограничилось шоу лишили выпусков с комиком Оуэном Бенджамином и чуть ли не десятком других гостей. Все они так или иначе побывали в центре скандалов, их большую часть объединяли ультраправые взгляды и относительно неконвенциональный род занятий. Так, интервью с Томми Чонгом, бывшим музыкантом с достаточно необычной биографией тоже на всякий случай сняли.

Ранее Джо иногда критиковали за выбор гостей, ссылаясь на его желание продемонстрировать положительные стороны сомнительных персонажей. Но мало кто мог предположить, что сделка приведет к пост-модерации контента, с которым уже успели познакомиться миллионы людей по всему миру. При этом на днях за первоначальными срезками последовали и другие платформа избавилась от интервью с биохакером, имморталистом и основателем бренда Bulletproof Coffee Дейвом Эспри. С 2013 года, Джо провел несколько бесед с ним, и теперь все они недоступны для прослушивания. Вероятно, речь вновь идет о противоречивых заявлениях, с помощью которых спикер привлекал к себе внимание медиа. Дело в том, что Дейв неоднократно высказывался об экспериментах над собственным телом и планах дожить до 180 лет.

Помимо разговора с Эспри под нож попал выпуск, записанный на сцене калифорнийского клуба The Ice House. Тогда в шоу поучаствовали комики Аль Мадригал и ФелицияМайклс, продюсер Брайан Редбан и другие спикеры. Но причины устранения этой беседы остаются загадкой в итоге передача стала беднее уже на целых сорок два выпуска.

Фотография: Carlos Alberto Gmez Iiguez. Источник: Unsplash.comФотография: Carlos Alberto Gmez Iiguez. Источник: Unsplash.com

Стриминговая платформа модерировала содержание своей библиотеки и до ситуации с шоу Джо. Так, в 2018-м досталось все тому же Алексу Джонсу, основателю проекта Infowars. Некоторые из выпусков его передачи решили снять в тот момент, когда атаку на Джонса провели еще и другие платформы, а именно YouTube и Facebook. Есть мнение, что причина заключалась в пресловутом хейт-спич-контенте и соответствующих отзывах пользователей. Однако единовременный характер такой модерации может вызывать сомнения в этой версии.

Проблема больше, чем кажется

Проверка содержания аудиоконтента ахиллесова пята популярных соцсетей, музыкальных сервисов и новых аудиоплатформ. С ростом спроса на голосовые стримы, разговорные передачи, голосовых помощников и фоновую музыку таким площадкам предстоит потрудиться, чтобы начать соответствовать многочисленным нормам, которые предъявляют регуляторы к онлайн-контенту. Взять хотя бы запрет на разжигание ненависти и нецензурную лексику. Если с последним еще можно справиться, выхватывая отдельные слова и словосочетания, то разобраться со смыслом сказанного будет явно сложнее. Да и в целом работа с технологиями распознавания речи явно обойдется дороже, чем проверка текстовых публикаций.

Сложности, окружающие эту тему, уже во всю обсуждают в медиа. Как отмечают журналисты The Verge, еженедельно в сети выходит более семнадцати тысяч новых подкастов, поэтому проблема с автоматизированной обработкой столь внушительного объема аудио не может не беспокоить крупнейшие платформы. Единственной их надеждой на хоть какую-то модерацию в текущих условиях остаются отзывы и жалобы слушателей. Но, как показывает опыт США, риск пропустить информацию, к которой могут возникнуть вопросы у государственных структур, с каждым годом становится все выше. Поэтому не исключено, что в скором времени нас ждет дальнейшее и достаточно быстрое развитие технологий распознавания речи с точки зрения их эффективности и скорости работы на беспрецедентном масштабе аудиоконтента. Будут ли они использоваться исключительно для модерации, покажет будущее, но хотелось бы надеяться, что этим дело не ограничится, и мы увидим новые проекты, по большей части направленные на созидание.


Что еще почитать в нашем Мире Hi-Fi:


У нас на Хабре: звуковое оформление игр и фильмов, аудиосоцсети и музыка для фона.


Подробнее..

Комплект с устройствами для звукозаписи обсуждаем их возможности и альтернативы

05.05.2021 00:09:59 | Автор: admin

Ранее мы останавливались на нескольких примечательных аудиопэках базового уровня [раз, два]. Двигаемся дальше и рассуждаем о преимуществах и недостатках нового комплекта.

Комплект для записи Mackie Creator Bundle Audiomania.ruКомплект для записи Mackie Creator Bundle Audiomania.ru

[27 900] Комплект Mackie Creator Bundle годится для начинающих вокалистов и композиторов, подойдет для записи подкастов, стримов и разговорных интервью. В бандле присутствуют: USB-микрофон, активные мониторы для мультимедиа и закрытые наушники. Расскажем, что стоит знать о данных устройствах, и предложим альтернативы.


Начнем с микрофона. Это конденсаторный EM-USB с кардиоидной направленностью. Если простыми словами, он хорошо захватывает все, что звучит перед его лицевой частью, гасит боковые звуки и неплохо игнорирует происходящее с тыльной стороны. Однако при активной работе с клавиатурой например, в ходе игрового процесса щелчки все-таки попадут на запись, даже если разнести микрофон и устройство ввода на разные стороны стола.

На борту EM-USB установлена диафрагма с диаметром в 14 мм. Если сравнивать с аналогами, по этому показателю этот микрофон попадает между MPM-1000U и C-1U других брендов.

Еще одна ключевая характеристика для USB-микрофона возможности встроенного ЦАП. В данном случае он 16-битныйи поддерживает частоту дискретизации до 48 кГц включительно. Это норма для устройств такого типа, но далеко не предел даже для относительно недорогих внешних аудиоинтерфейсов вроде Focusrite Scarlett Solo 3rd Gen [24 бит/192 кГц] и Steinberg UR22C [32 бит/192 кГц], о которых мы говорили в предыдущих подборках [раз, два].

Конденсаторный USB-микрофон EM-USB Audiomania.ruКонденсаторный USB-микрофон EM-USB Audiomania.ru

В обзорах микрофон хвалят за качество сборки. Корпус и защитная сетка у него металлические, элементы управления работают плавно и не обладают потенциалом к деградации креплений. Как вы можете видеть на фотографии выше, на лицевой стороне устройства есть кнопка Mute и светодиод, выполняющий роль индикатора ее работы. Даже при плавном нажатии на эту кнопку в процессе записи на аудиодорожку попадет паразитный щелчок. Однако на стримах и во время звонков аудитория может и не заметить этот момент, поэтому он не является критичным.

Еще на передней части присутствует регулятор уровня громкости сигнала, выходящего на наушники для прямого мониторинга, плюс регулятор для управления усилением Gain. В нижней части как раз расположен вход для наушников с классическим 1/8'' Jack TRS и порт USB-C для подключения микрофона к компьютеру [кабель USB-C-USB-A входит в комплект].

Для установки микрофона производитель предусмотрел небольшой штатив-треногу с держателем. Но мы рекомендовали бы рассмотреть вариант с покупкой пантографа, пусть и примитивного. Он необходим, чтобы развязать устройство с поверхностью и минимизировать вероятность попадания на запись паразитных звуков от случайных касаний стола. Кстати, габариты EM-USB чуть выше средних [высота без треноги 180 мм, вес 390 г], поэтому пантограф не повредит и поможет разгрузить стол от очередного гаджета.

В целом в обзорах отмечают нейтральное звучание записей с этого микрофона и рекомендуют его для работы с разговорным контентом. Другие юзкейсы, требующие постоянного мониторинга, могут вызвать сложности в сети встречаются жалобы на небольшую задержку сигнала, поступающего с устройства напрямую в наушники. Пожалуй, это единственный потенциальный недостаток, требующий дополнительной проверки в процессе покупки.

Обзоры других USB-микрофонов:


Бандл включает и пару мониторов для мультимедиа CR3-X. Кстати, в одном из наших обзоров доступных студийников мы рассказывали о Mackie CR4-X старшем коллеге этой модели. CR3-X это активная акустика ближнего поля она не требует усилителя, может без проблем озвучить небольшие и средние комнаты и конкурирует с аналогами вроде PreSonus E3.5.

Мониторы для мультимедиа CR3-X Audiomania.ru Мониторы для мультимедиа CR3-X Audiomania.ru

Система получилась действительно компактной [206 x 140 x 180 мм] и легкой [3.5 кг]. Колонку можно легко поднять одной рукой, а не столе паре не понадобится существенное пространство. При этом в CR3-X поставили достаточно мощный басовик в три дюйма и 19 мм твиттер с шелковым куполом. Уровень максимального звукового давления системы 97 дБ.

Фазоинвертор расположен в верхней части задней стороны колонок практически напротив твиттера, а на лицевой стороне находится выход на наушники на 1/8'' Jack TRS и регулятор уровня громкости, который работает и в качестве включателя/выключателя акустики.

Кабинеты изготовлены из MDF и обладают черным виниловым покрытием. В обзорах отмечают качество сборки нужно постараться, чтобы найтии сформулировать замечания на этот счет. В комплекте есть кабель 1/8''Jack TRS-2RCA, 1/8''Jack TRS-1/8''Jack TRS и коммутационник для подключения пассивной колонки от активной, которая питается от сети.

Кстати, эти мониторы доступны и вне комплекта. Их легко найти и заказать прослушивание. В качестве еще одной потенциальной альтернативы мы бы предложили Pioneer DJ DM-40.

Обзоры других систем:


Третий компонент бандла закрытые мониторные наушники MC-100. Их внешний вид говорит о попытке производителя приблизить ожидания аудитории к тому, что предлагают классические модели вроде ATH-M30X и ATH-M40X. В какой-то степени ему это удалось осуществить MC-100 снабжены динамическими излучателями по 40 мм и обладают небольшим весом [233 г]. Да и по характеру звучания они способны конкурировать с этими моделями кажется, американцам удалось сделать все, чтобы предложить рынку бюджетную пару универсальных ушей с нейтральным и в достаточной степени достоверным звуком. То, что нужно для работы над аудиоматериалом и обычного прослушивания музыки во время отдыха и перерывов.

Из аналогов мы бы рекомендовали изучить PreSonus HD-7, AKG K92 и другие модели, о которых мы говорили в одном из наших тематических обзоров наушников для домашней студии.


Общий для всего пэка момент ключи для Pro Tools | First и доступы к пэку плагинов. Это приятный бонус, но далеко не во всех обзорах данный бандл характеризуют как универсальный. Есть мнение, что его слабое звено USB-микрофон, в некоторой степени ограничивающий возможности для записи вокала и профессионального озвучивания какого-либо контента. Поэтому для таких задач стоит рассмотреть вариант с внешним аудиоинтерфейсом и классическим конденсаторным микрофоном с подключением по XLR.


Подборки аудиотехники и обзоры в нашем блоге на Хабре:


Что еще можно почитать в нашем Мире Hi-Fi:


Подробнее..

Перевод А вы когда-нибудь причиняли себе физическую боль собственным кодом?

04.06.2021 10:04:57 | Автор: admin
Приходилось ли вам когда-нибудь ненароком причинить себе или другим физический вред из-за ошибок в коде? Мне да.

Примерно год назад я работал со сгенерированными файлами в формате WAV, их было несколько тысяч. Я пытался снабдить их метками, рассортировать по папкам, создавал метаданные. В процессе я прослушал несколько штук, и, к моей досаде, оказалось, что все они начинаются с довольно продолжительной тишины. Это сильно раздражало, особенно когда прослушиваешь серию файлов подряд и постоянно спотыкаешься о паузы перед воспроизведением каждого следующего. Прекрасно, значит, еще и с этим придется что-то делать.

Я уже потратил сколько-то времени на поиск решений для удаления тишины из файлов, когда меня вдруг осенило: это ведь WAV! Данные в файлах формата WAV обычно представляют собой PCM-аудио, то есть каждое значение в файле задает амплитуду звука в некоторый момент времени. Соответственно, если у нас там действительно полная тишина, а не белый шум, то в файле этой тишине должны соответствовать сплошные нули, так ведь?

$ xxd testfile1.wav | head -n 10000000000: 5249 4646 64b9 0e00 5741 5645 666d 7420  RIFFd...WAVEfmt 00000010: 1000 0000 0100 0200 44ac 0000 10b1 0200  ........D.......00000020: 0400 1000 6461 7461 40b9 0e00 0000 0000  ....data@.......00000030: 0000 0000 0000 0000 0000 0000 0000 0000  ................00000040: 0000 0000 0000 0000 0000 0000 0000 0000  ................00000050: 0000 0000 0000 0000 0000 0000 0000 0000  ................00000060: 0000 0000 0000 0000 0000 0000 0000 0000  ................00000070: 0000 0000 0000 0000 0000 0000 0000 0000  ................00000080: 0000 0000 0000 0000 0000 0000 0000 0000  ................# ... and a lot more zeros below

Так и есть. Ну что ж, значит, дело проще, чем казалось. Достаточно просто прочитать файлы, найти место, где заканчиваются эти нули, и убрать соответствующий фрагмент.

Как читаются файлы WAV


Сначала мне нужно было поближе познакомиться с форматом WAV, чтобы понять, как работать с такими файлами и управлять данными внутри них. Я подобрал несколько источников; одним из самых полезных оказалась старая страница со stanford.edu (сайт сейчас уже недоступен, но, к счастью, сохранился на Wayback Machine). Там была очень доходчивая диаграмма:


Итак, структура файла WAV представляется довольно простой: сначала заголовок объемом в 44 байта, а дальше уже собственно данные. С этой информацией уже можно было приступать к коду. Требовалось только пропустить первые 44 байта, убрать последовательность из нулей в начале секции с данными, а всё остальное отправить на воспроизведение в исходном виде. Хотя не могу не добавить, что в другом источнике мне попались такие сведения:

Некоторые программы предполагают (и это очень наивно с их стороны), что вводная часть в заголовке всегда занимает ровно 44 байта (как говорится в таблице выше) и что всё остальное содержимое файла составляют только и исключительно аудиоданные. Делать подобные предположения небезопасно.

Ну, я решил, что ничего страшного: программу я писал на C, так что за безопасность можно было особенно не переживать.

Код


Код был несложным, уложился меньше чем в сотню строк. По сути, он перебирал весь файл по байту, за исключением первых сорока четырех, и считал идущие подряд нули. Как только попадалось что-нибудь, что нулём не являлось, программа останавливалась, сохраняла соответствующий индекс, и начинала читать файл сначала. На этот раз она пропускала всё, что предшествует индексу (не считая заголовка), и выводила все остальные байты по стандартной схеме.

Целиком код приводить незачем, но вот та часть, которая будет нас интересовать:

// index was calculated above to be the index of// the last consecutive zero byteFILE *f = fopen(argv[1], "rb");int ind = 0;int current_byte;while ((current_byte = fgetc(f)) != EOF) {    if (ind < 44 || ind >= index) {        fputc(current_byte, stdout);    }    ind += 1;}fclose(f);

Всё круто, всё просто. Пора тестировать. Я запустил программу на одном из файлов с особенно продолжительной паузой.

./strip_audio testfile1.wav > testfile1.nosilence.wav

Проверил, что выдаёт xxd для testfile1.nosilence.wav. Отлично, никаких нулей в начале. Значит, сработало. Чтобы окончательно убедиться, открою-ка я по-быстрому файл в аудиопроигрывателе.



Источник

В ту же секунду мне по ушам ударил самый мощный статический шум, который я в жизни слышал. Чуть не вывалившись из кресла, я отчаянно пытался стащить с себя наушники. Помню, дело было посреди ночи, и собака прибежала проверить, что там со мной.

Где я ошибся?


В ушах всё еще звенело, а я сидел и пытался осмыслить свои опрометчивые решения.

  • Ошибка 1: надо было убавить звук.
  • Ошибка 2: не надо было сидеть в наушниках.
  • Ошибка 3: неучтённая единица.

А вы заметили третью ошибку в коде, который я приводил выше? Подсказка: смотрите на комментарий. Я рассчитал переменную index как индекс последнего байта, представляющего собой нули. А значит, за вычетом 44 байтов заголовка, теперь мы воспроизводим только то, что следует за индексом или накладывается на него. index у нас стоит на последнем нуле в серии, то есть мы включаем один лишний нулевой байт в секцию с данными.

Это можно исправить следующим образом:

//     replaced >= with just >if (ind < 44 || ind > index) {    fputc(current_byte, stdout);}

Теперь в выдаче нет лишних нулей, и если воспроизвести файл, ничего страшного не случится. Я всё починил Но стоп.

В файлах WAV у нас PCM-аудио, а нули в аудиоданных такого рода соответствуют полной тишине. Так разве этот лишний байт не должен быть совершенно бесшумным? Почему он оказался таким громким и таким статическим?

Для начала давайте сравним нормальный аудиофайл с монстром, которого я создал, при помощи Audacity:


Угадали, где монстр? Да, это тот самый, у которого амплитуда стабильно вывернута чуть ли не максимум. Почему так?

Как читаются аудиосэмплы


Я вернулся к источникам, которые отобрал, и попытался разобраться, как ошибка на единицу могла привести к подобному взрыву амплитуды. Я знал, что в моих файлах сэмпл содержит 16 бит, а канала два (стерео), поэтому стал искать соответствующую информацию. Вот что говорилось в разделе про 16-битное стерео PCM-аудио:

Каждый сэмпл содержится в целом числе i, которое представляет минимально достаточное количество байтов для хранения заданного размера сэмпла. Наименее значимый из байтов располагается в хранилище первым.

Минимально достаточное количество байтов для хранения заданного размера формулировка здесь излишне запутанная. i соответствует числу битов, которые содержатся в сэмпле. В нашем случае их шестнадцать. Соответственно, если у нас есть некое значение длиной в 16 битов, само собой, храниться оно будет в двух байтах. А дальше важный момент: наименее значимый из байтов располагается в хранилище первым. Вот оно.

Взгляните на график, который я сделал, чтобы показать, что привело к возникновению такого сильного сигнала:


В верхней части показан мой файл-монстр, в котором я случайно оставил лишний байт с нулями. В каждом из трёх сэмплов s1, s2 и s3 по два байта, причем второй более значимый. Следовательно, при переводе этих пар байтов в десятичную форму мы получаем очень высокую амплитуду.

В то же время, в нижней части видно, что, если убрать нулевой байт, сэмплы читаются так, как и должны, и значения в аудиофайле укладываются в рамки разумного.

Выходит, если бы у меня было 8-битное аудио, тогда пропущенный лишний байт не вызвал бы никаких проблем. Но оно было 16-битным, и в итоге, я сдвинул всю последовательность в сэмплах, так что наименее значимый байт стал читаться как наиболее значимый.

Выводы


  • Проверяйте звуковую волну аудиофайла, прежде чем врубать его на максимальной громкости
  • Читайте (и принимайте к сведенью) спецификации
  • Учитывайте, как код может повлиять на вас и других людей
Подробнее..

Категории

Последние комментарии

  • Имя: Макс
    24.08.2022 | 11:28
    Я разраб в IT компании, работаю на арбитражную команду. Мы работаем с приламы и сайтами, при работе замечаются постоянные баны и лаги. Пацаны посоветовали сервис по анализу исходного кода,https://app Подробнее..
  • Имя: 9055410337
    20.08.2022 | 17:41
    поможем пишите в телеграм Подробнее..
  • Имя: sabbat
    17.08.2022 | 20:42
    Охренеть.. это просто шикарная статья, феноменально круто. Большое спасибо за разбор! Надеюсь как-нибудь с тобой связаться для обсуждений чего-либо) Подробнее..
  • Имя: Мария
    09.08.2022 | 14:44
    Добрый день. Если обладаете такой информацией, то подскажите, пожалуйста, где можно найти много-много материала по Yggdrasil и его уязвимостях для написания диплома? Благодарю. Подробнее..
© 2006-2024, personeltest.ru