Сегодня 08 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → звук
Быстрый переход

Meta✴ разработала аудиокодек EnCodec на ИИ — сжимает в 10 раз сильнее, чем MP3 при том же качестве

Компания Meta представила новый звуковой кодек EnCodec, который использует методы машинного обучения для повышения степени сжатия без потери качества — в результате он способен сжимать аудио в 10 раз сильнее, чем MP3 при том же качестве. Об этом сообщает издание Ars Technica.

 Источник изображений: *** AI

Источник изображений: Meta AI

Кодек EnCodec может применяться как для потоковой передачи звука в режиме реального времени, например, при телефонных звонках в районах нестабильной связи, так и при кодировании для последующего сохранения в файлах.

Разработчики сообщили, что система сжатия EnCodec состоит из трёх частей. Сначала кодировщик преобразует несжатые данные в специальный формат с более низким битрейтом. Затем полученный формат сжимается до необходимого размера, но сохраняется важная информация, которая будет использована для восстановления исходного сигнала. В конечном итоге декодер в режиме реального времени преобразует сжатые данные обратно в звуковые волны с помощью нейронной сети.

В компании отмечают, что нейросеть грамотно сжимает звук и разница между звуков до и после сжатия не будет восприниматься человеческим слухом. Нейросети для сжатия звука используются давно, однако Meta первой применила технологию к стереозвуку при 48 кГц.

Технология EnCodec по-прежнему находится на стадии разработки и тестирования. Разработчики не говорят о сроках её внедрения в свои сервисы и поддержке другими компаниями.

Японская Mutalk придумала микрофон для метавселенной — он надевается на рот и заглушает говорящего

Японская компания Shiftall предложила несколько странное с виду решение известной проблемы — громких разговоров в тихих помещениях. Устройство под названием Mutalk внешне напоминает гарнитуру виртуальной реальности, но надевается оно не на глаза, а на рот и не только работает как микрофон, но и заглушает речь человека.

 Источник изображений: shiftall.net

Источник изображений: shiftall.net

В основу работы гаджета лёг принцип резонанса Гельмгольца — явления, впервые описанного в середине XIX века. Во внутренней полости создаётся воздушный карман, препятствующий выходу звука вовне. Как утверждает производитель, Mutalk приглушает речь пользователя в среднем на 20 дБ или до 30 дБ при громком звуке. Проще говоря, даже находящийся в непосредственной близости человек не услышит, о чем говорит владелец устройства.

В качестве внешнего микрофона Mutalk подключается к смартфонам, планшетам и компьютерам под управлением популярнейших платформ через стандартный разъём для гарнитуры или по Bluetooth. Устройство оборудовано встроенным аккумулятором, который заряжается через порт USB-C и обеспечивает до 8 часов автономной работы.

На практике гаджет поможет проводить важные переговоры в публичных местах без опасения выдать коммерческую тайну случайным прохожим или посетителям кафе, а также подключаться к голосовым чатам в играх, не опасаясь разбудить домочадцев ночью. Mutalk также делает речь владельца более разборчивой, отсекая фоновый шум.

При коротком разговоре устройство можно просто прижать ко рту рукой, и встроенный сенсор автоматически отключит его, когда оно не используется. Если же разговор предстоит долгий, то Mutalk можно закрепить на голове при помощи пристяжного ремешка. Дешёвым гаджет быть не обещает — он поступит в продажу в ноябре или декабре по цене 19 900 японских иен или $139.

Персонализированный пространственный звук Apple оказался продвинутым аналогом технологии Sony

Одним из интересных нововведений мобильной iOS 16 стала технология персонализированного пространственного звука: пользователь может создавать личный звуковой профиль, основанный на индивидуальных особенностях его органов слуха, и пространственное звучание наушников AirPods станет оптимальным.

 Источник изображения: apple.com

Источник изображения: apple.com

Создание индивидуального профиля предусматривает целую процедуру, включающую сканирование ушных раковин при помощи фронтальной камеры TrueDepth: нужно около минуты удерживать iPhone на расстоянии 10–20 см. Однако до Apple подобную идею предложила Sony. В 2019 году японский производитель выпустил на рынок технологию 360 Reality Audio совместно с поддерживающими её музыкальными сервисами Amazon Music, Tidal, Deezer и Nugs.net. Идея действительно очень похожая: сканирование структуры ушной раковины и настройка пространственной обработки звука, исходя из физиологических особенностей пользователя.

Создание индивидуального профиля для работы технологии Sony 360 Reality Audio предполагает более трудоёмкий процесс в сравнении с решением Apple. Кроме того, в последнем случае персонализированный пространственный звук создаётся силами iOS, а Sony для этого предлагает установить приложение Headphones Connect и использовать камеру телефона. Apple использует как будто более подходящий для этих целей сенсор глубины TrueDepth, однако на протяжении всего периода бета-тестирования iOS 16 пользователи соцсетей жаловались, что процесс иногда затягивается, и ухо удаётся обнаружить не всегда.

Созданный владельцем iPhone индивидуальный звуковой профиль впоследствии будет доступен на многих устройствах экосистемы Apple после выхода обновлённых macOS и iPadOS. Технология совместима с AirPods третьего поколения, с AirPods Pro обоих поколений, а также с AirPods Max.

Sennheiser представила Ambeo Soundbar — первую в мире звуковую панель формата 7.1.4

Компания Sennheiser анонсировала звуковую панель Ambeo Soundbar Plus, позволяющую сформировать качественный объёмный звук с глубоким эффектом погружения. Новинка призвана заменить многокомпонентную акустику в домашних кинотеатрах. К тому же, Sennheiser называет устройство первым в мире самостоятельным саундбаром формата 7.1.4.

 Источник изображений: Sennheiser

Источник изображений: Sennheiser

В новинке реализована поддержка таких технологий, как Dolby Atmos, DTS:X и MPEG-H Audio. Четыре встроенных микрофона позволяют автоматически подстраиваться под конфигурацию помещения. Функция Voice Enhancement улучшает слышимость диалогов, кроме того, имеется ночной режим Night Mode.

В конструкцию включены девять усилителей класса D, семь 2-дюймовых полнодиапазонных динамиков и два 4-дюймовых сабвуфера. Суммарная мощность достигает 400 Вт (RMS). Диапазон воспроизводимых частот простирается от 38 Гц до 20 кГц.

В арсенале панели — один разъём HDMI 2.1 и два HDMI 2.0a, интерфейс S/PDIF, порт USB Type-A, аудиогнёзда типа «тюльпаны», а также разъём RJ45 для подключения сетевого Ethernet-кабеля. Поддерживается беспроводная связь Wi-Fi 802.11 a/b/g/n/ac/ax в диапазонах 2,4/5 ГГц и Bluetooth 5.0 BLE. Габариты составляют 105,1 × 7,7 × 12,1 мм, вес — 6,3 кг.

Звуковая панель Ambeo Soundbar Plus оценена примерно в 1500 долларов США. Более подробную информацию об устройстве можно найти здесь.

Разработан мессенджер AquaApp для общения под водой — он работает на звуковых волнах

Инженеры Вашингтонского университета (США) разработали приложение, которое позволяет общаться под водой. Мобильная связь на глубине по естественным причинам недоступна, поэтому приложение работает при помощи звуковых волн — оно обязательно пригодится как любителям, так и профессионалам.

 Источник изображения: youtube.com

Источник изображения: youtube.com

Вода блокирует радиоволны, поэтому на глубине всего нескольких метров мобильные телефоны теряют подключение. Поэтому, например, подводным аппаратам нужен трос — он обеспечивает ещё и передачу данных. А вот звуковые волны в водной среде распространяются прекрасно, поэтому учёные из Лаборатории мобильного интеллекта при Вашингтонском университете под руководством аспиранта Туочао Чэня (Tuochao Chen) и профессора Шьяма Голлакоты (Shyam Gollakota) в качестве носителя сигнала для приложения AquaApp выбрали не радиоволны, а звук.

Сложного дополнительного оборудования не требуется: приложение прекрасно работает с микрофонами и динамиками, которые используются на мобильных телефонах и смарт-часах, поэтому достаточно будет водонепроницаемого кейса, способного работать на нужной глубине. К сожалению, одного только преобразования сигнала в звуковую волну для работы системы оказалось недостаточно, потому что условия приёма и передачи сигнала постоянно меняются в зависимости от расстояния между двумя абонентами и других внешних обстоятельств. Сигнал может сильно меняться, отражаясь от поверхности воды, дна и береговой линии, а дополнительные помехи могут вносить волны, люди и другие объекты. Поэтому авторам пришлось сделать систему адаптивной.

При установке первичного контакта между смартфонами используется калибровочный сигнал, который два устройства смогут услышать с высокой вероятностью. Принимающее сигнал устройство производит замер его характеристик и сообщает отправителю об искажениях, чтобы тот перенастроился на более стабильную в данных условиях волну.

В ходе полевых испытаний на озёрах и в некоем заливе авторы проекта удостоверились, что их приложение способно обеспечивать надёжный обмен данными на расстоянии более 100 м — конечно же, с невысоким битрейтом, но вполне достаточным качеством, чтобы заменить традиционные у дайверов жесты. Приложение AquaApp распространяется бесплатно: его исходный код доступен на GitHub.

SteelSeries выпустила аудиосистемы Arena для игровых компьютеров

Компания SteelSeries анонсировала акустические системы Arena 3, Arena 7 и Arena 9, которые могут использоваться с игровыми компьютерами, мобильными гаджетами и другими устройствами.

 Источник изображений: SteelSeries

Источник изображений: SteelSeries

Младшая из новинок, Arena 3, представляет собой двухканальное решение. В комплект входят колонки с 4-дюймовыми динамиками, обеспечивающими диапазон частот от 50 Гц до 20 кГц. Для подключения источников сигнала предусмотрены два стандартных аудиогнезда на 3,5 мм. Кроме того, поддерживается обмен данными посредством беспроводной связи Bluetooth 4.2.

Ступенью выше располагается система Arena 7 формата 2.1. В её состав входят две колонки, оснащённые 3-дюймовыми динамиками и 0,75-дюймовыми твитерами, а также 6,5-дюймовый сабвуфер. Диапазон воспроизводимых частот — от 35 Гц до 20 кГц. Предусмотрены порт USB, 3,5-мм аудиогнездо и оптический интерфейс. Имеется контроллер Bluetooth 4.2 для подключения мобильных устройств. Колонки наделены многоцветной подсветкой.

Наиболее дорогая модель Arena 9 обеспечивает звук формата 5.1. Она включает фронтальные колонки и сабвуфер, аналогичные версии Arena 7. В комплект также входят беспроводные тыловые колонки с 2,75-дюймовыми динамиками и 0,75-дюймовыми твитерами. Центральная колонка содержит два 2,75-дюймовых излучателя и 0,75-дюймовый твитер. Диапазон воспроизводимых частот простирается от 35 Гц до 20 кГц. Имеется многоцветная подсветка.

Цена Arena 3, Arena 7 и Arena 9 составляет соответственно 150, 330 и 600 евро.

Учёные NASA записали ужасающий звук чёрной дыры

Национальное управление по воздухоплаванию и исследованию космического пространства США (NASA) обнародовало аудиоклип (ниже), содержащий настоящие звуки космоса — а именно, жутковатые завывания, исходящие от чёрной дыры.

 Источник изображения: NASA

Источник изображения: NASA

Издающий такие звуки объект располагается в «сердце» Скопления Персея на расстоянии приблизительно 250 млн световых лет от нас. Это скопление галактик в созвездии Персея — одна из самых массивных структур во Вселенной, содержащая тысячи галактик в огромном облаке газа температурой в миллионы градусов.

«Заблуждение о том, что в космосе нет звуков, возникает из-за того, что основная часть космического пространства представляет собой вакуум, в котором звуковые волны не могут распространяться. В скоплении галактик так много газа, что мы смогли уловить реальные звуки», — говорят специалисты NASA.

Сигналы, исходящие от чёрной дыры, были получены рентгеновским телескопом «Чандра» (Chandra X-ray Observatory) ещё в 2003 году. Однако до сих пор их не удавалось сделать слышимыми для человеческого уха. Для решения задачи исследователи выполнили сложную процедуру преобразования. В частности, тональность была повышена на 57 и 58 октав. В результате, удалось сформировать аудиоклип продолжительностью около полуминуты, позволяющий буквально услышать чёрную дыру. Многие пользователи говорят, что звук вполне мог бы стать саундтреком к фильму ужасов.

Microsoft рассказала о песне, которая выводила из строя некоторые ноутбуки

Представитель Microsoft поделился в блоге компании историей, с которой столкнулся его знакомый из технической поддержки операционной системы Windows XP. Один из производителей ноутбуков обнаружил, что при воспроизведении песни Rhythm Nation популярной американской певицы Джанет Джексон (Janet Jackson) определённые модели мобильных ПК выходили из строя.

 Источник изображения: Neowin

Источник изображения: Neowin

В ходе расследования этого случая было также установлено, что сбоили не только ноутбуки, на которых запускалась эта песня, но даже те лэптопы, которые в этот момент просто находились рядом с ноутбуком, на котором она воспроизводилась.

В конечном итоге было установлено, что причиной сбоев являлись звуковые частоты, содержащиеся в мелодии песни. Они резонировали с некоторыми моделями жёстких дисков, работающих на скорости 5400 об/мин. К сожалению, представитель Microsoft не рассказал, о каких именно частотах идёт речь. Обычно жёсткие диски вибрируют с частотой между 0 и 5000 Гц, хотя иногда наблюдаются определённые пики на частотах 12,5, 87,5, 1100, 1450, 1700 и 1850 Гц.

Производитель ноутбуков, о котором идёт речь, решил эту проблему путём использования в аудиокодеке фильтра, который определял и отсеивал нежелательные частоты во время воспроизведения звука.

Американским владельцам электромобилей не разрешат выбирать звук оповещения пешеходов

После консультаций с общественностью американское Национальное управление безопасностью движения на трассах (NHTSA) отклонило предложение, согласно которому владельцы электромобилей получили бы возможность выбирать звук, оповещающий пешеходов о приближении тихой машины.

 Источник изображения: tesla.com

Источник изображения: tesla.com

Электромобиль действительно производит меньше шума, чем транспортное средство с двигателем внутреннего сгорания, и это риск для безопасности пешеходов. В 2019 году в NHTSA поступило предложение разрешить владельцам электромобилей самостоятельно выбирать «рингтон» для своей машины, однако теперь ведомство решило это предложение отклонить.

Действующий в США Федеральный стандарт безопасности транспортных средств №141 требует, чтобы электромобили издавали звуковой сигнал для пешеходов при движении на парковке, движении задним ходом и движении вперёд со скоростью до 30 км/ч — при большей скорости необходимость в этом отпадает из-за шума, создаваемого шинами и воздушным потоком.

На этапе формирования нормативно-правовой базы две отраслевые группы, представляющие интересы автопроизводителей, предложили сделать звук настраиваемым и заявили, что эта опция может стать одной из определяющих при выборе машины покупателем. А вот в Американском совете слепых к вопросу подошли исключительно с практической точки зрения, подчеркнув, что «в звуке должно узнаваться транспортное средство, в идеале звук двигателя».

Около полугода назад Tesla была вынуждена по предписанию NHTSA объявить об отзыве 578 607 машин из-за функции Boombox, которая позволяла выводить на внешний динамик для оповещения любые звуки. Функция была отключена с очередным обновлением ПО.

Беспроводные наушники ждёт революция — принят стандарт Bluetooth LE Audio, который увеличит автономность и не только

Технология Bluetooth LE Audio была анонсирована ещё в начале 2020 года. Появление первых устройств на рынке с её поддержкой ожидалось до конца того же года. К сожалению, процесс стандартизации и сертификации LE Audio организацией Bluetooth SIG занял больше времени, чем ожидалось. Ещё и пандемия коронавируса помешала. Однако сегодня Bluetooth SIG заявила, что всё готово и нас ждёт своего рода революция в беспроводных наушниках.

 Источник изображения: Bluetooth SIG

Источник изображений: Bluetooth SIG

В Bluetooth SIG уверены, что крупнейшие производители выпустят новое поколение беспроводных наушников с поддержкой нового стандарта передачи данных Bluetooth LE Audio до конца 2022-го, так как перечень преимуществ у новой технологии весьма внушительный.

Важнейшим компонентом Bluetooth LE Audio является новейший кодек LC3. Он разработан специально для более эффективной беспроводной передачи аудио. Здесь предлагается два варианта. Либо намного более высокое качество звучания при том же битрейте, что и у текущего кодека SBC, либо по прежнему лучшее качество звука, пусть и не сильно, при вдвое более низком битрейте. При этом во втором случае снижается и энергопотребление, что приведёт к повышению длительности автономной работы аккумулятора гаджетов.

Другой ключевой особенностью Bluetooth LE Audio является поддержка беспроводного соединения с источником сигнала для каждого отдельного наушника, что должно заметно улучшить их работу. Частью Bluetooth LE Audio также является функция Auracast, которая позволяет подключать к источнику сигнала неограниченное количество устройств. Более подробно о ней рассказывалось ещё в прошлом месяце. Она позволяет подключать, например, две пары беспроводных наушников к одному смартфону для прослушивания музыки, запускать трансляции в общественных местах или подключать пользователей к контенту в тренажёрном зале без дополнительного оборудования.

Netflix сделала пространственный звук доступным на любых устройствах

Стриминговая платформа Netflix объявила, что сделала пространственный звук доступным для всех устройств — его поддержка добавлена для множества фильмов и сериалов от самой Netflix, в том числе в четвёртый сезон сериала «Очень странные дела», сериалы «Ведьмак» и «Лок и ключ», фильмов «Проект Адам» и «Красное уведомление», а также других работ.

 Источник изображения: netflix.com

Источник изображения: netflix.com

Технологии пространственного аудио предназначены для обеспечения звучания, максимально приближенного к тому, что есть в кинотеатрах. Чтобы найти поддерживающие опцию фильмы и сериалы, достаточно ввести запрос «пространственное аудио» в поисковую строку платформы. Число наименований будет зависеть от устройства, на котором запущено приложение Netflix, но опция будет работать даже там, где обычно подобные функции не поддерживаются, и от используемого тарифа его присутствие не зависит.

Для реализации пространственного звука Netflix лицензировала у Sennheiser технологию AMBEO — она обеспечивает данную возможность на любой стандартной двухканальной акустике без необходимости устанавливать дополнительные динамики.

Платформа также уточнила, что для получения пространственного звука владельцам iPhone, iPad и Apple TV нужно установить качество трансляции на «Высокое» или «Авто». А вот для обладателей AirPods третьего поколения, AirPods Pro, AirPods Max и Beats Fit Pro не изменится ничего — поддержка функции была доступна и прежде.


window-new
Soft
Hard
Тренды 🔥
«Теперь у меня нет оправданий, чтобы не пройти игру и все DLC»: новый мод позволит сыграть в The Witcher 3 за чародейку со своей боевой системой 5 мин.
Создатели «Смуты» взялись за работу над прототипами новых игр 2 ч.
«Невероятно многообещающе»: блогер показал геймплей мультиплеерного мода в духе GTA Online для Cyberpunk 2077 2 ч.
Бывший эксперт AMD по трассировке лучей поможет сделать компьютерные чипы Qualcomm пригодными для игр 2 ч.
Аниматор «засветил» неанонсированный ремейк от издателя Borderlands, BioShock и Mafia — фанаты теряются в догадках 3 ч.
Microsoft добавила в «Блокнот» проверку орфографии и автокоррекцию — через 40 лет после релиза 4 ч.
Telegram оштрафовали на 3 млн рублей за неудаление запрещённой в РФ информации 6 ч.
Google придумала, как в 13 раз ускорить обучение ИИ и снизить потребление энергии в 10 раз 7 ч.
Replaced порадует фанатов «проработанных мрачных миров и крутых стильных боёв» — ретрофутуристический экшен-платформер впечатлил журналистов 8 ч.
Олдскульный файтинг Blazing Strike в духе Super Street Fighter 2 Turbo и Fatal Fury спустя девять лет разработки получил дату выхода — игру делает один человек 9 ч.
Google отказалась от углеродно-нейтрального статуса ради достижения реальных нулевых выбросов к 2030 году 3 ч.
Samsung рассказала об обновлённом датчике BioActive для будущих смарт-часов Galaxy Watch 3 ч.
Космический телескоп NASA NEOWISE для фотоохоты на астероиды скоро завершит работу и сгорит в атмосфере 3 ч.
«Лаборатория Касперского» представила единое решение для построения безопасных распределённых промышленных сетей 4 ч.
В России многократно выросли продажи отечественных мониторов, но доминирует на рынке Acer 5 ч.
Всего за год «Сбер» захватил 5,2 % российского рынка телевизоров и обогнал «Яндекс» 7 ч.
Nothing представила круглые смарт-часы CMF Watch Pro 2 со сменными безелями за $69 8 ч.
Nothing представила CMF Phone 1 — бюджетный смартфон со сменными крышками и Dimensity 7300 9 ч.
Маркетплейсы стали основным местом покупки смартфонов в России 10 ч.
Oracle запустила второй облачный регион в Сингапуре 10 ч.