Вы когда-нибудь задумывались, как Shazam «слышит» музыку, которую вы играете, и идентифицирует ее с такой точностью? Что ж, вы не одиноки.
Технология, лежащая в основе сервиса распознавания музыки, остается загадкой для многих, особенно с тех пор, как сервис был запущен за много лет до того, как смартфоны и машинное обучение стали реальностью.
В этой статье мы рассмотрим, как работает Shazam и как он может точно распознавать музыку.
Что такое Shazam?
Shazam - популярное приложение для распознавания музыки, которое можно использовать для поиска информации о новой песне, которую вы любите, но не знаете названия или имени исполнителя.
Допустим, вы находитесь в кофейне или прогуливаетесь по магазину на углу и слышите новую песню, которую хотели бы добавить в свою музыкальную библиотеку. Shazam поможет вам легко найти песню. Все, что вам нужно сделать, это записать несколько секунд песни в приложении.
Приложение Shazam использует сложную технологию распознавания звука, чтобы идентифицировать музыку, которую вы слышите, за считанные секунды. секунд, чтобы вы могли узнать имя исполнителя и трек, посмотреть видео и даже купить или транслировать песню на своем устройство.
Скачать: Shazam для iOS |Android (Свободный)
Как работает Shazam?
Изображение 1 из 4
Изображение 2 из 4
Изображение 3 из 4
Изображение 4 из 4
Shazam использует запатентованную технологию, разработанную Эйвери Лин-Чун Ван, соучредителем приложения и главным специалистом по обработке данных, для определения совпадений для песен, запрошенных на его платформе. Эта технология создает отпечатки пальцев для аудиозаписей, что является секретом потрясающих навыков распознавания Shazam.
Shazam создает и хранит аудио-отпечатки пальцев, состоящие из наборов числовых данных для каждой из более чем 15 миллиардов песен. Когда пользователь "Shazam" песня, Shazam быстро создает звуковой отпечаток звука, полученного со смартфона или микрофона ПК.
После создания звукового отпечатка для записи Shazam загружает звуковой отпечаток (не звук) на свой сервер, где выполняет поиск совпадений в базе данных. Если совпадение найдено, он возвращает информацию о песне с вариантами того, где транслировать или купить ее, а также идентифицирующую информацию.
Что такое звуковой отпечаток пальца?
Отпечаток аудиосигнала - это сжатая цифровая сводка аудиосигналов. Они используются для идентификации аудиофрагментов или для поиска похожих элементов в базе данных аудио.
Технология снятия отпечатков пальцев Shazam может сопоставлять немаркированные фрагменты аудиоконтента с соответствующими совпадениями в своей базе аудиоданных. Shazam идентифицирует название записанной вами песни (немаркированный аудиоконтент), сопоставляя отпечаток песни с отпечатком песен в своей базе данных.
Shazam создает уникальные отпечатки пальцев для песен в своей базе данных, используя определенные точки данных, идентифицированные с помощью спектрограммы.
Что такое спектрограмма?
Спектрограмма - это трехмерный график, используемый для представления звука. Спектрограмма показывает изменение частот за период с учетом амплитуды или объема. На фото ниже показан пример чтения спектрограммы.
В интервью 2003 г. Scientific American, Avery Wang показал, что алгоритм Shazam использует точки спектрограммы, представляющие ноты с наивысшей энергией, для генерации звуковых отпечатков пальцев.
Игнорируя большую часть информации в песне и сосредотачиваясь только на нескольких определяющих нотах, Shazam может искать в своей базе данных и обеспечивать точные совпадения для запросов песен с невероятной скоростью.
Как Shazam распознает песни в шумных местах?
Shazam использует записи песен без фонового шума и искажений для создания отпечатков пальцев для своей базы данных. Когда вы записываете песню с помощью приложения в шумном месте, оно создает звуковой отпечаток вашей записи, определяя ноты с наибольшей энергией на записи.
Затем он ищет в своей базе данных совпадения с отпечатками аудиофайлов вашей записи, при условии, что уровень фонового шума был недостаточно высоким, чтобы искажать данные, используемые для создания звука отпечаток пальца.
Времена, когда Shazam не может помочь вам определить песню
Shazam отлично подходит для сопоставления песен, даже если вы думаете, что малоизвестная музыка может отсутствовать в его базе данных. Но бывают ли моменты, когда Shazam не может определить трек?
Искаженная запись
Когда вы Shazam песни в месте, где уровень фонового шума слишком высок, шум искажает данные на спектрограмме. Из-за этого звуковой отпечаток вашей записи будет отличаться от отпечатка оригинальной песни.
Когда это произойдет, Shazam вернет Песня не известна диалог, потому что он не может найти соответствие звуковому отпечатку пальца.
Живая музыка
Shazam не может отличать музыку от живых выступлений. Это связано с тем, что звук, который вы записываете во время живых выступлений, часто отличается от исходной версии песни, которую Shazam использует для создания звуковых отпечатков пальцев.
Единственный способ, которым Shazam может идентифицировать песню во время живого выступления, - это если группа достаточно квалифицирована, чтобы исполнять песню в точности так, как она была записана. Удачи группе, которая пытается это сделать...
Ваша голосовая запись
«Могу ли я заставить Shazam распознавать песню, которую я пел, если бы я был действительно хорошим певцом?»
Короче нет.
Алгоритм Shazam может идентифицировать только предварительно записанную музыку. Чтобы Shazam смог идентифицировать песню, которую вы поете, вам нужно, чтобы вокал вместе с инструментальными партиями совпадал с темпом оригинальной записи песни.
Ваше жужжание
Shazam не может идентифицировать совпадения для мычания, потому что его алгоритм использует точные частоты и амплитуды для создания звуковых отпечатков для песен в своей базе данных.
Когда вы напеваете песню, Shazam создает для нее отпечаток пальца. Но поскольку гудение - это всего лишь попытка повторно синтезировать песню, алгоритм не сможет соответствовать записи.
Shazam - единственное приложение для идентификации музыки?
Shazam был первой службой идентификации музыки и в настоящее время является наиболее широко используемым приложением для идентификации песен. Однако есть другие приложения, которые можно использовать для идентификации песни играет вокруг вас. Некоторые даже могут определить песню, которую вы поете или напеваете.
Три самых популярных альтернативы Shazam - это SoundHound, Musixmatch Lyrics и Genius. Musixmatch и Genius в первую очередь помогают вам находить тексты для музыки, которая играет вокруг вас, а SoundHound - ближайший конкурент Shazam.
Связанный: Лучшие приложения для распознавания музыки для поиска песен по их мелодии
Вы можете использовать приложение SoundHound, чтобы делать практически все, что делает Shazam. Его основным преимуществом перед Shazam является то, что он имеет дополнительную функцию определения песен, которые вы поете или напеваете.
Кредит изображения: Суластри Суластри / Shutterstock.com
Хотите знать, как определить песню из видео на YouTube? Вот пошаговое руководство по поиску песен на YouTube, чтобы определить музыку из видео.
Читать далее
- Объяснение технологии
- Shazam
- Музыкальное открытие
- SoundHound
- Musixmatch
Джон - любитель технологий по рождению, создатель цифрового контента по образованию и автор статей о стиле жизни по профессии. Джон верит в помощь людям в решении проблем, и он пишет статьи, посвященные именно этому.
Подписывайтесь на нашу новостную рассылку
Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!
Еще один шаг…!
Пожалуйста, подтвердите свой адрес электронной почты в электронном письме, которое мы вам только что отправили.