Реклама
Недавно я работал над историей о человеке, который сделал телефонный звонок, который был записан. Позже этот человек отказался признать, что он вообще звонил.
С записанным голосом из телефонного звонка и клипом человека, который отрицает обвинение, я принялся за работу, пытаясь найти способ доказать, что голоса были одинаковыми.
Я признаю, что я немного помешан на голосовых технологиях. Вот почему я ждал Гугл голос Как использовать Google Voice для блога по телефону Прочитайте больше стать более продвинутым благодаря своей технологии распознавания голоса, и именно поэтому мне нравятся приложения для голосового управления на ПК как Тазти Включите речевое и текстовое управление голосом, настроив распознавание речи в WindowsРаспознавание речи остается более мощным, чем Кортана. Он переводит речь в текст и голосовое управление. Эта статья покажет вам, на что способно распознавание речи, как его настроить, обучить и использовать. Прочитайте больше . Однако, когда дело доходит до цифрового сравнения голосов, я был в недоумении. Вы, наверное, видели те шпионские фильмы, где компьютер может автоматически идентифицировать голос известного преступника только с помощью голосовой печати.
Если честно, когда я обнаружил Sonogram Visible Speech, я понял, что голосовая технология спектрограммы фактически является в настоящее время жизнеспособный способ надежно идентифицировать человека по одному их голосу.
Понимание Спектрограммы
Если вы знаете о химических изотопах, то вы знаете, что с помощью изотопов химики могут определить химический состав соединения путем выделения основных элементов и использования разбивки для определения отдельных компонентов любого смесь. Во многом таким же образом аудиограмма разбивает звуковой звук на основные частоты. Интересно, что в человеческом голосе никто не говорит на одной частоте. Ваш рот, носовые проходы и структура вашего голосового окна определяют сочетание частот, которые составляют ваш несколько уникальный голос.
Sonogram Visible Speech - это бесплатное программное приложение для спектрограммы, которое принимает видео или аудио файлы и прерывает их вниз звуковую дорожку во весь спектр - все его частоты в течение всего периода времени отслеживать. Завершенная спектрограмма выглядит как на рисунке ниже.

Как вы можете видеть, нижняя дорожка выглядит как основная звуковая волна, которую вы видите в такой программе, как дерзость 3 Audacity Советы, чтобы улучшить ваши записанные интервьюЧистый звук жизненно важен для любого подкаста или записи, которую вы хотите опубликовать. Повысьте качество звука с Audacity за три простых шага. Прочитайте больше Однако на центральной панели отображается каждый сегмент звукового файла во всей его частотной разметке. Удивительной особенностью этого программного обеспечения является то, что есть много других форм сигналов, которые вы можете использовать для проверки вашего звукового файла. Это специально для продвинутых пользователей.

Вы можете настроить отображение каждой из этих волновых форм, перейдя в меню «Параметры» и выбрав «Общие». Регулировка «. Здесь вы можете определить, как логарифмические графики рассчитывают выход и общую настройку отображения всех доступных графики.

Если звук довольно тихий или анализируемый вами голос является шепотом, вы можете использовать логарифмический дисплей частоты. Вы включаете его из меню «Опции» и выбираете «Логарифмическая частота». Это несколько увеличит значимые области частот на спектрограмме.

Это действительно может помочь определить четкие частотные шаблоны, которые идентифицируют кого-то по звуку их голоса. Если вы полностью потерялись и не знаете, с чего начать, нажмите «Справка» и перейдите к «Онлайн-справке», чтобы открыть очень хорошо написанное руководство по интерактивной справке Sonogram. Это отличное место для начала, если вы новичок в анализе аудиограмм спектрограмм.

Эксперимент со спектрограммами с использованием призрачной охоты
Прелесть этого программного обеспечения в том, что оно хорошо подходит для различных целей. Один из артефактов, который часто возникает при охоте на призраков, мой личный интерес, это «Феномен электронного голоса» - когда якобы появляется голос призрака или призрака на аудио записи. Эти записи разбросаны по всей сети, поэтому я решил снять несколько сайтов с охотниками за призраками и провести анализ спектрограмм.

Спектрограмма показывает, что частоты голоса, как правило, низкие, но чтобы получить лучшее представление о голосах в записи, вам необходимо открыть дополнительные сигналы. Представление автокорреляции вычисляет «высоту тона» во временном интервале, в котором вы наводите мышь.

«Призрак» имеет среднюю частоту основного тона около 129,0 Гц. Прокрутка до конца записи, где вы слышите голос следователя, рассчитанный шаг частота составляет около 208,0 Гц (что имеет смысл, потому что это женский голос и звук призрака записи мужской.)

Открытие дисплея быстрого Фурье раскрывает еще больше деталей о голосах. Эта диаграмма быстро разбивает основные частоты и отображает их в цветовой код.

В этом случае разбивка частот разбросана по частям, с некоторым высоким, но хорошим количеством низких частот в миксе. Тем не менее, исследователь в комнате четко говорит голосом, который сгруппирован по частоте ближе к верхнему пределу диапазона, как показано здесь.

Этот быстрый анализ показал, что два голоса совершенно разные, но это только основной пример возможностей этого мощного программного обеспечения. В принципе, любая ситуация, в которой может помочь разбивка частот звуковой волны, - это программное обеспечение для вас. Его легко освоить, быстро настроить и настроить, и он работает так же или лучше, чем любое платное программное обеспечение спектрограмм на рынке.
Есть ли у вас проекты, которые могли бы использовать спектрограмму? Вы когда-нибудь пробовали сонограмму Visible Speech? Поделитесь своим пониманием в разделе комментариев ниже.
Райан имеет степень бакалавра в области электротехники. Он 13 лет проработал в области автоматизации, 5 лет - в сфере информационных технологий, а сейчас является инженером приложений. Бывший управляющий редактор MakeUseOf, он выступал на национальных конференциях по визуализации данных и был представлен на национальном телевидении и радио.