Исследователи из Университета Карнеги-Меллона разработали систему для взаимодействия с интеллектуальными динамиками и другими устройствами с голосовым управлением без использования слов для пробуждения.
Система, основанная на машинном обучении, может стать основой для безопасной альтернативы постоянным помощникам по дому.
Как работает новая система?
Новые результаты были опубликованы в исследовательская работа [PDF] исследовательской группой из четырех человек, которые также предоставили видео, объясняющее, как может функционировать новая модель.
Исследование сосредоточено на Направление голоса, метод, который определяет как позицию, так и угол, откуда исходит речь. Это отличается от современных интеллектуальных устройств, которые, как правило, сосредотачиваются только на исходной позиции звука.
Текущий подход также основан на конкретном пробуждающем слове, поэтому изменение слова пробуждения Алексы на что-то другое только дает вам еще один или два варианта.
Мы изучаем, как изменить слово пробуждения на любом устройстве Amazon Alexa.
Когда человек говорит, его голос создает эхо по комнате, которое в разное время достигает умного динамика. Анализируя время, громкость и частотный спектр звука, издаваемого каждым отраженным эхом, новый Система может предсказать, говорит ли пользователь в направлении смарт-объекта или смотрит в сторону от него.
Наряду с исследовательской работой команда также предоставила Ссылка на GitHub к набору данных, используемому для обучения нейронной сети. 11520 уникальных фраз в наборе данных было достаточно, чтобы научить умного динамика предсказывать угол, под которым смотрит пользователь, с точностью до 90 градусов.
Вычисления, необходимые для определения направления, достаточно легкие, чтобы их можно было выполнять на устройстве локально без подключения к удаленному серверу. Исследовательская группа, стоящая за новыми выводами, надеется, что этот подход позволит более гибко взаимодействовать со смарт-устройствами и предложит пользователям большую конфиденциальность, чем облачные альтернативы.
Нет графика того, когда эта технология может появиться для публичного использования, но есть фундамент для того, чтобы в конечном итоге отменить необходимость в словах для пробуждения. Когда вам больше не нужно называть умную колонку по имени, действительно ли она нужна? Может Алекса знает ответ.
Конец персонифицированным домашним помощникам?
Хотя это исследование открывает новые захватывающие возможности для взаимодействия со смарт-устройствами, вряд ли оно полностью заменит слова для пробуждения. В конце концов, одним из основных достоинств умных динамиков является то, что вы можете взаимодействовать с ними только голосом, одновременно выполняя другие задачи.
Возможно, это обещает будущее, в котором несколько интеллектуальных устройств можно будет использовать в одном пространстве. Вместо того, чтобы будить каждое интеллектуальное устройство в пределах слышимости, вы можете попросить одно устройство незаметно предоставить вам прогноз погоды.
Пока еще рано, но такие технологии могут сделать беспрепятственное взаимодействие человека и компьютера в научной фантастике реальностью в не столь отдаленном будущем.
Алгоритмы машинного обучения призваны облегчить жизнь и улучшить системы, но они могут пойти наперекосяк с плохими последствиями.
- Умный дом
- Новости техники
- Голосовые команды
- Алекса
- Умный динамик
- Машинное обучение
Ян Бакли - независимый журналист, музыкант, исполнитель и видеопродюсер, живущий в Берлине, Германия. Когда он не пишет или на сцене, он возится с электроникой или кодом своими руками в надежде стать безумным ученым.
Подписывайтесь на нашу новостную рассылку
Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!
Еще один шаг…!
Пожалуйста, подтвердите свой адрес электронной почты в электронном письме, которое мы вам только что отправили.