Вы, наверное, видели приложения, которые утверждают, что переводят то, что говорит ваша кошка. Но могут ли они действительно перевести мяуканье вашей кошки на английский язык? Короткий ответ - да, вроде как. Это сложно из-за того, насколько уникален «язык» каждой кошки, но они могут довольно близко познакомиться с современными технологиями.
Приложения для кошачьего перевода, такие как MeowTalk, используют форму распознавания речи с упором на машинное обучение. Посмотрим поближе.
Распознавание речи и машинное обучение
Распознавание речи работает путем записи речи и преобразования звука в файл цифровых данных. Он кодирует такие данные, как высота звука и громкость, как точки данных, которые приложение может анализировать и сопоставлять со значениями. Микрофоны DPA объясняет, что эти точки данных могут выглядеть по-разному в зависимости от фоновых звуков и того, как произносится слово.
Иногда мы воспринимаем распознавание голоса как должное, но это невероятный технологический подвиг. Особенно учитывая сложность человеческой речи. В качестве
Ученый объясняет, что каждое слово включает в себя широкий спектр звуков или «фонем», смешанных друг с другом. Заставить компьютер понимать речь очень сложно. Новый рубеж кошачьих звуков будет еще сложнее.Приложения, использующие распознавание речи, запрограммированы с использованием «словаря» слов, называемого набором данных. Затем приложение сопоставляет вашу речь с ближайшим вариантом в своем словаре данных.
Когда он делает ошибку, вы ее исправляете, и он сохраняет эти данные для следующего раза. Это часть машинного обучения. Так программа учится распознавать речь, даже если она не совпадает с набором данных, с которого она была запущена.
Связанный: Что такое алгоритмы машинного обучения? Вот как они работают
Распознавание голоса по-прежнему имеет проблемы, особенно с дефектами речи и акцентами. Некоторые компании улучшение машинного обучения для решения этих проблем, хотя. Со временем машинное обучение может превратить распознавание речи в мощный инструмент.
Вот как работает распознавание речи у людей. Но работает ли это для кошек?
Распознавание речи vs. Распознавание мяу
Во-первых, нам нужно понять, почему перевод определенного типа мяуканья как «Я голоден» отличается от анализа человеческой речи. Проблема в основном в том, что кошачье общение в большей степени зависит от невербальных сигналов, таких как осанка. Еще одна проблема - отсутствие универсального «кошачьего языка».
Согласно ASPCAВзрослые дикие кошки никогда не мяукают друг на друга, только на людей. Другое исследование Гуманное общество добавляет, что эти звуки «не возникают в вакууме». Мы должны интерпретировать их вместе с языком тела и другими контекстами. Во многих случаях эти тихие сигналы - единственное различие между мяуканью, означающим «Я голоден», и «Я хочу поиграть».
В дополнение к этой проблеме, нет двух кошек, говорящих на одном языке. Кошки развивают для своих владельцев индивидуальные «языки». Частично они основаны на имитации голоса хозяина, а частично - на личности кошки. Никакие две кошки не звучат одинаково, даже когда выражают одно и то же желание или потребность. Так как же можно перевести словарный запас одного приложения для всех?
Гибкое машинное обучение для кошек
Хотя некоторым виртуальным помощникам нравится Ото попытка понять тон и эмоции, распознавание речи все еще ужасно для невербальных сигналов. Но это не значит, что их невозможно интерпретировать.
MeowTalk использует более гибкий вид машинного обучения, чтобы помочь преодолеть эти проблемы.
Скачать: MeowTalk для Android | iOS (Свободный)
Meowtalk был создан Хавьером Санчесом, который также работал в команде Alexa. Он представлял приложение как шаг к умным ошейникам. Эти ошейники переводят звуки кошек в человеческую речь, используя сложные стратегии машинного обучения, чтобы помочь людям лучше понимать своих кошек и заботиться о них.
Команда MeowTalk компенсировала проблемы с уникальностью, создав более конкретные профили для каждой кошки. В приложении вы регистрируете каждую кошку отдельно. Наука Норвегия сообщает, что котята мяукают иначе, чем взрослые кошки, поэтому приложение также запрашивает день рождения кошки. Каждый профиль создает для кошки уникальную сеть передачи данных, включающую в себя немного глубокого обучения в машинном обучении.
Связанный: Глубокое обучение vs. Машинное обучение vs. AI: Как они сочетаются?
Что касается словарного запаса, MeowTalk начинается с 10 звуковых профилей в своем наборе данных. Каждому из них придается разное значение, например, «счастливый» или «охота». Когда приложение слышит звук и ошибается, вы можете исправить его или создать новую интерпретацию.
Исправление говорит приложению заменить базовый словарь новым звуком.
Например, вы можете указать приложению, чтобы оно соответствовало «Охоте» короткому щебетанию вместо долгого вопля. Этот вид исправления более полезен, чем добавление нескольких звуков для соответствия одному значению, как распознавание речи, что было бы похоже на сообщение приложению, что длинный вой и короткий щебет обе означает «Зов Матери».
Машинное обучение в приложениях для распознавания речи обычно сопротивляется такому типу перезаписи. Это все равно что пытаться научить Siri, что когда вы говорите «блог о технологиях», вы на самом деле имеете в виду «груша». Но более гибкая форма машинного обучения, которую использует MeowTalk, может лучше справиться с этой коррекцией. с легкостью.
Создание новой интерпретации добавляет смысл, который ранее не кодировался. Например, если у вашей кошки особый звонок, когда она хочет свою любимую игрушку, вы можете добавить в качестве опции «Я хочу свою мышь». Это похоже на добавление слова в словарь автозамены.
Связанный: Как определить свои собственные слова автозамены на Android
Со временем вы сможете разработать индивидуальный речевой профиль для своей кошки. В конце концов, он может быть даже достаточно сложным, чтобы быть полезным для домашних питомцев или для решения поведенческих проблем. По крайней мере, это помогает владельцам кошек стать более внимательными к своим питомцам.
Вердикт: работают ли приложения для перевода Cat?
В конце концов, «кошачий перевод» по-прежнему во многом зависит от того, как пользователь научит приложение тому, как разговаривает их кот. Вероятно, так будет всегда из-за того, насколько уникально общение каждой кошки.
Но тот факт, что машинное обучение зашло так далеко, что разработчики могут даже частично преуспеть в этом, невероятен. Машинное обучение и ИИ развиваются с головокружительной скоростью, и нам не терпится увидеть, куда они пойдут дальше.
- Объяснение технологии
- Изучение языка
- Машинное обучение
Натали Стюарт - писатель MakeUseOf. Впервые она заинтересовалась технологиями в колледже, а в университете увлеклась писательством для СМИ. Натали сосредоточена на доступных и простых в использовании технологиях, и ей нравятся приложения и устройства, которые упрощают жизнь обычным людям.
Подписывайтесь на нашу новостную рассылку
Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!
Еще один шаг…!
Пожалуйста, подтвердите свой адрес электронной почты в электронном письме, которое мы вам только что отправили.