Быстрое распространение чат-ботов с искусственным интеллектом почти в равной степени вызвало этические проблемы, волнения и проблемы с трудоустройством. Но неужели ставки снова поднимутся?
Если у этих инструментов и есть ахиллесова пята, так это неспособность учитывать человеческие эмоции в ответах. Однако с достижениями в области «эмоционального ИИ» вполне возможно, что мы станем свидетелями еще одного огромного скачка вперед в технологии ИИ.
Эмоциональная проблема
Понимание человеческих эмоций может быть сложным, даже для людей. Несмотря на то, что это то, чему мы начинаем учиться с рождения, мы все еще можем часто неправильно истолковывать чужие эмоции. Обучить машины навыкам, которыми люди не овладели, — огромная проблема.
Тем не менее, область эмоционального ИИ, также известная как аффективные вычисления, делает заметные успехи. Чтобы понять, как работает эмоциональный ИИ, важно сравнить его с тем, как люди интерпретируют эмоции других. Процесс можно разделить на три основных направления:
- Выражение лица/манеризмы: Кто-то сияет, как Чеширский кот, это очевидно. Но как насчет слез? Это могут быть слезы радости или печали. Кроме того, есть тонкости и мимолетные выражения, которые мы едва замечаем, но которые дают вам подсознательные подсказки об эмоциях других.
- Язык тела: Опять же, здесь есть много подсказок, которые люди почти подсознательно используют для определения эмоциональных состояний.
- Голосовая интонация: тон и интонация голоса могут быть сильным индикатором эмоционального состояния. Например, понимание разницы между радостью и гневом часто заключается в нюансах того, как что-то сказано.
Проблемы возникают из-за нюансов человеческих эмоций. Для решения этих проблем эмоциональный ИИ использует ряд методов.
Как работает эмоциональный ИИ?
Подобно тому, как чат-боты полагаются на огромные базы данных, называемые большими языковыми моделями (LLM) для генерации ответов, эмоциональный ИИ также опирается на массивный набор данных. Основное отличие заключается в форме данных.
Шаг 1: Сбор данных
«Модели» эмоционального ИИ собирают данные из различных источников. Как и LLM, текст составляет часть модели. Но эмоциональные модели ИИ также используют другие формы данных, в том числе:
- Голосовые данные: это может быть из записанных звонков в службу поддержки клиентов или видео, среди других источников.
- Выражения лица: эти данные могут быть получены из различных источников. Одним из распространенных способов является запись выражений лица добровольцев с помощью снятого на телефон видео.
- Физиологические данные: такие показатели, как частота сердечных сокращений и температура тела, могут быть измерены для определения эмоционального состояния участников-добровольцев.
Собранные данные затем можно использовать для определения эмоционального состояния человека. Стоит отметить, что не все модели эмоционального ИИ будут использовать данные одного и того же типа. Например, колл-центру будет мало пользы от визуальных и физиологических данных. В то время как в здравоохранении включение физиологических данных невероятно полезно.
Шаг 2: Эмоциональное признание
То, как данные используются для понимания эмоциональных состояний, зависит от их типа:
- Текстовый анализ: для интерпретации написанного текста используются такие методы, как анализ тональности или обработка естественного языка. Они могут идентифицировать ключевые слова, фразы или шаблоны, которые указывают на эмоциональные состояния.
- Голосовой анализ: алгоритмы машинного обучения анализируют такие аспекты голоса человека, как высота тона, громкость, скорость и тон, чтобы определить эмоциональное состояние.
- Анализ выражения лица: Компьютерное зрение и методы глубокого обучения используются для анализа мимики. Это может включать в себя распознавание основных выражений (счастья, печали, гнева, удивления и т. д.) или более тонких «микровыражений».
- Физиологический анализ: некоторые эмоциональные системы искусственного интеллекта могут анализировать физиологические данные, такие как частота сердечных сокращений и температура, для определения эмоционального состояния. Это требует специализированных датчиков и обычно используется в исследованиях или здравоохранении.
Специфика того, как работает эмоциональный ИИ, зависит от цели приложения. Однако большинство эмоциональных моделей ИИ будут опираться как минимум на один из перечисленных методов.
Шаг 3: Генерация ответа
Последним шагом для модели ИИ является адекватная реакция на определенное эмоциональное состояние. Как проявляется этот ответ, зависит от цели ИИ. Это может быть предупреждение сотруднику колл-центра о том, что его следующий абонент расстроен, или это может быть персонализация содержимого приложения.
Полный спектр применений этой технологии будет огромным, и организации уже применяют ее для различных целей.
Каковы приложения эмоционального ИИ?
ИИ в целом представляет собой своего рода технологический мультиинструмент, и эмоциональный ИИ ничем не отличается. По мере развития технологии спектр ее использования будет значительно расширяться, о чем свидетельствует разнообразие задач, которые она уже выполняет:
- Колл-центры: Emotion AI интегрируется в колл-центры, чтобы помочь агентам определять эмоциональное состояние клиентов.
- Реклама: Маркетинговые агентства следят за группами добровольцев, чтобы оценить их эмоциональную реакцию при просмотре конкретной рекламы. Это позволяет им настраивать контент так, чтобы он более точно соответствовал желаемому эмоциональному отклику.
- Здравоохранение: ИИ уже помогает лечить психические заболевания. В этой области медицины эмоциональный ИИ может принести огромную пользу.
- Образование: Образовательные приложения можно научить корректировать курсовую работу и общий «учебный опыт» в зависимости от эмоционального состояния учащегося.
- Автоматизированная индустрия: Это находится в стадии разработки, но эмоциональный ИИ может оказаться неоценимым помощником вождения. Текущие исследования сосредоточены на разработке систем, которые могут определять эмоциональное состояние водителя. Затем он может принять некоторые меры по исправлению положения, если водитель переутомлен, находится в состоянии стресса, зол или просто мечтает.
Все это звучит хорошо и хорошо, но, как и во всем, что связано с ИИ, все не так просто. Проблемы этики и конфиденциальности, связанные с генеративным ИИ, также применимы, но теперь в смесь добавлены человеческие эмоции.
Проблемы этики и конфиденциальности эмоционального ИИ
Каждое преимущество, которое приносит нам ИИ — а их много — похоже, связано с этическими проблемами или проблемами конфиденциальности. Эта инновационная технология работает на грани технологических ноу-хау. Он также работает на грани общественного ноу-хау.
Пересечение эмоций и технологий усеяно сложными проблемами, которые необходимо решить, если мы хотим, чтобы ИИ был благом, а не бременем. Некоторые из проблем, которые сразу бросаются в глаза, включают:
- Проблемы конфиденциальности данных: И без того серая область в ИИ, включение чувствительных эмоциональных данных подняло планку.
- Точность: Чат-боты с искусственным интеллектом — это много вещей, но их ответы часто не соответствуют действительности. Те же ошибки, которые допускают модели эмоционального ИИ, могут иметь серьезные последствия, если они происходят в таких приложениях, как здравоохранение.
- Эмоциональная манипуляция: Мошенники могут использовать эмоциональный ИИ, чтобы играть на чувствах людей со злым умыслом.
Эти опасения реальны, и согласованные усилия по их решению являются ключом к раскрытию всех преимуществ эмоционального ИИ.
Не знаю смеяться или плакать
Это многообещающая технология с огромными потенциальными преимуществами. Тем не менее, он несет в себе некоторый «эмоциональный багаж». Положительным моментом является огромный спектр потенциальных приложений, где это может иметь огромное значение. Все, от здравоохранения до более захватывающих игровых процессов, может извлечь выгоду из эмоционального ИИ.
Но есть несколько серьезных проблем, которые необходимо решить, если мы хотим использовать это на благо, а не мешать человечеству.