Более 70 лет назад, когда возникла концепция искусственного интеллекта, Алан Тьюринг опубликовал статью, в которой описал, как его идентифицировать. Позже он был известен как тест Тьюринга и десятилетиями использовался для различения человека и ИИ.
Однако с появлением продвинутых чат-ботов с искусственным интеллектом, таких как ChatGPT и Google Bard, становится все труднее определить, разговариваете ли вы с искусственным интеллектом. Напрашивается вопрос; тест Тьюринга устарел? И если да, то какие есть альтернативы?
Тест Тьюринга устарел?
Чтобы определить, устарел ли тест Тьюринга, нужно сначала понять, как это работает. Чтобы ИИ прошел тест Тьюринга, он должен убедить следователя, что он человек. Но есть одна загвоздка — ИИ оценивается вместе с человеком и должен отвечать текстом.
Подумайте об этом так; если вы следователь и задаете вопросы двум участникам онлайн, используя текст, но один из них является моделью ИИ, вы отличите их через пять минут? Имейте в виду, что цель теста Тьюринга состоит не в том, чтобы определить модель ИИ на основе правильных ответов, а в том, чтобы оценить, может ли ИИ думать или вести себя как человек.
Проблема с подходом теста Тьюринга, заключающимся только в выявлении человеческих ответов, заключается в том, что он не учитывает другие факторы. Например, интеллект модели ИИ или знания следователя. Кроме того, тест Тьюринга ограничен только текстом, и становится все труднее идентифицировать ИИ, который генерирует человеческий голос или дипфейковые видео, имитирующие человеческое поведение.
Однако современные модели ИИ, такие как ChatGPT-4 и Google Bard, еще не продвинулись до такой степени, чтобы они могли стабильно проходить тест Тьюринга. На самом деле, если вы знакомы с ИИ, вы можете определить текст, сгенерированный ИИ.
5 лучших альтернатив теста Тьюринга
Возможно, что будущие модели ИИ, такие как ChatGPT-5 может пройти тест Тьюринга. Если это произойдет, нам потребуются различные тесты в сочетании с тестом Тьюринга, чтобы определить, говорим ли мы с ИИ или с человеком. Вот лучшие альтернативы теста Тьюринга:
1. Тест Маркуса
Гэри Маркус, известный когнитивист и исследователь ИИ, предложил альтернативу тесту Тьюринга, который был опубликован в Житель Нью-Йорка определить когнитивные способности ИИ. Тест прост: вы оцениваете модель ИИ на основе ее способности смотреть и понимать видео и телепередачи на YouTube без субтитров или текста. Чтобы ИИ прошел тест Маркуса, он должен понимать сарказм, юмор, иронию и сюжетную линию при просмотре видео и объяснять это как человек.
В данный момент, GPT-4 может описывать изображения, но пока нет модели ИИ, которая могла бы понимать видео как человек. Беспилотные автомобили приближаются, но они не полностью автономны и нуждаются в датчиках, поскольку не могут разобраться во всем, что находится в окружающей их среде.
2. Визуальный тест Тьюринга
Согласно исследованию, опубликованному на ПНАС, визуальный тест Тьюринга можно использовать, чтобы определить, разговариваете ли вы с человеком или с ИИ, используя вопросники по изображениям. Он работает как тест Тьюринга, но вместо того, чтобы отвечать на вопросы с помощью текстов, участникам показывают изображения, и ожидается, что они будут отвечать на простые вопросы, думая как человек. Однако визуальный тест Тьюринга отличается от CAPTCHA поскольку все ответы правильные, но чтобы пройти тест, ИИ должен обрабатывать изображения так же, как человек.
Кроме того, если ИИ и человеку показать несколько изображений рядом и попросить определить реалистичные изображения, у человека будут когнитивные способности, чтобы пройти тест. Это связано с тем, что моделям ИИ трудно отличить изображения, которые не выглядят так, как будто они были сняты в реальном мире. На самом деле, это причина, по которой вы можете идентифицировать изображения, созданные ИИ использование аномалий, которые не имеют смысла.
3. Лавлейс 2.0 Тест
Теория о том, что компьютер не может создавать оригинальные идеи сверх того, на что он был запрограммирован, была впервые сформулирована Адой Лавлейс еще до теста Тьюринга. Однако Алан Тьюринг возражал против этой теории, утверждая, что ИИ все еще может удивлять людей. Только в 2001 году были разработаны рекомендации для теста Лавлейс, чтобы отличить ИИ от человека — и, согласно Курцвейлибрари позже в 2014 году правила были пересмотрены.
Чтобы ИИ прошел тест Лавлейс, он должен продемонстрировать, что может генерировать оригинальные идеи, превосходящие его обучение. Нынешние модели ИИ, такие как GPT-4, не способны придумывать новые изобретения, выходящие за рамки наших существующих знаний. Однако, искусственный общий интеллект может достичь этой способности и пройти тест Лавлейс.
4. Обратный тест Тьюринга
Как насчет теста Тьюринга, но в обратном порядке? Вместо того, чтобы пытаться выяснить, разговариваете ли вы с человеком, цель обратный тест Тьюринга заключается в том, чтобы обмануть ИИ, заставив его поверить, что вы ИИ. Однако вам также нужна другая модель ИИ, чтобы отвечать на те же вопросы с помощью текста.
Например, если опросщиком является ChatGPT-4, вы можете зарегистрировать Google Bard и другого человека в качестве участников. Если модель ИИ может правильно идентифицировать участника-человека на основе ответов, она прошла тест.
Недостатком обратного теста Тьюринга является его ненадежность, особенно если учесть, что иногда ИИ не может различать созданные ИИ и написанный человеком контент.
5. Структура классификации ИИ
Согласно структуре классификации ИИ, разработанной Крис Саад, тест Тьюринга — это всего лишь один из методов оценки, позволяющий узнать, разговариваете ли вы с ИИ. Короче говоря, структура классификации ИИ основана на теории множественного интеллекта, которая требует, чтобы человеческий интеллект удовлетворял как минимум восьми различным критериям, которые включают: музыкальный ритм, логико-математический интеллект, визуальную идентификацию, эмоциональный интеллект, саморефлексивный интеллект, способность к экзистенциальному мышлению и телосложение. движение.
Поскольку ИИ оценивается по восьми различным параметрам, он вряд ли сойдет за человека, даже если в определенных тестах он работает лучше среднего. Например, ChatGPT может решать математические задачи, описывать изображения и разговаривать на естественном языке, подобно человеческому, но это не соответствует другим категориям, определенным в структуре классификации ИИ.
Тест Тьюринга не является окончательным
Тест Тьюринга должен был быть скорее мысленным экспериментом, чем окончательным тестом, позволяющим отличить людей от ИИ. Когда это было первоначально предложено, это был ключевой ориентир для измерения машинного интеллекта.
Однако с недавней разработкой моделей ИИ с интерактивными возможностями речи, зрения и слуха тест Тьюринга терпит неудачу, поскольку он ограничен текстовым разговором. Наиболее эффективным решением было бы введение альтернативных тестов Тьюринга, которые еще больше отличают модели ИИ от людей.