Искусственный интеллект силен во многих областях, но базовый здравый смысл и другие врожденные человеческие чувства представляют собой большую проблему.
Ключевые выводы
- Здравый смысл – это способность понимать и реагировать на повседневные ситуации, не подвергая их чрезмерному анализу. Оно приобретается посредством жизненного опыта и наблюдений, а также социальных и культурных норм.
- Компьютерам не хватает здравого смысла, потому что им не хватает реального опыта и способности адаптироваться к новым контекстам. Они также борются с негласными правилами и предположениями, которые люди интуитивно понимают.
- Исследователи изучают различные подходы, такие как создание обширных баз знаний, краудсорсинг здравого смысла и обучение ИИ через моделируемые миры, чтобы обучить компьютеры сбору данных. здравый смысл. Прогресс достигнут, но еще есть над чем работать.
Здравый смысл. Мы все думаем, что оно у нас есть. Но что именно? Смогут ли компьютеры или системы искусственного интеллекта когда-либо по-настоящему овладеть им?
Что такое здравый смысл и как люди его приобретают?
Здравый смысл — это базовая способность воспринимать, понимать и судить о вещах, которой, как ожидается, обладает большинство людей. Это совокупность фактов, информации и практических правил, которые мы накапливаем посредством жизненного опыта и наблюдений. Здравый смысл позволяет нам эффективно обрабатывать повседневные ситуации и реагировать на них, не анализируя их слишком глубоко.
Люди начинают приобретать здравый смысл в раннем детстве. В младенчестве мы начинаем изучать причинно-следственные связи — например, плач приводит к тому, что нас кормят или переодевают. Благодаря повторяющемуся опыту мы получаем практические знания о мире. Например, прикосновение к горячей плите приводит к ожогу. Так мы учимся не прикасаться к горячим поверхностям.
В детстве мы продолжаем расширять свой здравый смысл посредством проб и ошибок, наблюдения и взаимодействия с членами семьи. Например, мы понимаем, что одежду нужно регулярно стирать, нельзя разговаривать с набитым ртом, а опрокидывание стакана с молоком приводит к беспорядку. Родители, братья и сестры, учителя и другие взрослые поправляют нас, когда мы нарушаем социальные нормы и ожидания. Со временем эти уроки укоренятся как базовый здравый смысл.
Помимо личного опыта, здравый смысл формируется более широкими социальными и культурными нормами. То, что может быть здравым смыслом в одной культуре (например, снимать обувь при входе в дом), может не быть таковым в другой культуре.
Наш здравый смысл адаптируется по мере того, как мы взрослеем и сталкиваемся с большим количеством людей и окружающей среды. Итак, ребенок, растущий в маленьком городке, обретает базовый здравый смысл в отношении жизни в этой среде. Взрослому человеку, переезжающему в крупный мегаполис, приходится подстраивать свой здравый смысл под новую обстановку.
Здравый смысл продолжает развиваться по мере того, как на протяжении всей нашей жизни мы получаем новый опыт.
Почему здравый смысл мешает компьютерам?
Есть несколько причин, по которым здравый смысл трудно программировать.
Во-первых, люди учатся здравому смыслу постепенно, в течение многих лет знакомства с миром. Мы пробуем что-то, видим, что работает, а что нет, и запоминаем уроки. У компьютеров нет такого реального опыта, на который можно было бы опираться. Они знают только то, что им прямо говорят люди.
Например, я задал ChatGPT (GPT 3.5) такой вопрос:
Janet runs a laundry business. She washes clothes for customers and hangs them outside on clotheslines to dry in the sun. One day, Janet washed five shirts and hung them on the clotheslines in the morning. It took the shirts five hours to dry. How long will it take to dry 30 shirts?
Получилось вот с этим ответом:
Другая проблема заключается в том, что здравый смысл зависит от контекста. Если в компьютере запрограммированы только определенные правила, он не сможет адаптировать их к новым контекстам так, как это интуитивно может сделать человек.
Например, предположим, что вы научили компьютер, что делать, если на улице пошел дождь. Кажется простым, не так ли? Но что тогда, если вместо дождя включится разбрызгиватель? Или что, если это внутри продуктового магазина, и из труб с потолка начинает течь вода? Мы бы сразу поняли, как справиться с этими вариациями, но компьютер слепо следовал бы правилу «если на улице идет дождь, зайди внутрь», которое теперь не имеет смысла.
Существуют также негласные правила и предположения, которые люди усваивают, даже не осознавая этого. Например, насколько близко вы можете стоять рядом с кем-то, чтобы не почувствовать неловкость? Люди интуитивно знают ответ, но им нелегко объяснить точные правила. Компьютерам может быть особенно сложно уловить эти неявные социальные нормы только на основе данных.
Итак, на данный момент здравый смысл остается одной из самых больших слабостей ИИ по сравнению с человеческим интеллектом. Это естественно для людей, но не для машин.
Как компьютеры могут научиться здравому смыслу
После раннего оптимизма в 1970-х и 1980-х годах исследователи осознали, насколько сложно будет научить компьютеры здравому смыслу. Тем не менее, новые подходы обещают обучить системы искусственного интеллекта базовому здравому смыслу в повседневном физическом и социальном мире.
Один из подходов — вручную создать обширные базы знаний, подробно описывающие факты и правила о том, как устроен мир. Проект Cyc, начатый в 1984 году Дугом Ленатом, представляет собой одну из амбициозных попыток такого рода.
Сотни логиков за десятилетия закодировали в Cyc миллионы логических аксиом. Несмотря на то, что это отнимает много времени, в результате получается система, обладающая значительными практическими знаниями. Cyc, очевидно, может прийти к выводу, что помидор технически является фруктом, но его не следует добавлять во фруктовый салат, благодаря его знанию кулинарных вкусовых характеристик.
Краудсорсинг здравого смысла с помощью ConceptNet
Более современные базы знаний, такие как КонцептНет используйте краудсорсинговый подход для создания утверждений, основанных на здравом смысле. Идея состоит в том, что вместо того, чтобы эксперты или ИИ пытались выявить все основные факты и взаимосвязи в мире, они открывают его, чтобы каждый мог внести свой вклад в части здравого смысла.
Этот краудсорсинговый подход позволяет этим базам знаний использовать коллективный разум множества разных людей в Интернете. Собрав тысячи и тысячи этих маленьких самородков здравого смысла из толпы, ConceptNet создал удивительно большие хранилища базовых повседневных знаний. А поскольку к нему постоянно добавляются новые участники, знания продолжают расти.
Обучение здравому смыслу через опыт
Еще один многообещающий подход — создание детально смоделированных миров, в которых агенты ИИ смогут экспериментировать и изучать физику и интуицию на собственном опыте.
Исследователи создают виртуальные 3D-среды, наполненные повседневными объектами, имитирующими реальный мир, например, цифровой дом «AI2 THOR», построенный Институтом Аллена. В этих пространствах роботы с искусственным интеллектом могут опробовать все виды взаимодействия, чтобы развить интуитивное понимание концепций, которые люди считают само собой разумеющимися.
Например, ИИ-боту можно дать виртуальное тело и попытаться собирать блоки, складывать их, опрокидывать и т. д. Видя, как блоки реалистично падают и сталкиваются, бот изучает основные понятия о твердости, гравитации и физической динамике. Никаких правил не требуется – только опыт.
Бот также может попробовать выполнить такие действия, как уронить стеклянный предмет и увидеть, как он разбивается при падении на землю. Или он может экспериментировать со свойствами воды, наливая жидкости и наблюдая, как они текут и собираются в лужи. Эти практические уроки закрепляют знания ИИ на сенсорном опыте, а не только на шаблонах данных.
Методы, основанные на данных, такие как предварительное обучение мощные модели большого языка также оказались удивительно эффективными в выявлении закономерностей здравого смысла. Модели искусственного интеллекта, такие как ГПТ-3,5 и ГПТ-4 может генерировать впечатляюще человеческий текст после «прочтения» огромных объемов интернет-данных.
Хотя иногда они делают неразумные предложения (иначе известный как галлюцинация ИИ), статистический подход к обучению позволяет им имитировать определенные виды здравого смысла. Однако остаются разногласия по поводу того, является ли это здравым смыслом или умелой эксплуатацией неточностей в данных.
Как проверить компьютеры на здравый смысл
Поскольку системы искусственного интеллекта берут на себя более сложные реальные задачи, оценка того, обладают ли они «здравым смыслом», становится решающей.
Физический здравый смысл
Одной из областей, которую следует проверить, является физический здравый смысл — интуиция относительно объектов, сил и основных свойств мира.
Например, покажите система компьютерного зрения фотографию с книгой, парящей в воздухе, и попросите ее описать сцену. Замечает ли он что-нибудь необычное в плавающей книге? Или дайте системе искусственного интеллекта необычные сценарии, такие как «человек разрезал камень буханкой хлеба», и проверьте, помечает ли она их как невероятные.
Среда AI2 THOR Института Аллена имитирует блочные башни, пролитые кружки и другие сцены, чтобы проверить эту физическую интуицию.
Социальный здравый смысл
У людей также есть социальный здравый смысл — неявное понимание мотивов, отношений и норм людей. Чтобы оценить это в ИИ, создайте ситуации с неоднозначными местоимениями или мотивами и посмотрите, интерпретирует ли система их разумно.
Например, я спросил ChatGPT, относится ли «это» к чемодану или трофею в подсказке ниже:
The trophy could not fit into the suitcase because it was too small.
Он не выдержал испытания; между тем, человек, очевидно, поймет, что я имею в виду чемодан.
Этот вид теста называется «Вызов схемы Винограда» и специально нацелен на социальный здравый смысл.
Безопасность и этика
Крайне важно проверить, усвоили ли системы ИИ небезопасные или неэтичные модели поведения. Проанализируйте, проявляет ли ИИ вредные предубеждения на основе пола, расы или других характеристик при вынесении суждений.
Проверьте, проводятся ли разумные этические различия. Убийство медведя ради спасения ребенка можно считать оправданным, тогда как взрыв ядерной бомбы с той же целью не будет оправданным. Отмечайте любые рекомендации как явно неэтичные действия.
Реальная производительность
Оцените здравый смысл, наблюдая, как системы ИИ функционируют в реальных условиях. Например, сделайте беспилотные автомобили правильно распознают объекты и пешеходов и реагируют на них? Может ли робот перемещаться по разнообразным домашним помещениям, не ломая ценные предметы и не причиняя вреда домашним животным?
Реальные испытания выявляют пробелы в здравом смысле, которые могут не проявиться в ограниченных лабораторных условиях.
Прогресс достигнут, но работа над искусственным интеллектом здравого смысла еще продолжается
Некоторые эксперты утверждают, что ИИ, возможно, никогда не достигнет человеческого здравого смысла, если не разовьет структуры мозга и тела, подобные нашему. С другой стороны, цифровой разум не ограничен человеческими предубеждениями и умственными способностями, поэтому теоретически они могут превзойти нас! Хотя нам, вероятно, пока не стоит беспокоиться о сверхразумном искусственном интеллекте.
В краткосрочной перспективе лучшим выбором будет ИИ, который сочетает в себе изученный здравый смысл и старомодное доброе программирование. Таким образом, мы надеемся, можно избежать глупых ошибок, таких как принятие черепахи за винтовку.
Мы еще не достигли этой цели, но здравый смысл больше не является темной материей ИИ – прогресс происходит! Тем не менее, в течение некоторого времени для применения этих технологий потребуется здоровая доза человеческого здравого смысла.