Обучение с нулевым выстрелом решает несколько проблем машинного обучения, но как оно работает и как делает ИИ лучше?

Ключевые выводы

  • Обобщение необходимо в глубоком обучении для обеспечения точных прогнозов на основе новых данных. Обучение с нулевым выстрелом помогает добиться этого, позволяя ИИ использовать существующие знания для точных прогнозов относительно новых или невидимых классов без размеченных данных.
  • Обучение с нулевым выстрелом имитирует то, как люди изучают и обрабатывают данные. Предоставляя дополнительную семантическую информацию, предварительно обученная модель может точно идентифицировать новые классы, точно так же, как человек может научиться распознавать гитару с полым корпусом, понимая ее характеристики.
  • Обучение с нулевым выстрелом улучшает ИИ за счет улучшения обобщения, масштабируемости, уменьшения переобучения и экономической эффективности. Это позволяет моделям обучаться на более крупных наборах данных, получать больше знаний посредством трансферного обучения, лучше понимать контекст и уменьшать потребность в обширных размеченных данных. По мере развития ИИ обучение с нуля станет еще более важным для решения сложных задач в различных областях.
    instagram viewer

Одна из важнейших целей глубокого обучения — обучение моделей, получивших обобщенные знания. Обобщение важно, поскольку оно гарантирует, что модель усвоит значимые закономерности и сможет делать точные прогнозы или решения, когда сталкивается с новыми или невидимыми данными. Обучение таких моделей часто требует значительного объема размеченных данных. Однако такие данные могут быть дорогостоящими, трудоемкими, а иногда и невозможными.

Обучение с нулевого выстрела реализовано, чтобы устранить этот разрыв, позволяя ИИ использовать существующие знания для довольно точных прогнозов, несмотря на отсутствие размеченных данных.

Что такое обучение с нулевым выстрелом?

Обучение с нулевым выстрелом — это особый тип метода трансферного обучения. Он фокусируется на использовании предварительно обученной модели для идентификации новых или ранее не встречавшихся классов, просто предоставляя дополнительную информацию, описывающую особенности нового класса.

Используя общие знания модели по определенным темам и давая ей дополнительную семантику относительно того, что искать, она сможет довольно точно определить, какой предмет ей предстоит идентифицировать.

Допустим, нам нужно опознать зебру. Однако у нас нет модели, которая могла бы идентифицировать таких животных. Итак, мы получаем уже существующую модель, обученную идентифицировать лошадей, и сообщаем ей, что лошади с черно-белыми полосами — это зебры. Когда мы начинаем формировать модель, предоставляя изображения зебр и лошадей, есть большая вероятность, что модель правильно идентифицирует каждое животное.

Как и многие методы глубокого обучения, обучение с нулевым выстрелом имитирует то, как люди изучают и обрабатывают данные. Люди, как известно, являются естественными учениками с нулевым шансом. Если вам поручили найти в музыкальном магазине гитару с полым корпусом, у вас могут возникнуть проблемы с ее поиском. Но как только я скажу вам, что полый корпус — это, по сути, гитара с F-образными отверстиями с одной или обеих сторон, вы, вероятно, сразу же ее найдете.

В качестве примера из реальной жизни давайте воспользуемся приложением классификации с нулевым выстрелом. Хостинг LLM с открытым исходным кодом Hugging Face используя модель clip-vit-large.

На этой фотографии изображен хлеб в продуктовой сумке, привязанный к стульчику. Поскольку модель обучалась на большом наборе изображений, она, скорее всего, сможет идентифицировать каждый предмет на фотографии, например хлеб, продукты, стулья и ремни безопасности.

Теперь мы хотим, чтобы модель классифицировала изображение, используя ранее не встречавшиеся классы. В этом случае новыми или невидимыми классами будут «Непринужденный хлеб», «Безопасный хлеб», «Хлеб сидя», «Вождение продуктового магазина» и «Безопасный продуктовый магазин».

Обратите внимание, что мы намеренно использовали необычные невидимые классы и изображения, чтобы продемонстрировать эффективность классификации с нулевым выстрелом на изображении.

После анализа модели удалось с вероятностью около 80 % классифицировать наиболее подходящую классификацию для изображение было «Безопасный хлеб». Вероятно, это связано с тем, что модель считает, что детский стульчик больше предназначен для безопасности, чем для сидения, отдыха или отдыха. вождение.

Потрясающий! Я лично согласен с выводами модели. Но как именно модель добилась такого результата? Вот общий взгляд на то, как работает обучение с нулевым выстрелом.

Как работает обучение с нулевым выстрелом

Обучение с нулевым выстрелом может помочь предварительно обученной модели идентифицировать новые классы без предоставления помеченных данных. В своей простейшей форме обучение с нулевым выстрелом выполняется в три этапа:

1. Подготовка

Обучение с нуля начинается с подготовки трех типов данных

  • Виден класс: Данные, используемые при обучении предварительно обученной модели. Модель уже предоставляет видимые классы. Лучшими моделями для обучения с нулевым выстрелом являются модели, обученные на классах, тесно связанных с новым классом, который вы хотите, чтобы модель идентифицировала.
  • Невидимый/Роман Класс: Данные, которые никогда не использовались при обучении модели. Вам придется обрабатывать эти данные самостоятельно, поскольку вы не можете получить их из модели.
  • Семантические/вспомогательные данные: Дополнительные биты данных, которые могут помочь модели идентифицировать новый класс. Это могут быть слова, фразы, встраивания слов или имена классов.

2. Семантическое картографирование

Следующий шаг — наметить особенности невидимого класса. Это делается путем создания вложений слов и создания семантической карты, которая связывает атрибуты или характеристики невидимого класса с предоставленными вспомогательными данными. Передача обучения ИИ делает процесс намного быстрее, поскольку многие атрибуты, относящиеся к невидимому классу, уже сопоставлены.

3. Выводы

Вывод — это использование модели для генерации прогнозов или результатов. При классификации изображений с нулевым выстрелом на данном входном изображении генерируются вложения слов, которые затем выводятся на график и сравниваются со вспомогательными данными. Уровень уверенности будет зависеть от сходства входных и предоставленных вспомогательных данных.

Как обучение с нулевого выстрела улучшает ИИ

Обучение с нулевым выстрелом улучшает модели ИИ, решая ряд проблем машинного обучения, в том числе:

  • Улучшенное обобщение: Уменьшение зависимости от помеченных данных позволяет обучать модели на более крупных наборах данных, улучшая обобщение и делая модель более устойчивой и надежной. По мере того, как модели становятся более опытными и обобщенными, возможно, модели даже смогут научиться здравому смыслу а не типичный способ анализа информации.
  • Масштабируемость: Модели можно постоянно обучать и получать больше знаний посредством трансферного обучения. Компании и независимые исследователи могут постоянно совершенствовать свои модели, чтобы стать более эффективными в будущем.
  • Уменьшенный шанс переобучения: Переобучение может произойти из-за того, что модель обучается на небольшом наборе данных, который не содержит достаточного разнообразия для представления всех возможных входных данных. Обучение модели посредством обучения с нулевым выстрелом снижает вероятность переобучения за счет обучения модели лучшему контекстуальному пониманию предметов.
  • Экономически эффективным: Предоставление большого количества размеченных данных может потребовать времени и ресурсов. Используя обучение с нулевым переносом, обучение надежной модели можно выполнить с гораздо меньшими затратами времени и помеченными данными.

По мере развития ИИ такие методы, как обучение с нуля, станут еще более важными.

Будущее обучения с нулевым выстрелом

Обучение с нулевым выстрелом стало неотъемлемой частью машинного обучения. Это позволяет моделям распознавать и классифицировать новые классы без явного обучения. Благодаря постоянному развитию архитектур моделей, подходам, основанным на атрибутах, и мультимодальной интеграции, обучение с нуля может значительно помогают сделать модели более адаптируемыми для решения сложных задач в области робототехники, здравоохранения и компьютеров. зрение.