YOLO-NAS — это вершина моделей обнаружения объектов в серии YOLO. Но почему он считается лучшим?

После YOLOv8 появилась новая и лучшая современная модель обнаружения объектов YOLO-NAS. Это алгоритм обнаружения объектов, разработанный Deci AI для преодоления ограничений предыдущих моделей YOLO (You Only Look Once).

Модель построена из AutoNAC, поисковой системы с нейронной архитектурой. Он превосходит по скорости и производительности модели SOTA, что представляет собой большой скачок в обнаружении объектов за счет улучшения компромиссов между точностью, задержкой и поддержкой квантования.

В этой статье мы обсудим сильные стороны и особенности YOLO-NAS и узнаем, почему это лучшая модель обнаружения объектов в серии YOLO.

Понимание того, как работает YOLO-NAS

AutoNAC (автоматическое построение нейронной архитектуры) Деси создает архитектуру YOLO-NAS. AutoNAC — это бесшовный процесс, обеспечивающий повышение производительности существующих глубоких нейронных сетей.

Конвейер AutoNAC использует обученную пользователем глубокую нейронную сеть в качестве входных данных, набора данных и доступа к системе логического вывода. Обученная пользователем глубокая нейронная сеть затем подвергается перепроектированию с использованием конвейера. В этом случае достигается оптимизированная архитектура с меньшей задержкой без ущерба для точности.

instagram viewer

YOLO-NAS использует RepVGG. RepVGG делает его доступным для оптимизации после обучения путем повторной параметризации или квантования после обучения. Это тип архитектуры нейронной сети, основанный на VGG. Он использует методы регуляризации, предназначенные для повышения способности к обобщению моделей глубокого обучения.

Дизайн архитектуры более эффективен по скорости и памяти. RepVGG проходит обучение с использованием многоветвевой архитектуры для более быстрого вывода. Затем он преобразуется в одну ветвь с использованием повторной параметризации.

Эта функция делает YOLO-NAS очень полезным для производственного развертывания. Это связано с тем, что можно обучать и оптимизировать модель с полной точностью для скорости вывода и использования памяти.

Ключевые особенности YOLO-NAS

Ключевые особенности YOLO-NAS включают следующее:

  • Обучение с учетом квантования: модель использует QSP и QCI (модули, поддерживающие квантование), чтобы уменьшить потерю точности во время квантования после обучения, комбинируя повторную параметризацию 8-битного квантования.
  • Автоматическое проектирование архитектуры: AutoNAC, запатентованная технология NAS от Deci, ищет оптимальную архитектуру модели, которая объединяет фундаментальные архитектуры моделей YOLO для создания оптимизированной модели.
  • Метод гибридного квантования: стандартный метод квантования влияет на всю модель. Напротив, метод гибридного квантования квантует часть модели, чтобы сбалансировать задержку и точность модели.
  • Используйте уникальные подходы для подготовки модели к обучению с использованием автоматически размеченных данных. Затем модель учится на своих прогнозах и получает доступ к большим объемам данных.

Сравнительный анализ: YOLO-NAS и другие модели YOLO

Ниже приведено сравнение различных моделей серии YOLO.

YOLO-NAS лучше, чем существующие модели обнаружения объектов, но у него есть свои недостатки. Вот список преимуществ и недостатков YOLO-NAS:

Плюсы

  • Это с открытым исходным кодом.
  • Это на 10-20% быстрее, чем ранее существовавшие модели YOLO.
  • Он более точен по сравнению с ранее существовавшими моделями YOLO.
  • Он использует лучшую архитектуру AutoNAC. Это устанавливает новый рекорд в обнаружении объектов, обеспечивая наилучшую производительность при компромиссе между точностью и задержкой.
  • Полная поддержка механизмов логического вывода, таких как NVIDIA. Эта функция делает модель готовой к производству.
  • Он имеет лучшую эффективность памяти и повышенную скорость логического вывода.

Минусы

  • Он еще не стабилен, так как технология все еще нова и не использовалась широко в производстве.

Внедрение YOLO-NAS

Вы будете использовать Google Колаб писать и запускать коды в этой реализации. Альтернативой Google Colab может быть создать виртуальную среду и используйте IDE на вашем локальном компьютере.

Модель очень ресурсоемкая. Убедитесь, что у вас есть как минимум 8 ГБ ОЗУ, прежде чем запускать его на своем компьютере. Чем больше размер видео, тем больше памяти оно использует.

Установка зависимостей

Установите зависимость YOLO-NAS, суперградиенты используя команду ниже:

pip установить супер-градиенты ==3.1.2

После успешной установки вы сможете обучить модель YOLO-NAS.

Обучение модели

Чтобы обучить модель, запустите блок кода ниже:

от super_gradients.training Импортировать модели
yolo_nas_l = models.get("йоло_нас_л", предварительно обученные_веса ="кокос")

В этом коде вы импортируете модель обучения из установленной библиотеки SuperGradients. Затем вы используете предварительно обученные веса модели из набора данных COCO.

Вывод модели

Вывод модели имеет потенциальные приложения для задач обнаружения, классификации и сегментации изображений.

В этом случае вы сосредоточитесь на задача обнаружения объекта для видео и изображений. Чтобы обнаружить объект на изображении, запустите блок кода ниже:

URL = "имг_путь"
yolo_nas_l.predict (url, conf=0.25).показывать()

Убедитесь, что вы используете точный путь к вашему изображению. В этом случае загрузите изображение в среду Google Colab, затем скопируйте путь к изображению.

Ожидаемый результат:

Чтобы обнаружить объекты в видео, запустите блок кода ниже:

Импортировать факел

input_video_path = "путь_к_видео"
выход_видео_путь = "обнаружен.mp4"
устройство = 'куда'если факел.cuda.is_available() еще"Процессор"
yolo_nas_l.to (устройство).predict (входной_видео_путь).сохранить (выходной_видео_путь)

Как и данные изображения, загрузите видео, объекты которого должны быть обнаружены, в среду Google Colab и скопируйте путь к переменной видео. Прогнозируемое видео будет доступно из среды Google Colab по имени обнаружен.mp4. Загрузите видео на свой локальный компьютер перед завершением сеанса.

Ожидаемый результат:

YOLO-NAS также поддерживает тонкую настройку модели и обучение на пользовательских данных. Документация доступна на Деси тонкая настройка стартового ноутбука.

Реальные приложения YOLO-NAS

Исходный код YOLO-NAS доступен по лицензии Apache License 2.0, которая доступна для некоммерческого использования. Для коммерческого использования модель должна пройти переобучение с нуля для получения нестандартных весов.

Это универсальная модель, применение которой возможно в нескольких областях, таких как:

Автономные транспортные средства и робототехника

YOLO-NAS может улучшить возможности восприятия автономных транспортных средств, позволяя им быстрее и точнее обнаруживать и отслеживать объекты в режиме реального времени. Эта способность помогает обеспечить безопасность дорожного движения и плавность вождения.

Системы наблюдения и безопасности

Модель может обеспечить быстрое, точное обнаружение объектов в режиме реального времени для наблюдения и безопасности. систем, что помогает выявлять потенциальные угрозы или подозрительные действия, что повышает безопасность системы

Розничная торговля и управление запасами

Модель обеспечивает быстрое и точное обнаружение объектов, что обеспечивает эффективное автоматизированное управление запасами в режиме реального времени, отслеживание запасов и оптимизацию полок. Эта модель помогает снизить эксплуатационные расходы и увеличить прибыль.

Здравоохранение и медицинская визуализация

В сфере здравоохранения YOLO-NAS может помочь в эффективном обнаружении и анализе аномалий заболевания или конкретных областей, представляющих интерес. Модель может помочь врачам точно диагностировать заболевания и наблюдать за пациентами, тем самым улучшая сектор здравоохранения.

YOLO-NAS Еда на вынос

YOLO-NAS — это новая модель обнаружения объектов, предлагающая новый способ обнаружения объектов. Это лучше, чем модели SOTA. Его производительность при обнаружении объектов — большой скачок для проектов компьютерного зрения.