Откройте для себя мощь API OpenAI и все возможности, которые он открывает.

Генерирующая мощь ChatGPT с момента запуска вызвала ажиотаж в мире технологий. Чтобы поделиться интуицией ИИ, OpenAI выпустила API ChatGPT и Whisper 1 марта 2023 года, чтобы разработчики могли исследовать и использовать их в приложении.

API-интерфейсы OpenAI имеют множество ценных конечных точек, упрощающих интеграцию ИИ. Давайте изучим возможности API OpenAI, чтобы понять, какую пользу они могут принести вам.

Что может API OpenAI?

API OpenAI упаковывает в кучу утилиты для программистов. Если вы намерены ежедневно внедрять ИИ в приложения, OpenAI облегчит вам жизнь благодаря следующим возможностям.

Чат

Конечная точка завершения чата OpenAI API помогает конечному пользователю запустить естественный, удобный для человека интерактивный сеанс с виртуальным помощником, используя модель GPT-3.5-turbo.

За кулисами вызов API использует массив сообщений с ролями и содержимым. Со стороны пользователя контент — это набор инструкций для виртуального помощника, который вовлекает пользователя, а для модели контент — это его ответ.

instagram viewer

Роль верхнего уровня — это система, в которой вы определяете общую функцию виртуального помощника. Например, когда программист говорит системе что-то вроде «вы полезный виртуальный помощник», вы ожидаете, что она ответит на различные вопросы в рамках своих способностей к обучению.

После того, как мы сказали, что это «полезный виртуальный помощник», вот как прошел один из наших чатов в командной строке с моделью GPT-3.5-turbo:

Вы даже можете улучшить производительность модели, указав такие параметры, как температура, штраф за присутствие, штраф за частоту и другие. Если вы когда-либо использовали ChatGPT, вы уже знаете, как работает модель завершения чата OpenAI.

Завершение текста

API завершения текста предоставляет функции диалога, вставки и завершения текста на основе расширенных моделей GPT-3.5.

Лучшей моделью в конечной точке завершения текста является text-davinci-003, которая значительно более интуитивно понятна, чем модели естественного языка GPT-3. Конечная точка принимает запрос пользователя, позволяя модели естественно реагировать и завершать простые и сложные предложения, используя удобный для человека текст.

Хотя конечная точка завершения текста не так интуитивно понятна, как конечная точка чата, она становится лучше — по мере увеличения текстовых токенов, предоставляемых модели text-davinci-003.

Например, мы получили несколько полусырых завершений, когда поместили модель на max_tokens, равное семи:

Однако увеличение max_tokens до 70 породило более связные мысли:

Преобразование речи в текст

Вы можете транскрибировать и переводить аудио речь, используя конечные точки транскрипции и перевода OpenAI. Конечные точки преобразования речи в текст основаны на модели Whisper v2-large, разработанной посредством крупномасштабного слабого контроля.

Однако OpenAI заявляет, что нет никакой разницы между его моделью Whisper и моделью с открытым исходным кодом. Таким образом, он предлагает бесконечные возможности для интеграции многоязычного транскрибатора и ИИ-переводчика в ваше приложение в любом масштабе.

Использование конечной точки простое. Все, что вам нужно сделать, это предоставить модели звуковой файл и вызвать опенай. Аудио.перевести или опенай. Аудио.транскрипция конечная точка для перевода или расшифровки соответственно. Эти конечные точки принимают максимальный размер файла 25 МБ и поддерживают большинство типов аудиофайлов, включая mp3, mp4, MPEG, MPGA, m4a, wav и webm.

Сравнение текста

Конечная точка сравнения текста OpenAI API измеряет взаимосвязь между текстами, используя модель text-embedding-ada-002, модель встраивания второго поколения. API встраивания использует эту модель для оценки взаимосвязи между текстами на основе расстояния между двумя векторными точками. Чем шире разница, тем менее родственны сравниваемые тексты.

Конечная точка внедрения включает кластеризацию текста, различия, релевантность, рекомендации, настроения и классификацию. Кроме того, взимается плата за объем токена.

Хотя в документации OpenAI говорится, что вы можете использовать другие модели встраивания первого поколения, первая лучше с более низкой ценой. Однако OpenAI предупреждает, что модель встраивания может демонстрировать социальную предвзятость по отношению к определенным людям, что доказано тестами.

Завершение кода

Конечная точка завершения кода построена на OpenAI Codex, наборе моделей, обученных с использованием естественного языка и миллиардов строк кода из общедоступных репозиториев.

Конечная точка находится в ограниченной бета-версии и бесплатна на момент написания, предлагая поддержку многих современных языков программирования, включая JavaScript, Python, Go, PHP, Ruby, Shell, TypeScript, Swift, Perl и SQL.

В моделях code-davinci-002 или code-cushman-001 конечная точка завершения кода может автоматически вставлять строки кода или запускать блоки кода из подсказки пользователя. В то время как последняя модель быстрее, первая является мощным конечным устройством, поскольку в ней предусмотрена вставка кода для автоматического завершения кода.

Например, вы можете сгенерировать блок кода, отправив приглашение в конечную точку в комментарии на целевом языке.

Вот некоторые ответы, которые мы получили, когда попытались сгенерировать некоторые блоки кода на Python и JavaScript через терминал:

Генерация изображения

Это одна из самых интуитивно понятных функций OpenAI API. Основываясь на модели изображений DALL.E, функциональные возможности изображений API OpenAI включают конечные точки для создания, редактирования и создания вариантов изображений из подсказок на естественном языке.

Хотя он еще не имеет расширенных функций, таких как масштабирование, поскольку он все еще находится в стадии бета-тестирования, его немасштабированные результаты более впечатляющие, чем у генеративных. арт-модели, такие как Midjourney и стабильная диффузия.

При переходе к конечной точке создания образа вам нужно только указать приглашение, размер изображения и количество изображений. Но конечная точка редактирования изображения требует, чтобы вы включили изображение, которое хотите отредактировать, и маску RGBA, обозначающую точку редактирования, в дополнение к другим параметрам.

Конечная точка варианта, с другой стороны, требует только целевого изображения, количества вариантов и выходного размера. На момент написания статьи конечные точки бета-изображений OpenAI могли принимать только квадратные кадры в диапазоне 256x256, 512x512 и 1024x1024 пикселей.

Мы создали простое приложение для генерации изображений, используя эту конечную точку, и хотя в нем были упущены некоторые детали, оно дало невероятный результат:

Как использовать API OpenAI

Использование OpenAI API простое и следует традиционной схеме использования API.

  1. Установите опенай пакет с использованием pip: пип установить опенай.Если вместо этого вы используете Node, вы можете сделать это с помощью npm: нпм установить опенай.
  2. Возьмите свои ключи API: войдите в свою панель управления OpenAI и щелкните значок своего профиля в правом верхнем углу. Идти к Просмотр ключей API и нажмите Создать новый секретный ключ для создания секретного ключа API.
  3. Выполняйте вызовы API к выбранным вами конечным точкам модели с помощью серверного языка, такого как Python или JavaScript (Node). Передайте их своим пользовательским API и протестируйте свои конечные точки.
  4. Затем получать пользовательские API через JavaScript такие фреймворки, как React, Vue или Angular.
  5. Представьте данные (запросы пользователей и ответы модели) в визуально привлекательном пользовательском интерфейсе, и ваше приложение будет готово к реальному использованию.

Что вы можете создать с помощью API OpenAI?

API-интерфейсы OpenAI создают точки входа для реального использования машинного обучения и обучения с подкреплением. Хотя возможностей для творчества предостаточно, вот несколько вещей, которые вы можете создать с помощью API OpenAI:

  1. Интегрируйте интуитивно понятного чат-бота виртуального помощника на свой веб-сайт или в приложение, используя конечную точку завершения чата.
  2. Создайте приложение для редактирования и обработки изображений, которое может естественным образом вставлять объект в изображение в любой указанной точке, используя конечные точки создания изображения.
  3. Создайте собственную модель машинного обучения с нуля, используя конечную точку точной настройки модели OpenAI.
  4. Исправьте субтитры и переводы для видео, аудио и живых разговоров с помощью конечной точки модели преобразования речи в текст.
  5. Определите негативные настроения в своем приложении, используя конечную точку модели встраивания OpenAI.
  6. Создавайте подключаемые модули завершения кода для конкретных языков программирования для редакторов кода и интегрированных сред разработки (IDE).

Создавайте бесконечно с помощью API OpenAI

Наше ежедневное общение часто включает в себя обмен письменным содержанием. API OpenAI только расширяет свои творческие возможности и потенциал, предлагая, казалось бы, безграничные варианты использования естественного языка.

Для OpenAI API еще рано. Но ожидайте, что со временем он будет развиваться с большим количеством функций.