GPT-4 здесь, и это новые функции, которые вы должны проверить.

OpenAI наконец-то выпустила долгожданное обновление GPT, GPT-4. Крупноязыковая модель (LLM) имеет ряд новых мощных функций и возможностей, которые уже шокировали пользователей по всему миру.

Помимо того, что он значительно лучше, чем GPT-3.5, существующий LLM, на котором работает вирусный чат-бот OpenAI ChatGPT, GPT-4 может понимает более сложные входные данные, имеет гораздо больший предел ввода символов, имеет мультимодальные возможности и, как сообщается, безопаснее для использовать.

1. GPT-4 может понимать более сложные входные данные

Одной из самых больших новых функций GPT-4 является его способность понимать более сложные и нюансированные подсказки. В соответствии с OpenAI, GPT-4 «демонстрирует производительность человеческого уровня на различных профессиональных и академических тестах».

Это было продемонстрировано путем прохождения GPT-4 через несколько экзаменов человеческого уровня и стандартизированных тестов, таких как SAT, BAR и GRE, без специальной подготовки. GTP-4 не только понимал и решал эти тесты с относительно высоким баллом по всем направлениям, но и каждый раз превосходил своего предшественника GPT-3.5.

instagram viewer

Кредит изображения: OpenAI

Способности понимать более тонкие подсказки ввода также способствует тот факт, что GPT-4 имеет гораздо больший лимит слов. Новая модель может обрабатывать запросы на ввод до 25 000 слов (для контекста GPT-3.5 был ограничен 8 000 слов). Это напрямую повлияет на детализацию, которую пользователи могут втиснуть в свои подсказки, что даст модели гораздо больше информации для работы и приведет к более объемным выводам.

GPT-4 также поддерживает более 26 языков, включая языки с низким уровнем ресурсов, такие как латышский, валлийский и суахили. При тестировании точности трех выстрелов в тесте MMLU GPT-4 превзошел GPT-3.5, а также другие ведущие LLM, такие как PaLM и Chinchilla, с точки зрения производительности на английском языке на 24 языках.

2. Мультимодальные возможности

Предыдущая версия ЧатGPT был ограничен только текстовыми подсказками. Напротив, одной из новейших функций GPT-4 являются его мультимодальные возможности. Модель может принимать как текстовые, так и графические подсказки.

Это означает, что ИИ может принимать изображение в качестве входных данных, интерпретировать и понимать его так же, как текстовую подсказку. Эта возможность охватывает все размеры и типы изображений и текста, включая документы, объединяющие эти два элемента, нарисованные от руки наброски и даже скриншоты.

Однако возможности чтения изображений GPT-4 выходят за рамки простой их интерпретации. OpenAI продемонстрировал это в своем потоке разработчиков (выше), где они предоставили GPT-4 нарисованный от руки макет веб-сайта с шутками. Модель должна была написать код HTML и JavaScript, чтобы превратить макет в веб-сайт, заменив шутки реальными.

GPT-4 написал код, используя макет, указанный в макете. После тестирования код создал рабочий сайт с, как вы можете догадаться, настоящими шутками. Значит ли это Развитие ИИ будет означать конец программирования? Не совсем, но это все же функция, которая пригодится программистам.

Какой бы многообещающей ни казалась эта функция, она все еще находится в стадии предварительного исследования и не является общедоступной. Кроме того, модели требуется много времени для обработки визуальных входных данных, а сам OpenAI заявляет, что может потребоваться работа и время, чтобы стать быстрее.

3. Большая управляемость

OpenAI также утверждает, что GPT-4 обладает высокой степенью управляемости. Это также усложнило работу ИИ, чтобы сломать персонажа, а это означает, что вероятность отказа при реализации в приложении для воспроизведения определенного персонажа меньше.

Разработчики могут предписывать стиль и задачи своего ИИ, описывая направление в «системном» сообщении. Эти сообщения позволяют пользователям API сильно настраивать взаимодействие с пользователем в определенных пределах. Поскольку эти сообщения также являются самым простым способом взломать модель, они также работают над тем, чтобы сделать их более безопасными. Демонстрация GPT-4 довела до конца этот момент, заставив пользователя попытаться помешать GPT-4 стать сократовским наставником и ответить на его запрос. Однако модель отказалась ломать характер.

4. Безопасность

OpenAI потратил шесть месяцев на создание GPT-4 безопаснее и ровнее. Компания утверждает, что она на 82% реже отвечает на запросы о неприемлемом или иным запрещенным контентом, а на 29% чаще отвечает на запросы. отвечать в соответствии с политиками OpenAI на конфиденциальные запросы и на 40 % чаще давать фактические ответы по сравнению с ГПТ-3.5.

Он не идеален, и вы все еще можете ожидать, что время от времени он будет «галлюцинировать» и может ошибаться в своих предсказаниях. Конечно, у GPT-4 лучше восприятие и мощность предсказания, но слепо доверять ИИ все же не стоит.

5. Улучшения производительности

Помимо оценки производительности модели на человеческих экзаменах, OpenAI также оценил бота на традиционных тестах, разработанных для моделей машинного обучения.

В нем утверждается, что GPT-4 «значительно превосходит» существующие LLM и «большинство современных моделей». Эти ориентиры включают в себя вышеупомянутые MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval и Drop, все из которых проверяют индивидуальные способности.

Вы найдете аналогичные результаты при сравнении производительности в тестах академического зрения. Проведенные тесты включают VQAv2, TextVQA, ChartQA, AI2 Diagram (AI2D), DocVQA, Infographic VQA, TVQA и LSMDC, все из которых возглавляет GPT-4. Однако OpenAI заявила, что результаты GPT-4 в этих тестах «не полностью отражают масштабы его возможностей», поскольку исследователи продолжают находить новые и более сложные задачи, с которыми может справиться модель.

Маленький шаг для GPT-4, гигантский скачок для ИИ

Обладая большей точностью, безопасностью использования и расширенными возможностями, GPT-4 был выпущен для широкой публики через план ежемесячной подписки ChatGPT +, который стоит 20 в месяц. Кроме того, OpenAI сотрудничает с различными организациями, чтобы начать создавать потребительские продукты с GPT-4. Microsoft Bing, Duolingo, Stripe, Be My Eyes и Khan Academy среди прочих уже внедрили GPT-4 в свои продукты.

GPT-4 может быть дополнительным обновлением по сравнению с GPT-3.5, но в целом это огромная победа для ИИ. По мере того, как модель становится более доступной как для обычного пользователя, так и для разработчиков через ее API, кажется, что она станет хорошим аргументом в пользу реализации LLM в разных областях.