Вы, наверное, слышали о GPT OpenAI, но это не единственные LLM в этом блоке.
Ключевые выводы
- GPT-4 от OpenAI — это самая продвинутая и широко используемая модель большого языка с 1,76 триллиона параметров и мультимодальными возможностями.
- Claude 2 от Anthropic конкурирует с GPT-4 в творческих писательских задачах и удерживает свои позиции, несмотря на меньшее количество ресурсов.
- PaLM 2 от Google хоть и не является убийцей GPT-4, но представляет собой мощную языковую модель с сильными многоязычными и творческими способностями. Falcon-180B — это модель с открытым исходным кодом, которая конкурирует с коммерческими гигантами и может конкурировать с GPT-3.5.
Сейчас сезон искусственного интеллекта, и технологические компании штампуют большие языковые модели, как хлеб из пекарни. Новые модели выпускаются быстро, и за ними становится все сложнее следить.
Но среди потока новых выпусков лишь несколько моделей поднялись на вершину и зарекомендовали себя как настоящие соперники в большом пространстве языковых моделей. Подходя к концу 2023 года, мы собрали шесть наиболее впечатляющих моделей больших языков, которые вам стоит попробовать.
1. GPT-4 от OpenAI
GPT-4 — это самая совершенная общедоступная модель большого языка на сегодняшний день. Разработан OpenAI и выпущен в марте 2023 года. GPT-4 — это последняя версия серии генеративных предварительно обученных трансформаторов. это началось в 2018 году. Благодаря своим огромным возможностям GPT-4 стал одной из наиболее широко используемых и самых популярных моделей больших языков в мире.
Хотя это и не подтверждено официально, источники полагают, что GPT-4 может содержать ошеломляющие 1,76 триллиона параметров. примерно в десять раз больше, чем его предшественник GPT-3.5, и в пять раз больше, чем флагман Google PaLM 2. Этот огромный масштаб обеспечивает мультимодальные возможности GPT-4, позволяя ему обрабатывать как текст, так и изображения в качестве входных данных. В результате GPT-4 может интерпретировать и описывать не только текст, но и визуальную информацию, такую как диаграммы и снимки экрана. Его мультимодальный характер обеспечивает более человечное понимание реальных данных.
По научным показателям GPT-4 значительно превосходит другие современные модели в различных тестах. Хотя одни только тесты не демонстрируют в полной мере сильные стороны модели, реальные примеры использования показали, что GPT-4 исключительно хорош в интуитивном решении практических задач. GPT-4 в настоящее время оплачивается по цене 20 долларов США в месяц. доступен через план ChatGPT Plus.
2. Клод 2 из Anthropic
Хотя Claude 2, разработанный Anthropic AI, не так популярен, как GPT-4, он может соответствовать техническим показателям GPT-4 и реальной производительности в нескольких областях. В некоторых стандартизированных тестах, включая отдельные экзамены, Claude 2 превосходит GPT-4. Модель языка AI также имеет значительно лучшее контекстное окно — около 100 000 токенов по сравнению с моделями GPT-4 с 8 и 32 тысячами токенов. Хотя большая длина контекста не всегда приводит к повышению производительности, расширенные возможности Claude 2 дают явные преимущества, например, обработку для анализа целых книг объемом 75 000 слов.
По общим характеристикам GPT-4 остается превосходящим, но наше внутреннее тестирование показывает, что Claude 2 превосходит его в нескольких творческих письменных заданиях. Судя по нашим оценкам, Клод 2 также уступает GPT-4 по навыкам программирования и математике, но превосходно дает человеческие и творческие ответы. Когда мы предложили всем моделям в этом списке написать или переписать творческую работу, в шести случаях из десяти мы выбрали результат Клода 2 из-за его естественного звучания, похожего на человеческий. В настоящее время, Claude 2 доступен бесплатно через чат-бота Claude AI.. Существует также платный план за 20 долларов для доступа к дополнительным функциям.
Несмотря на меньшую финансовую поддержку, чем у таких гигантов, как OpenAI и Microsoft, модель искусственного интеллекта Claude 2 от Anthropic не уступает популярным моделям GPT и серии PaLM от Google. Для ИИ с меньшим количеством ресурсов Клод 2 впечатляюще конкурентоспособен. Если вам придется сделать ставку на то, какая из существующих моделей имеет больше шансов конкурировать с GPT в ближайшем будущем, Claude 2 кажется самой безопасной ставкой. Несмотря на то, что Claude 2 уступает в финансировании, расширенные возможности позволяют предположить, что он может конкурировать даже с хорошо финансируемые гиганты (хотя стоит отметить, что Google внес несколько крупных вкладов в Антропный). Модель превзошла свою весовую категорию и подает надежды в качестве нового претендента.
3. GPT-3.5 OpenAI
Несмотря на то, что выпуск GPT-4 омрачен выпуском GPT-4, GPT-3.5 и его 175 миллиардов параметров не следует недооценивать. Благодаря итеративной тонкой настройке и обновлениям, ориентированным на производительность, точность и безопасность, GPT-3.5 прошел долгий путь по сравнению с исходной моделью GPT-3. Хотя ему не хватает мультимодальных возможностей GPT-4 и он отстает по длине контекста и количеству параметров, GPT-3.5 остается высокопроизводительным, а GPT-4 является единственной моделью, способной превзойти его всесторонние характеристики. решительно.
Несмотря на то, что GPT-3.5 является моделью второго уровня в семействе GPT, он может удерживать свои позиции и даже превосходить флагманские модели Google и Meta по нескольким критериям. В параллельных тестах математических и программных навыков с Google PaLM 2 различия не были резкими, а GPT-3.5 в некоторых случаях даже имел небольшое преимущество. Более творческие задачи, такие как юмор и написание повествований, позволили GPT-3.5 решительно вырваться вперед.
Таким образом, хотя GPT-4 знаменует собой новую веху в развитии искусственного интеллекта, GPT-3.5 остается впечатляюще мощной моделью, способной конкурировать, а иногда и превосходить даже самые продвинутые альтернативы. Постоянное совершенствование гарантирует, что он останется актуальным даже рядом с более яркими моделями следующего поколения.
4. Google PaLM 2.
При оценке возможностей модели ИИ проверенная формула — прочитать технический отчет и проверьте результаты тестов, но отнеситесь ко всему, что вы узнали, с недоверием и протестируйте модель. сам. Как это ни парадоксально, но результаты тестов не всегда совпадают с реальной производительностью некоторых моделей ИИ. На бумаге PaLM 2 от Google должен был стать убийцей GPT-4, а официальные результаты испытаний показали, что он соответствует GPT-4 в некоторых тестах. Однако при повседневном использовании вырисовывается иная картина.
В логическом рассуждении, математике и творчестве PaLM 2 не дотягивает до GPT-4. Он также отстает от Клода из Anthropic в ряде творческих писательских задач. Однако, хотя он и не соответствует заявленному статусу убийцы GPT-4, PaLM 2 от Google остается мощной языковой моделью сам по себе, с огромными возможностями. Большая часть негативных настроений вокруг него вызвана сравнением с такими моделями, как GPT-4, а не откровенной плохой производительностью.
Благодаря 340 миллиардам параметров PaLM 2 входит в число крупнейших моделей в мире. Он особенно преуспевает в многоязычных задачах и обладает сильными математическими способностями и способностями к программированию. Хотя PaLM 2 и не самый лучший в этом, он также весьма эффективен в творческих задачах, таких как письмо. Таким образом, хотя тесты рисовали оптимистичную картину, которая не полностью оправдалась, PaLM 2 по-прежнему демонстрирует впечатляющие навыки искусственного интеллекта, даже если и не превосходит всех конкурентов по всем направлениям.
5. TII Falcon-180B
Если вы не следите за быстрыми темпами выпуска моделей на языке искусственного интеллекта, вы, вероятно, никогда не сталкивались с Falcon-180B. Разработанный Институтом технологических инноваций ОАЭ, Falcon-180 с параметрами 180 миллиардов является одним из самых мощных доступны языковые модели с открытым исходным кодом, даже если им не хватает признания названий моделей GPT или широкого использования Meta Лама 2. Но не заблуждайтесь: Falcon-180B может конкурировать с лучшими в своем классе.
Результаты тестов показывают, что Falcon-180B превосходит большинство моделей с открытым исходным кодом и конкурирует с коммерческими гигантами, такими как ПалМ 2 и ГПТ-3.5. При тестировании задач по математике, программированию, рассуждению и творческому письму он даже обогнал GPT-3.5 и PaLM 2 на раз. Если ранжировать GPT-4, GPT-3.5 и Falcon-180B, мы поместим Falcon-180B прямо между GPT-4 и GPT-3.5 из-за его сильных сторон в нескольких случаях использования.
Хотя мы не можем с уверенностью сказать, что по общей производительности он лучше, чем GPT-3.5, он говорит сам за себя. Несмотря на то, что эта модель неясна, она заслуживает внимания, поскольку она соответствует или превосходит возможности более известных альтернатив. Опробовать модель Falcon-180B можно на Обнимающее лицо (платформа LLM с открытым исходным кодом).
Llama 2, большая языковая модель Meta AI с 70 миллиардами параметров, основана на своей предшественнице, Llama 1. Хотя Llama 2 меньше ведущих моделей, она значительно превосходит большинство общедоступных LLM с открытым исходным кодом в тестах и реальном использовании. Исключением может стать Falcon-180B.
Мы протестировали Llama 2 с GPT-4, GPT-3.5, Claude 2 и PaLM 2, чтобы оценить ее возможности. Неудивительно, что GPT-4 превзошёл Llama 2 практически по всем параметрам. Тем не менее, в нескольких оценках Llama 2 выдержала конкуренцию GPT-3.5 и PaLM 2. Хотя было бы неточно утверждать, что Llama 2 превосходит PaLM 2, Llama 2 решила множество проблем, которые ставили в тупик PaLM 2, включая задачи кодирования. Claude 2 и GPT-3.5 опередили Llama 2 в некоторых областях, но были значительно лучше только в ограниченном числе задач.
Так что, не превышая возможностей крупнейших фирменных моделей, Llama 2 с открытым исходным кодом превосходит свою весовую категорию. Для общедоступной модели она демонстрирует впечатляющую производительность, соперничая с гигантами искусственного интеллекта, такими как PaLM 2, в некоторых оценках. Llama 2 дает представление о будущем потенциале языковых моделей с открытым исходным кодом.
Разрыв в производительности между моделями ИИ сокращается
Хотя сфера искусственного интеллекта развивается стремительными темпами, GPT-4 от OpenAI остается лидером. Однако, хотя GPT-4 остается непревзойденным по масштабу и производительности, такие модели, как Claude 2, показывают, что при достаточном мастерстве модели меньшего размера могут конкурировать в определенных областях. PaLM 2 от Google, несмотря на то, что он не оправдал некоторых высоких ожиданий, по-прежнему демонстрирует огромные возможности. И Falcon-180B доказывает, что инициативы с открытым исходным кодом могут стоять плечом к плечу с гигантами отрасли при наличии достаточных ресурсов.