Большие языковые модели (LLM) — это базовая технология, которая привела к стремительному росту генеративных чат-ботов с искусственным интеллектом. Такие инструменты, как ChatGPT, Google Bard и Bing Chat, полагаются на LLM, чтобы генерировать человеческие ответы на ваши подсказки и вопросы.
Но что такое LLM и как они работают? Здесь мы решили демистифицировать LLM.
Что такое большая языковая модель?
Проще говоря, LLM — это массивная база данных текстовых данных, на которую можно ссылаться, чтобы генерировать человеческие ответы на ваши подсказки. Текст поступает из различных источников и может состоять из миллиардов слов.
Среди распространенных источников текстовых данных используются:
- Литература: LLM часто содержат огромное количество современной и классической литературы. Это могут быть книги, стихи и пьесы.
- Интернет-контент: LLM чаще всего будет содержать большой репозиторий онлайн-контента, включая блоги, веб-контент, вопросы и ответы на форумах и другой онлайн-текст.
- Новости и текущие события: Некоторые, но не все, LLM могут получить доступ к текущим темам новостей. Некоторые LLM, такие как GPT-3.5, ограничены в этом смысле.
- Социальные медиа: Социальные сети представляют собой огромный ресурс естественного языка. LLM используют текст с основных платформ, таких как Facebook, Twitter и Instagram.
Конечно, иметь огромную базу данных текстов — это одно, но LLM нужно научить понимать их смысл, чтобы давать ответы, подобные человеческим. Как это происходит, мы рассмотрим далее.
Как работают LLM?
Как LLM используют эти репозитории для создания своих ответов? Первым шагом является анализ данных с использованием процесса, называемого глубоким обучением.
Глубокое обучение используется для выявления закономерностей и нюансов человеческого языка. Это включает в себя понимание грамматики и синтаксиса. Но что важно, он также включает в себя контекст. Понимание контекста является важной частью LLM.
Давайте рассмотрим пример того, как LLM могут использовать контекст.
В подсказке на следующем изображении упоминается летучая мышь ночью. Из этого ChatGPT понял, что речь идет о животном, а не, например, о бейсбольной бите. Конечно, другие чат-боты, такие как Чат Bing или Google Bard может ответить на это совершенно иначе.
Однако он не является безошибочным, и, как показывает этот пример, иногда вам потребуется предоставить дополнительную информацию, чтобы получить желаемый ответ.
В данном случае мы намеренно немного запутались, чтобы продемонстрировать, как легко теряется контекст. Но люди тоже могут неправильно понимать контекст вопросов, и для исправления ответа требуется только дополнительная подсказка.
Чтобы генерировать эти ответы, LLM используют технику, называемую генерацией естественного языка (NLG). Это включает в себя проверку входных данных и использование шаблонов, извлеченных из хранилища данных, для создания контекстно-правильного и соответствующего ответа.
Но LLM идут глубже. Они также могут адаптировать ответы в соответствии с эмоциональным тоном ввода. В сочетании с контекстуальным пониманием эти два аспекта являются основными движущими силами, которые позволяют LLM создавать ответы, подобные человеческим.
Подводя итог, можно сказать, что LLM используют массивную текстовую базу данных с сочетанием методов глубокого обучения и NLG для создания ответов, подобных человеческим, на ваши подсказки. Но есть ограничения того, чего можно достичь.
Каковы ограничения LLM?
LLM представляют собой впечатляющее технологическое достижение. Но технология далека от совершенства, и есть еще много ограничений относительно того, чего они могут достичь. Некоторые из наиболее заметных из них перечислены ниже:
- Контекстное понимание: Мы упоминали об этом как о том, что LLM включают в свои ответы. Однако они не всегда понимают это правильно и часто не могут понять контекст, что приводит к неуместным или просто неправильным ответам.
- Предвзятость: Любые смещения, присутствующие в обучающих данных, часто могут присутствовать в ответах. Это включает предубеждения в отношении пола, расы, географии и культуры.
- Здравый смысл: Здравый смысл трудно поддается количественной оценке, но люди учатся этому с раннего возраста, просто наблюдая за окружающим миром. У LLM нет этого врожденного опыта, на который можно было бы опереться. Они понимают только то, что им предоставили через данные обучения, и это не дает им истинного понимания мира, в котором они существуют.
- LLM хорош настолько, насколько хороши его обучающие данные: Точность никогда не может быть гарантирована. Старая компьютерная пословица «Мусор на входе, мусор на выходе» прекрасно суммирует это ограничение. LLM хороши настолько, насколько позволяют качество и количество их обучающих данных.
Существует также аргумент, что этические соображения можно считать ограничением LLM, но эта тема выходит за рамки данной статьи.
3 примера популярных LLM
Продолжающееся развитие ИИ в настоящее время в значительной степени поддерживается LLM. Так что, хотя они и не совсем новая технология, они, безусловно, достигли критической точки, и сейчас существует множество моделей.
Вот некоторые из наиболее широко используемых LLM.
1. GPT
Генеративный предварительно обученный преобразователь (GPT), пожалуй, самый широко известный LLM. GPT-3.5 поддерживает платформу ChatGPT, используемую для примеров в этой статье, а самая новая версия, GPT-4, доступна. через подписку ChatGPT Plus. Microsoft также использует последнюю версию на своей платформе Bing Chat.
2. ЛаМДА
Это первый LLM, используемый Google Bard, чат-ботом Google AI. Версия, с которой изначально был выпущен Bard, описывалась как «облегченная» версия LLM. Его заменила более мощная итерация PaLM LLM.
3. БЕРТ
BERT расшифровывается как двунаправленное представление кодировщика от трансформаторов. Двунаправленные характеристики модели различаются BERT от других LLM, таких как GPT.
Было разработано гораздо больше LLM, и ответвления основных LLM являются обычными. По мере развития они будут становиться все более сложными, точными и актуальными. Но что ждет LLM в будущем?
Будущее LLM
Они, несомненно, определят то, как мы взаимодействуем с технологиями в будущем. Быстрое внедрение таких моделей, как ChatGPT и Bing Chat, является свидетельством этого факта. В краткосрочной перспективе, ИИ вряд ли заменит вас на работе. Но все еще существует неопределенность в отношении того, насколько большую роль в нашей жизни они будут играть в будущем.
Этические аргументы еще могут повлиять на то, как мы интегрируем эти инструменты в общество. Однако, отложив это в сторону, некоторые из ожидаемых разработок LLM включают:
- Повышенная эффективность: LLM с сотнями миллионов параметров невероятно требовательны к ресурсам. С улучшением аппаратного обеспечения и алгоритмов они, вероятно, станут более энергоэффективными. Это также ускорит время отклика.
- Улучшенная контекстная осведомленность:LLM самообучаются; чем больше использования и отзывов они получают, тем лучше они становятся. Важно отметить, что это без какой-либо дальнейшей серьезной инженерии. По мере развития технологий это приведет к улучшению языковых возможностей и контекстуальной осведомленности.
- Обучены для конкретных задач: Инструменты мастера на все руки, которые являются публичным лицом LLM, подвержены ошибкам. Но по мере того, как они развиваются и пользователи обучают их конкретным потребностям, LLM могут играть большую роль в таких областях, как медицина, право, финансы и образование.
- Большая интеграция: LLM могут стать персональными цифровыми помощниками. Представьте себе Siri на стероидах, и вы поймете. LLM могут стать виртуальными помощниками, которые помогут вам во всем, от предложения еды до обработки вашей корреспонденции.
Это лишь некоторые из областей, в которых LLM, вероятно, станут большей частью нашего образа жизни.
Преобразование и обучение LLM
LLM открывают захватывающий мир возможностей. Быстрый рост чат-ботов, таких как ChatGPT, Bing Chat и Google Bard, свидетельствует о том, что в эту область вливаются ресурсы.
Такое распространение ресурсов может только привести к тому, что эти инструменты станут более мощными, универсальными и точными. Потенциальные области применения таких инструментов огромны, и на данный момент мы только царапаем поверхность невероятного нового ресурса.