Хотите предоставить ChatGPT свои пользовательские данные? Вот пошаговая инструкция, как это сделать!

Предоставляя технологию GPT в мощном и простом в использовании чат-боте, ChatGPT стал самым популярным в мире инструментом искусственного интеллекта. Многие люди используют ChatGPT, чтобы вести увлекательные беседы, отвечать на вопросы, предлагать творческие предложения и помогать в написании кода и написании кода. Тем не менее, ChatGPT ограничен, поскольку вы не можете хранить свои данные для длительного личного использования, а предельный срок хранения данных знаний — сентябрь 2021 года.

В качестве обходного пути мы можем использовать API OpenAI и LangChain для предоставления ChatGPT пользовательских данных и обновленной информации после 2021 года для создания собственного экземпляра ChatGPT.

Зачем предоставлять ChatGPT пользовательские данные?

Предоставление ChatGPT пользовательских данных и предоставление обновленной информации после даты прекращения сбора данных дает несколько преимуществ по сравнению с обычным использованием ChatGPT. Вот несколько из них:

instagram viewer
  • Персонализированные взаимодействия: Предоставляя ChatGPT пользовательские данные, пользователи могут создать более индивидуальный интерфейс. Модель можно обучать на определенных наборах данных, относящихся к отдельным пользователям или организациям, что приводит к получению ответов, адаптированных к их уникальным потребностям и предпочтениям.
  • Экспертиза в конкретной области: Интеграция пользовательских данных позволяет ChatGPT специализироваться на определенных доменах или отраслях. Его можно обучать отраслевым знаниям, терминологии и тенденциям, что позволяет более точно и проницательно реагировать в этих конкретных областях.
  • Актуальная и точная информация: Доступ к обновленной информации гарантирует, что ChatGPT будет в курсе последних событий и знаний. Он может предоставлять точные ответы на основе последних событий, новостей или исследований, что делает его более надежным источником информации.

Теперь, когда вы понимаете важность предоставления пользовательских данных для ChatGPT, вот пошаговая инструкция, как это сделать на локальном компьютере.

Шаг 1: Установите и загрузите программное обеспечение и готовый скрипт

Обратите внимание, что следующие инструкции относятся к компьютеру с Windows 10 или Windows 11.

Чтобы предоставить пользовательские данные для ChatGPT, вам необходимо установить и загрузить последнюю версию Python3, Git, Microsoft C++ и скрипт извлечения ChatGPT с GitHub. Если на вашем компьютере уже установлено какое-то программное обеспечение, убедитесь, что оно обновлено до последней версии, чтобы избежать сбоев в процессе.

Начните с установки:

  • Скачать:Python3 (Бесплатно)
  • Скачать:Гит (Бесплатно)
  • Скачать:Инструменты визуальной сборки Майкрософт (Бесплатно)

Замечания по установке Python3 и Microsoft C++

При установке Python3 убедитесь, что вы отметили Добавьте python.exe в PATH вариант перед нажатием Установите сейчас. Это важно, так как позволяет вам получить доступ к Python из любого каталога на вашем компьютере.

При установке Microsoft C++ вам нужно установить Инструменты сборки Microsoft Visual Studio первый. После установки можно поставить галочку Настольная разработка на C++ вариант и нажмите Установить со всеми дополнительными инструментами, автоматически отмеченными на правой боковой панели.

Теперь, когда вы установили последние версии Python3, Git и Microsoft C++, вы можете загрузить скрипт Python, чтобы легко запрашивать пользовательские локальные данные.

Скачать: Скрипт поиска ChatGPT (Бесплатно)

Чтобы скачать скрипт, нажмите на Код, затем выберите Скачать ZIP. Это должно загрузить скрипт Python в ваш каталог по умолчанию или в выбранный каталог.

После загрузки мы можем настроить локальную среду.

Шаг 2: Настройте локальную среду

Чтобы настроить среду, вам нужно открыть терминал в папке chatgpt-retrieval-main, которую вы скачали. Для этого откройте чатгпт-поиск-основной папку, щелкните правой кнопкой мыши и выберите Открыть в Терминале.

Когда терминал открыт, скопируйте и вставьте эту команду:

pip install langchain openai chromadb tiktoken неструктурированный

Эта команда использует диспетчер пакетов Python для создавать и управлять виртуальной средой Python нужный.

После создания виртуальной среды нам необходимо предоставить ключ API OpenAI для доступа к их услугам. Сначала нам нужно сгенерировать ключ API из Сайт ключей API OpenAI нажав на Создать новый секретный ключ, добавив имя клавиши, затем нажав Кнопка создания секретного ключа.

Вам будет предоставлена ​​строка символов. Это ваш ключ API OpenAI. Скопируйте его, нажав на значок копирования сбоку от ключа API. Обратите внимание, что этот ключ API должен храниться в секрете. Не делитесь им с другими, если вы действительно не хотите, чтобы они использовали его вместе с вами.

После копирования вернитесь в папку chatgpt-retrieval-main и откройте константы с помощью Блокнот. Теперь замените заполнитель своим ключом API. Не забудьте сохранить файл!

Теперь, когда вы успешно настроили свою виртуальную среду и добавили свой ключ API OpenAI в качестве переменной среды. Теперь вы можете предоставить свои пользовательские данные в ChatGPT.

Шаг 3: Добавление пользовательских данных

Чтобы добавить пользовательские данные, поместите все ваши пользовательские текстовые данные в данные папка в файле chatgpt-retrieval-main. Формат текстовых данных может быть в виде PDF, TXT или DOC.

Как вы можете видеть на скриншоте выше, я добавил текстовый файл, содержащий выдуманное личное расписание, статью, которую я написал на Ускорители Instinct от AMDи PDF-документ.

Шаг 4. Запрос ChatGPT через терминал

Сценарий Python позволяет нам запрашивать данные из пользовательских данных, которые мы добавили в папку данных и в Интернете. Другими словами, у вас будет доступ к обычному бэкэнду ChatGPT и всем данным, хранящимся локально в папке данных.

Чтобы использовать скрипт, запустите python chatgpt.py script, а затем добавьте свой вопрос или запрос в качестве аргумента.

питон chatgpt.py "ВАШ ВОПРОС"

Обязательно заключайте свои вопросы в кавычки.

Чтобы проверить, успешно ли мы передали ChatGPT наши данные, я задам личный вопрос относительно Персональный план.txt файл.

Это сработало! Это означает, что ChatGPT смог прочитать файл Personal Sched.txt, предоставленный ранее. Теперь давайте посмотрим, успешно ли мы передали ChatGPT информацию, которую он не знает из-за даты прекращения сбора данных.

Как видите, он правильно описал AMD Instinct MI250x, который был выпущен после истечения срока действия ChatGPT-3.

Ограничения пользовательского ChatGPT

Хотя добавление в GPT-3.5 пользовательских данных открывает больше возможностей для применения и использования LLM, есть несколько недостатков и ограничений.

Во-первых, вам необходимо предоставить все данные самостоятельно. Вы по-прежнему можете получить доступ ко всем знаниям о GPT-3.5 до даты прекращения его использования; однако вы должны предоставить все дополнительные данные. Это означает, что если вы хотите, чтобы ваша локальная модель была осведомлена об определенной теме в Интернете, которую GPT-3.5 еще не знает, вам нужно будет зайти в Интернет и самостоятельно очистить данные и сохранить их в виде текста в папке данных chatgpt-retrieval-main.

Другая проблема заключается в том, что такой запрос ChatGPT требует больше времени для загрузки по сравнению с прямым запросом ChatGPT.

Наконец, единственная доступная в настоящее время модель — GPT-3.5 Turbo. Таким образом, даже если у вас есть доступ к GPT-4, вы не сможете использовать его для управления собственным экземпляром ChatGPT.

Пользовательский ChatGPT — это круто, но с ограничениями

Предоставление пользовательских данных в ChatGPT — это мощный способ получить больше от модели. С помощью этого метода вы можете передавать модели любые текстовые данные и запрашивать их, как обычный ChatGPT, хотя и с некоторыми ограничениями. Однако это изменится в будущем, поскольку станет проще интегрировать наши данные с LLM, а также получить доступ к последней модели GPT-4.