После запуска ChatGPT в ноябре 2022 года феноменальный чат-бот с искусственным интеллектом стал одним из самых надежных инструментов для письма в Интернете. Он прост в использовании; опишите, что вам нужно написать, и ChatGPT выведет это на экран за считанные секунды.

Однако в эпоху, когда текст, созданный ИИ, выдается за написанный человеком и используется для получения несправедливого преимущества, идентификация контента ИИ очень важна. Но ChatGPT не может точно определять контент ИИ, даже свою собственную работу, но почему?

Есть ли разница между ИИ-текстом и человеческим письмом?

Предварительным условием для того, чтобы ChatGPT распознал свой собственный текст или любой текст, созданный ИИ, является то, что между ним и текстом, написанным человеком, должна быть разница. Итак, есть ли существенная разница между текстом, написанным человеком, и контентом, созданным ИИ? Если есть, конечно, такой инструмент, как ChatGPT, должен быть в состоянии различить его.

Мы написали короткую историю без участия какого-либо инструмента ИИ, а затем спросили ChatGPT, была ли эта история написана ИИ. ChatGPT уверенно пометил его как текст, сгенерированный искусственным интеллектом.

Затем мы попросили ChatGPT сгенерировать историю и в той же ветке чата скопировали и вставили сгенерированный текст и спросили ChatGPT, был ли текст создан ИИ. Ответ ChatGPT? Уверенное «Нет».

ChatGPT не смог идентифицировать текст, написанный человеком или сгенерированный ИИ, в обоих случаях. Так почему же ChatGPT не может обнаружить свой собственный текст? Означает ли это, что нет никакой разницы между ИИ и человеческим текстом?

Ну, есть. Мы могли бы написать целую книгу о разнице между ними, но это не будет иметь большого значения. Итак, если есть разница, почему ChatGPT или любой другой инструмент ИИ не может определить эти различия и точно указать текст, сгенерированный ИИ, от текста, написанного человеком? Ответ заключается в как работает ChatGPT и как он генерирует текст.

Как ChatGPT генерирует текст

Когда вы просите ChatGPT сгенерировать текст, он пытается имитировать процесс письма человеком. Во-первых, модель, лежащая в основе ChatGPT — генеративный предварительно обученный преобразователь (GPT), — была обучена на большом корпусе человеческого текста. Все, от электронных писем, статей о здоровье, технических статей, школьных сочинений и почти любого текста, который вы можете найти в Интернете, было передано модели во время обучения. Итак, ChatGPT понимает, как должен быть написан каждый из этих типов текстов.

Если вы попросите ChatGPT написать электронное письмо вашему боссу, он знает, как должно выглядеть электронное письмо такого рода, потому что он был обучен на похожих электронных письмах — возможно, на тысячах. Точно так же, если вы попросите его написать сочинение для старшеклассников, оно также знает, как должно звучать сочинение для старшеклассников. ChatGPT попытается написать все, что вы хотите, так, как это сделал бы человек.

Но есть одна загвоздка. В отличие от того, как люди пишут, ChatGPT на самом деле не понимает, что пишет, так, как человек. Вместо этого чат-бот пытается предсказать, какое следующее слово в предложении будет наиболее правдоподобным, пока не завершит запись.

Как ChatGPT записывает предсказания

Допустим, вы просите ChatGPT написать рассказ о вымышленном городе Волкра. Существует огромная вероятность того, что чат-бот начнет рассказ со слов «Жили-были». Это потому, что чат-бот не думает себя, но пытается предсказать, что напишет человек, основываясь на том, что он узнал из тысяч историй, которые ему скормили во время обучение.

Таким образом, полагая, что человек, скорее всего, начнет рассказ со слов «Жили-были», ChatGPT затем попытается предсказать следующее логическое слово, которое быть «а», за которым следует «время». Таким образом, у вас будет «Однажды...», за которым следует следующее логическое слово, и так до тех пор, пока история не будет завершена. ChatGPT в основном пишет, предсказывая, какое слово естественным образом (или, по крайней мере, с наибольшей вероятностью) будет следующим в предложении, и вставляя его.

Таким образом, когда инструмент ИИ пытается определить, создан ли текст ИИ, одним из критериев, который он пытается взвесить, является предсказуемость текста, поскольку инструменты ИИ пишут прогнозированием. Эта мера предсказуемости на языке ИИ называется растерянностью. Теперь, когда представлен текст, помимо других критериев, инструмент искусственного интеллекта, такой как ChatGPT, пытается проанализировать текст, чтобы измерить, насколько предсказуема последовательность слов или предложений в тексте. Большая предсказуемость или низкий уровень недоумения обычно означают, что текст, скорее всего, сгенерирован искусственным интеллектом. Меньшая предсказуемость или более высокая степень недоумения обычно означает, что текст, вероятно, написан людьми.

Этих критериев, наряду с другими факторами, такими как уровень креативности текста, к сожалению, недостаточно, чтобы с уверенностью установить, написан ли текст с помощью инструмента ИИ или нет. Это потому, что люди могут писать с большей вариативностью, как в примере текста, который мы использовали для демонстрации в начале этой статьи.

Чат-боты с искусственным интеллектом, такие как ChatGPT, максимально имитируют естественный человеческий язык. Таким образом, хотя текст ИИ может иметь различимые шаблоны, эти шаблоны не так очевидны даже для такого мощного инструмента, как ChatGPT. Вот почему ChatGPT не может распознать собственный текст, а также почему инструменты AI-детектора текста не работают.

Будет ли ChatGPT распознавать собственные тексты в будущем?

В настоящее время такие инструменты, как ChatGPT, не могут определить, был ли текст написан самим собой или каким-либо другим инструментом ИИ, потому что в контенте, созданном ИИ, нет четкой, различимой закономерности. Тем не менее, есть хороший шанс, что это может измениться в ближайшее время. Благодаря усилиям таких компаний, как ChatGPT, по внедрению цифровых водяных знаков в контент, генерируемый ChatGPT, в тексте, генерируемом чат-ботом, будет более различимый шаблон.