Детекторы контента AI не работают, и это большая проблема

Хотите проверить, было ли что-то создано искусственным интеллектом? Детекторы часто не работают, и это плохая новость для вашей безопасности.

Искусственный интеллект (ИИ) изменит целые сегменты нашего общества, нравится нам это или нет, включая Всемирную паутину.

С таким программным обеспечением, как ChatGPT, доступным любому, у кого есть подключение к Интернету, становится все труднее отделить контент, созданный ИИ, от контента, созданного человеком. Хорошо, что у нас есть детекторы контента с искусственным интеллектом, верно?

Работают ли детекторы контента AI?

Детекторы контента ИИ — это специализированные инструменты, которые определяют, было ли что-то написано компьютерной программой или человеком. Если вы просто введете в Google слова «Детектор контента AI», вы увидите есть десятки детекторов там, все утверждают, что они могут надежно различать человеческий и нечеловеческий текст.

Принцип их работы довольно прост: вы вставляете текст, и инструмент сообщает вам, был ли он сгенерирован ИИ или нет. С более технической точки зрения, используя комбинацию методов обработки естественного языка и машинного алгоритмы обучения, детекторы контента ИИ ищут шаблоны и предсказуемость и совершают звонки на основе что.

instagram viewer

На бумаге это звучит великолепно, но если вы когда-либо использовали инструмент обнаружения ИИ, вы очень хорошо знаете, что они, мягко говоря, случайны. Чаще всего они определяют написанный человеком контент как ИИ или текст, созданный людьми, как сгенерированный ИИ. На самом деле, некоторые смущающе плохи в том, что они должны делать.

Насколько точны детекторы контента AI?

Если вы находитесь в Соединенных Штатах, первым результатом поиска в Google по запросу «детектор содержания ИИ» будет write.com (ранее известный как Qordoba; это контент-платформа AI, которая также имеет собственный детектор). Но когда вы вставляете часть этого случайного Ассошиэйтед Пресс статьи в инструмент, он утверждает, что есть очень большая вероятность, что она была создана искусственным интеллектом.

Значит, автор.com ошибся.

Справедливости ради следует отметить, что другие детекторы контента ИИ едва ли чем-то лучше. Они не только дают ложные срабатывания, но и помечают контент ИИ как человеческий. И даже если они этого не делают, незначительных изменений в тексте, сгенерированном ИИ, достаточно, чтобы пройти с честью.

В феврале 2023 года преподаватель Университета Вуллонгонга Армин Алимардани и доцент Университета Нового Южного Уэльса в Сиднее Эмма А. Джейн протестировала ряд популярных детекторов контента ИИ и установила, что ни один из них не является надежным. В своем анализе, опубликованном в Разговор, Алимардани и Джейн пришли к выводу, что эта «гонка вооружений» ИИ между текстовыми генераторами и детекторами станет серьезной проблемой в будущем, особенно для преподавателей.

Но повод для беспокойства есть не только у воспитателей и учителей: они есть у всех. По мере того, как генерируемый ИИ текст становится повсеместным, появляется возможность различать, что «настоящее», а что нет, т. е. на самом деле замечать, когда что-то пишет ИИ, станет сложнее. Это окажет огромное влияние практически на все отрасли и сферы жизни общества, даже на личные отношения.

Влияние ИИ на кибербезопасность и конфиденциальность

Тот факт, что не существует надежных механизмов для определения того, было ли что-то создано программным обеспечением или человеком, имеет серьезные последствия для кибербезопасности и конфиденциальности.

Злоумышленники уже использование ChatGPT для написания вредоносных программ, генерировать фишинговые письма, рассылать спам, создавать мошеннические сайты и многое другое. И хотя есть способы защититься от этого, безусловно, беспокоит отсутствие программного обеспечения, способного надежно различать органический контент и контент ботов.

Фейковые новости тоже уже стали серьезной проблемой. Благодаря генеративному ИИ агенты дезинформации могут беспрецедентно масштабировать свою деятельность. В то же время у обычного человека нет возможности узнать, было ли то, что он читает в Интернете, создано программой или человеком.

Конфиденциальность — это совсем другое дело. Возьмем, к примеру, ChatGPT. Это было содержит более 300 миллиардов слов до его запуска. Этот контент был взят из книг, сообщений в блогах и форумах, статей и социальных сетей. Он был собран без чьего-либо согласия и, по-видимому, с полным игнорированием конфиденциальности и защиты авторских прав.

Тогда есть также проблема ложных срабатываний. Если контент ошибочно помечен как созданный ИИ, не может ли это привести к цензуре, что в любом случае является серьезной проблемой? Не говоря уже об ущербе, который обвинение в использовании созданного ИИ текста может нанести репутации как в Интернете, так и в реальной жизни.

Если действительно существует гонка вооружений между генеративным ИИ и детекторами контента, то первый побеждает. Что еще хуже, похоже, решения нет. У всех нас есть полуфабрикаты, которые не работают даже в половине случаев или их очень легко обмануть.

Как обнаружить AI-контент: возможные решения

То, что в настоящее время у нас, кажется, нет реальных ответов на эту проблему, не означает, что у нас не будет их в будущем. На самом деле уже есть несколько серьезных предложений, которые могли бы сработать. Водяной знак — это одно.

Когда дело доходит до ИИ и моделей глубокого языка, водяные знаки означают встраивание своего рода секретного кода в текст, сгенерированный ИИ (например, шаблон слова, стиль пунктуации). Такой водяной знак будет невидим невооруженным глазом, и поэтому его будет практически невозможно удалить, но специализированное программное обеспечение сможет его обнаружить.

На самом деле, еще в 2022 г. Университет Мэриленда Исследователи разработали новый метод водяных знаков для искусственных нейронных сетей. Ведущий исследователь Том Гольдштейн сказал в то время, что его команде удалось «математически доказать», что их водяной знак нельзя удалить полностью.

Пока что обычный человек может полагаться на свои инстинкты и здравый смысл. Если что-то не так с контентом, который вы читаете, — если он кажется вам неестественным, повторяющимся, лишенным воображения, банальным — возможно, это было создано программным обеспечением. Конечно, вы также должны проверять любую информацию, которую видите в Интернете, дважды проверять источник и держаться подальше от сомнительных веб-сайтов.

Революция искусственного интеллекта в самом разгаре

Некоторые утверждают, что пятая промышленная революция уже наступила, поскольку искусственный интеллект занимает центральное место в том, что описывается как конвергенция цифрового и физического. Так это на самом деле или нет, все, что мы можем сделать, это приспособиться.

Хорошая новость заключается в том, что индустрия кибербезопасности приспосабливается к этой новой реальности и внедряет новые стратегии защиты с использованием ИИ и машинного обучения на переднем крае.

About Technology - denizatm.com

Детекторы контента AI не работают, и это большая проблема

Работают ли детекторы контента AI?

Насколько точны детекторы контента AI?

Влияние ИИ на кибербезопасность и конфиденциальность

Как обнаружить AI-контент: возможные решения

Революция искусственного интеллекта в самом разгаре

категории

Recent Post

Полное руководство по настройке Safari для Mac

10 быстрых советов, чтобы стать лучше в Outlook

Как оптимизировать интерфейс ленты Office 2016 или меню