Модели искусственного интеллекта, такие как ChatGPT и Bard, обучаются с использованием данных, созданных людьми. Чем больше данных они поглощают, тем умнее они становятся в подражании человеческому интеллекту и творчеству. Крупные игроки в индустрии искусственного интеллекта, такие как OpenAI и Meta, развернули большие языковые модели, обученные путем извлечения данных из текстов и книг, доступных в Интернете.

Из-за того, как обучаются LLM, неизбежен конфликт между законом об авторском праве и искусственным интеллектом. Теперь цыплята возвращаются домой, чтобы насестить, поскольку Сара Сильверман и другие художники судятся с OpenAI и Meta за нарушение авторских прав.

В коллективный иск [PDF] подан в Калифорнии, комик Сара Сильверман и другие писатели (Кристофер Голден и Ричард Кадри) добиваются возмещения убытков с OpenAI и Meta за нарушение авторских прав. В иске утверждается, что OpenAI и Meta украли защищенные авторским правом книги с пиратских сайтов для обучения своих моделей ИИ. Это эквивалентно тому, что модель ИИ загружает свои обучающие наборы данных с Piratebay без компенсации авторам.

По совпадению, отдельный коллективный иск [PDF] против OpenAI утверждает, что компания использовала несанкционированную личную информацию для обучения ChatGPT. Google также столкнулся с аналогичным судебным процессом по обвинению в использовании украденных данных для обучения Google Bard. Вот почему вы должны сделайте привычкой защищать свою личную информацию, хотя публикация работы и личные личные данные — это не одно и то же.

Каковы шансы, что Сара Сильверман может выиграть судебный процесс?

Кредит изображения: фрипик

Сильверман и другие художники утверждают, что ChatGPT может точно резюмировать их книги по запросу. В жалобе утверждается, что это было бы невозможно, если бы модель ИИ не имела доступа к материалам, защищенным авторским правом. Однако, если ChatGPT обучался на миллиардах интернет-текстов, он, скорее всего, наткнулся на статьи, комментарии и посты в социальных сетях, в которых обсуждались книги.

Кроме того, Meta раскрыла, где она приобрела книги, которые использовала для обучения своей модели ИИ — источник был прослежен до торрент-сайта электронных книг. Точно так же в коллективном иске против OpenAI также упоминаются незаконные веб-сайты, где OpenAI подозревается в получении материалов, защищенных авторским правом, но OpenAI еще не подтвердила свои источники.

Если будет доказано, что OpenAI и Meta использовали нелегальные торрент-сайты для получения материалов, защищенных авторским правом, для обучения своих моделей ИИ, у Сильвермана может быть шанс выиграть судебный процесс. Тем не менее, модели ИИ — это неизведанная территория, и у судов нет прецедентов, на которые они могли бы положиться, чтобы вынести решение, основанное на нарушении авторских прав ИИ. Собственно, это одна из причин, почему ЕС предложил Закон об ИИ.

Каково будущее моделей ИИ и закона об авторском праве?

Мы все еще находимся на заре ИИ, чтобы знать, как он адаптируется к закону об авторском праве. Еще сложнее попытаться понять кому принадлежат авторские права на создание ИИ. Но для людей-создателей существуют правила, защищающие их от того, чтобы кто-то другой получил доступ к их материалам, защищенным авторским правом, без компенсации, согласия или кредита. Если правила существуют для людей, будут ли они применяться к моделям ИИ?

Парламент ЕС представил наиболее близкий взгляд на будущее того, как модели ИИ будут соответствовать закону об авторском праве. Если Закон ЕС об искусственном интеллекте будет принят в качестве закона, модели искусственного интеллекта, такие как ChatGPT и Bard, должны будут публиковать все свои источники наборов данных и данные, защищенные авторским правом, используемые для обучения. Это поможет устранить любую путаницу, если модели ИИ получили доступ к книгам, фильмам, музыке и фотографиям, защищенным авторским правом, для обучения через нелегальные пиратские веб-сайты.

Решение коллективного иска AI создаст юридический прецедент

Большие языковые модели могут очищать все уголки Интернета в поисках данных, используемых при обучении. Но будут ли они нести ответственность за нарушение авторских прав, если они получат доступ к нелегальным торрент-сайтам для получения данных? И если они это сделают, вы можете это доказать?

Независимо от исхода, коллективные иски против технологических компаний, владеющих самыми популярными моделями ИИ, создадут прецедент, который будет актуален в будущем.