Авторы требуют компенсацию — до 150 тысяч долларов за каждое произведение, а также блокировку дальнейшего использования их работ. Если иск будет удовлетворён, он может создать прецедент, который изменит не только подход к обучению ИИ, но и всю логику развития генеративных моделей.
В центре конфликта — вопрос: можно ли использовать произведения, защищённые авторским правом, для машинного обучения без согласия автора? Писатели считают, что нет. Более того, они утверждают, что корпорация использовала не просто книги, а их нелегальные копии, то есть получила доступ к текстам через пиратские источники. С точки зрения закона, это серьёзное обвинение: в отличие от ситуации, когда речь идёт о данных из открытых источников, тут предполагается прямое нарушение авторских прав.
Однако здесь всё не так однозначно. Ранее федеральный суд США уже рассматривал подобный иск — против другой крупной технологической компании — и пришёл к выводу, что обучение ИИ может подпадать под принцип «добросовестного использования». Это юридическое понятие, которое разрешает ограниченное использование чужого контента без согласия автора, если это делается не в ущерб рыночной стоимости произведения и носит трансформирующий характер. Проблема в том, что само понятие «добросовестности» здесь трактуется слишком широко — от судебного округа до судебного округа, от прецедента к прецеденту.
Microsoft, как и другие разработчики ИИ, находится в уязвимой позиции. С одной стороны, такие компании обучают модели на огромных объёмах текста — и зачастую физически невозможно получить согласие от каждого правообладателя. С другой — именно эти данные лежат в основе коммерчески успешных решений, включая продукты, которые уже продаются клиентам и встраиваются в бизнес‑процессы.
Если суд встанет на сторону писателей, это приведёт к необходимости пересмотра всей логики обучения ИИ. Придётся заключать лицензионные соглашения, платить авторам или использовать только «чистые» наборы данных — то есть те, на которые есть официальные права. Это резко увеличит издержки, снизит темпы разработки и, возможно, укрепит позиции тех, кто успеет договориться с крупнейшими издателями и агрегаторами контента.
Для бизнеса это важный сигнал: эпоха «бесплатных данных» подходит к концу. Создание и использование ИИ-моделей всё чаще будет требовать не только вычислительных мощностей, но и юридической чистоты. Рано или поздно это приведёт к появлению целых библиотек лицензионных текстов, доступ к которым будут продавать, как сейчас продают доступ к музыке или фотографиям. А значит, в бизнес-процессы придётся закладывать не только расходы на серверы и программистов, но и на права использования чужих текстов.
Процесс с Microsoft может стать переломным. Он покажет, готовы ли суды в США пересматривать старые нормы ради новых технологий — или всё-таки встанут на сторону авторов. Для всех, кто работает с ИИ, это уже не вопрос теории. Это вопрос выживания и устойчивости моделей в реальных условиях рынка и регулирования.
Присоединяйтесь — мы покажем вам много интересного
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев