Группа писателей подала иск против Microsoft, обвинив корпорацию в том, что она использовала около 200 тысяч... | Интересный контент в группе Маркетинговое агенство RunetRulit в ОК (Одноклассники)

Группа писателей подала иск против Microsoft, обвинив корпорацию в том, что она использовала около 200 тысяч пиратских копий книг для обучения своей модели искусственного интеллекта под названием Megatron. Авторы требуют компенсацию — до 150 тысяч долларов за каждое произведение, а также блокировку дальнейшего использования их работ. Если иск будет удовлетворён, он может создать прецедент, который изменит не только подход к обучению ИИ, но и всю логику развития генеративных моделей. В центре конфликта — вопрос: можно ли использовать произведения, защищённые авторским правом, для машинного обучения без согласия автора? Писатели считают, что нет. Более того, они утверждают, что корпорация использовала не просто книги, а их нелегальные копии, то есть получила доступ к текстам через пиратские источники. С точки зрения закона, это серьёзное обвинение: в отличие от ситуации, когда речь идёт о данных из открытых источников, тут предполагается прямое нарушение авторских прав. Однако здесь всё не так однозначно. Ранее федеральный суд США уже рассматривал подобный иск — против другой крупной технологической компании — и пришёл к выводу, что обучение ИИ может подпадать под принцип «добросовестного использования». Это юридическое понятие, которое разрешает ограниченное использование чужого контента без согласия автора, если это делается не в ущерб рыночной стоимости произведения и носит трансформирующий характер. Проблема в том, что само понятие «добросовестности» здесь трактуется слишком широко — от судебного округа до судебного округа, от прецедента к прецеденту. Microsoft, как и другие разработчики ИИ, находится в уязвимой позиции. С одной стороны, такие компании обучают модели на огромных объёмах текста — и зачастую физически невозможно получить согласие от каждого правообладателя. С другой — именно эти данные лежат в основе коммерчески успешных решений, включая продукты, которые уже продаются клиентам и встраиваются в бизнес‑процессы. Если суд встанет на сторону писателей, это приведёт к необходимости пересмотра всей логики обучения ИИ. Придётся заключать лицензионные соглашения, платить авторам или использовать только «чистые» наборы данных — то есть те, на которые есть официальные права. Это резко увеличит издержки, снизит темпы разработки и, возможно, укрепит позиции тех, кто успеет договориться с крупнейшими издателями и агрегаторами контента. Для бизнеса это важный сигнал: эпоха «бесплатных данных» подходит к концу. Создание и использование ИИ-моделей всё чаще будет требовать не только вычислительных мощностей, но и юридической чистоты. Рано или поздно это приведёт к появлению целых библиотек лицензионных текстов, доступ к которым будут продавать, как сейчас продают доступ к музыке или фотографиям. А значит, в бизнес-процессы придётся закладывать не только расходы на серверы и программистов, но и на права использования чужих текстов. Процесс с Microsoft может стать переломным. Он покажет, готовы ли суды в США пересматривать старые нормы ради новых технологий — или всё-таки встанут на сторону авторов. Для всех, кто работает с ИИ, это уже не вопрос теории. Это вопрос выживания и устойчивости моделей в реальных условиях рынка и регулирования.