Иногда кажется, что ИИ учится быстрее всех — пока не приходит бухгалтер и не объясняет, что домашка с «Либгеном» стоит полтора миллиарда. Да, Anthropic, создатель Claude, согласилась выплатить как минимум $1,5 млрд по коллективному иску авторов за использование пиратских книг в тренировочном датасете. Цена ошибки — примерно $3 000 за каждое произведение, и это только старт: список названий ещё пополняется.
Иск возглавили Андреа Барта, Чарльз Грейбер и Кёрк Уоллес Джонсон. По их версии, компания черпала материалы из торрентов и зеркал вроде Library Genesis, Pirate Mirror и Books3 — чтобы насытить модель «читанкой» без кассы. В июне федеральный судья сузил конфликт до ключевого вопроса: несанкционированное цифровое копирование. Суд к декабрю готовился к процессу, но стороны ушли на мировую.
Условие громкое: создаётся невозвратный компенсационный фонд от $1,5 млрд, спорные данные обязаны удалить. При этом суд не требует «разучить» модель — то есть принудительной очистки весов и перетренировки (то самое модельное disgorgement) в соглашении не видно. Формально Anthropic ничем себя не оговаривает, но масштаб выплат задаёт новый ценник на риск данных в генеративном ИИ.
Важно: дело не оспаривает саму идею обучения на публичном или легально полученном контенте. Речь именно о пиратских копиях. Судья уже дал понять: купил потом — молодец, но это не стирает факт ранее допущенного копирования; влияет лишь на размер возможных выплат. Параллельно другие игроки, включая OpenAI, тоже заключают соглашения с правообладателями — детали там куда туманнее.
Что дальше? Если суды начнут массово требовать «чистые» датасеты и принудительные перезапуски, индустрии предстоят повторные тренировки на лицензированном сырье. Это миллионы GPU-часов и внезапный праздник для поставщиков вычислений: от Nvidia с H100 и грядущим Blackwell до AMD с MI300X и всей экосистемы HBM3e. Пока это сценарий «а что если», но юристы уже подливают топлива в дата-центры.
Вывод простой и некрасивый: дешевле сразу платить за книги, чем потом платить за всё.