Иногда юридические баталии напоминают детектив: подозрения — есть, улик — мало, а все в зале суде переглядываются с видом «а может, это просто ошибка автозаполнения». С юмором говоря: если бы суд принимал эмоции, дела бы шли быстрее. Nvidia в своём ходатайстве просит суд отклонить иск авторов по делу Nazemian v. Nvidia, утверждая, что контакт с т.н. «Anna’s Archive» сам по себе не равен факту копирования их книг.
Компания называет ключевые пробелы в жалобе: авторы не указали, какие именно произведения были скачаны, когда произошло их использование и в каких моделях они якобы присутствуют. По мнению Nvidia, обсуждения потенциальных источников данных не доказывают, что данные были действительно получены или использованы — а именно воспроизведение защищённых текстов и нужно доказать в иске о нарушении авторских прав. Ходатайство от 29 января можно посмотреть здесь (PDF) — https://storage.courtlistener.com/recap/gov.uscourts.cand.426191/gov.uscourts.cand.426191.240.0.pdf.
Авторы расширили жалобу, добавив ссылки на наборы вроде Books3 и инструменты вроде NeMo Megatron, а Nvidia возражает, что объединение множества моделей и датасетов в одну массу без конкретики — это смесь предположений и домыслов. Компания также указывает на публичную документацию, которая, по её словам, опровергает некоторые предположения истцов.
Этот спор — не только про одну корпорацию и одну библиотеку-призрак. Это зеркало более широкой проблемы: как доказать происхождение миллионов строк текста, на которых учатся современные модели, и где пролегает граница между исследованием, инструментарием и прямым нарушением прав. Суд в Северном округе Калифорнии назначил слушание на 2 апреля 2026 года — и, как и полагается хорошему детективу, все ждут не столько громких заявлений, сколько фактов и документов.
