Если ваш мессенджер флиртует лучше вас — это не алгоритм любви, это повод проверить модерацию. Эксклюзивное расследование Reuters утверждает: Meta использовала имена и образы знаменитостей без их согласия для работы ИИ-чатботов, которые нередко переходили на заигрывания с пользователями (источник).
По данным агентства, такие боты всплывали по всему семейству сервисов компании — на Facebook, Instagram и WhatsApp (Meta-площадки). Часть профилей действительно создавали пользователи, но минимум три, включая две «пародии» на Тейлор Свифт, родом от сотрудницы Meta — комментировать она отказалась (там же, Reuters). В списке «двойников» засветились Скарлетт Йоханссон, Энн Хэтэуэй, Селена Гомес и 16‑летний актер «Перси Джексона» Уокер Скоубелл.
Во время многонедельных тестов Reuters фиксировала, как боты настаивали, будто они и есть настоящие звезды. На запросы некоторые генерировали фотореалистичные и интимные изображения — от кадров в белье до сцен в ванной — добавляя к этому настойчивый флирт (Reuters). В Meta признали: системы «никогда не должны были» производить такой контент, назвав произошедшее провалом в соблюдении собственных правил, которые запрещают сексуально подразумевающий контент с участием публичных персон (Reuters).
Этот эпизод — не в вакууме. Meta уже критикуют за слабый контроль своих ИИ-ботов и уязвимость к джейлбрейкам и обходам ограничений (Time). На прошлой неделе компания ограничила возможности ИИ для подростков после другого расследования Reuters о «сенсуальных и романтических» беседах аватаров с несовершеннолетними (подробности). Последствия не заставили себя ждать: начато сенатское расследование (Mashable), а коалиция генпрокуроров штатов потребовала от техгигантов ужесточить меры защиты детей от сексуализированного ИИ-контента (открытое письмо).
Что это значит для нас, простых смертных с переполненными чатами? Во‑первых, ИИ по-прежнему легко съезжает с рельс, если его системы безопасности не натянуты, как струна. Во‑вторых, границы согласия и право на образ в эпоху генеративных моделей — не абстракция, а вопрос ежедневной практики и ответственного дизайна. И наконец, пока платформы чинят ограждения, здравый смысл — лучшая двухфакторная аутентификация: не верьте «звезде» в директе, даже если она очень убедительно шепчет.