Похоже, у нас новый чемпион по бессоннице — и ему даже не нужен эспрессо. Anthropic выкатили Claude Sonnet 4.5, и модель взяла дистанцию в 30 часов автономной работы, собрав чат-приложение в духе Slack или Teams и настрочив порядка 11 000 строк кода. Финишировала, как и положено чемпиону, — по готовности задачи, а не по будильнику.
Контраст особенно заметен на фоне майского Opus 4, который удерживал темп «всего» семь часов. По словам разработчиков, Sonnet 4.5 втрое лучше ориентируется в браузере и управляет компьютером, чем октябрьская технология Anthropic. В реальном мире это уже проверили: бета‑тестер Canva задействовал модель для сложных инженерных задач — от работы с кодовой базой до продуктовых фич.
Но главный поворот — не только в «мышечной массе» модели, а в экосистеме вокруг неё. Релиз пришёл в комплекте с виртуальными машинами, долговременной памятью, управлением контекстом и мультиагентной поддержкой. Проще говоря, разработчикам отдали те же строительные блоки, что крутят Claude Code: можно собирать собственных ИИ‑агентов, которые не просто пишут функции, а поднимают окружение, шарят задачи между напарниками‑агентами и держат длинные цепочки действий в голове.
Звучит как мечта менеджера продукта и ночной кошмар для таск‑трекера. При этом, разумеется, человеческий обзор кода и здравый смысл никуда не делись: автономия хороша там, где есть песочница (VM), отчётливые цели и чёткие рамки. Но сама планка сместилась. Если раньше «агентность» была экспериментом, то теперь это инструмент, который можно включать в пайплайн: от прототипа — к интеграции, от одноразового скрипта — к поддерживаемому сервису.
И да, марафоны — это про тактику. Sonnet 4.5 показывает, что длинная дистанция ИИ — это память, контекст и команда из нескольких агентов. Осталось добавить физкультуру для деплой‑ботов — и мир релизов станет чуточку выносливее.