Claude Opus 4.7: почему новая модель Anthropic стала лучшей для программистов

16 апреля 2026 года Anthropic выпустила Claude Opus 4.7 — модель, которая обошла GPT-5.4 и Gemini 3.1 Pro в кодинге, агентных задачах и работе с изображениями. Разбираем, что именно изменилось и почему разработчики массово переходят на Claude.

В мире больших языковых моделей каждый месяц кто-то объявляет о «прорыве». Но когда Anthropic 16 апреля 2026 года выпустила Claude Opus 4.7, реакция разработчиков оказалась необычной: вместо скептицизма — массовый переход. На CursorBench модель набрала 70% против 58% у предшественника Opus 4.6. На внутренних бенчмарках Devin, Replit, Warp и десятков других компаний — двузначный прирост в решении реальных задач. Что произошло?

Что такое Claude Opus 4.7 и чем отличается от предшественника

Claude Opus 4.7 — это последняя модель в линейке Opus от Anthropic, компании, основанной бывшими сотрудниками OpenAI. Она пришла на смену Opus 4.6 и позиционируется как прямой апгрейд: те же цены ($5 за миллион входных токенов, $25 за миллион выходных), тот же API-идентификатор, но принципиально другое качество работы.

Главные улучшения касаются трёх областей. Первая — кодинг и агентные задачи. На 93-задачном бенчмарке компании Windsurf модель показала +13% к разрешению задач по сравнению с Opus 4.6, включая четыре задачи, которые ни Opus 4.6, ни Sonnet 4.6 не могли решить вообще. Вторая — vision: модель принимает изображения до 2576 пикселей по длинной стороне (около 3.75 мегапикселей), что в три раза больше, чем у предыдущих моделей Claude. Третья — следование инструкциям: Opus 4.7 интерпретирует промпты буквально, а не «примерно».

Почему программисты переходят массово

Ключевое отличие Opus 4.7 от конкурентов — способность работать автономно на длинных задачах без деградации качества. CEO Devin Скотт Ву описал это так: «Opus 4.7 выводит долгосрочную автономию на новый уровень. Модель работает связно часами, продавливает сложные проблемы вместо того чтобы сдаваться, и открывает класс глубокой исследовательской работы, которую мы не могли надёжно запускать раньше».

Это не маркетинг — это реальная проблема, которую решили. Предыдущие модели (включая GPT-5.4) теряли контекст на длинных сессиях, зацикливались на ошибках или просто останавливались на полпути. Opus 4.7 доводит задачу до конца. На бенчмарке Rakuten-SWE-Bench модель решает в 3 раза больше продакшн-задач, чем Opus 4.6, с двузначным приростом в качестве кода и тестов.

Отдельно стоит отметить поведение модели при ошибках. Как отметила Сара Сакс из Notion: «+14% к Opus 4.6 при меньшем количестве токенов и в три раза меньше ошибок инструментов. Это первая модель, которая прошла наши тесты на неявные потребности, и она продолжает выполнение через сбои инструментов, которые раньше останавливали Opus».

Vision: зачем нейросети видеть в три раза больше пикселей

Увеличение разрешения с ~1 мегапикселя до 3.75 мегапикселей — это не просто цифра в спецификации. Это означает, что модель теперь может читать плотные скриншоты IDE, разбирать сложные диаграммы архитектуры, работать с мелким текстом на фотографиях документов. Для computer-use агентов это критично: XBOW (компания, занимающаяся автоматизированным пентестингом) сообщила о 98.5% на своём бенчмарке визуальной точности — против 54.5% у Opus 4.6.

На практике это значит, что Claude теперь может смотреть на ваш экран и понимать, что на нём происходит, с точностью, близкой к человеческой. Для разработчиков, использующих AI-агентов для программирования, это открывает новые сценарии: отладка по скриншоту, анализ UI без доступа к коду, работа с legacy-системами через визуальный интерфейс.

Новый уровень effort и что это значит для пользователей

Вместе с Opus 4.7 Anthropic ввела новый уровень усилий — xhigh (extra high), промежуточный между high и max. Это даёт разработчикам более тонкий контроль над балансом между глубиной рассуждений и скоростью ответа. В Claude Code уровень по умолчанию поднят до xhigh для всех планов.

Что это значит на практике? На уровне high модель отвечает быстро, но может пропустить нюансы. На max — думает долго и тратит много токенов. Xhigh — золотая середина для большинства задач программирования: модель достаточно глубоко анализирует проблему, но не уходит в бесконечные рассуждения.

Также появилась команда /ultrareview в Claude Code — выделенная сессия ревью, которая читает изменения и находит баги и проблемы дизайна, как внимательный код-ревьюер. Pro и Max пользователи получили три бесплатных ultrareview для тестирования.

Конкуренция: GPT-5.4, Gemini 3.1 Pro и Mythos Preview

Opus 4.7 напрямую конкурирует с GPT-5.4 от OpenAI и Gemini 3.1 Pro от Google. По бенчмаркам Anthropic, модель превосходит обоих в кодинге (SWE-bench Verified, Terminal-Bench 2.0), финансовом анализе и документном рассуждении. CodeRabbit отметил, что Opus 4.7 «немного быстрее GPT-5.4 xhigh» на их задачах код-ревью.

Но есть нюанс: у самой Anthropic есть более мощная модель — Claude Mythos Preview. Она показывает лучшие результаты по alignment и общим способностям, но её доступ ограничен из-за продвинутых кибер-возможностей. Anthropic экспериментирует с дифференциальным снижением опасных способностей и тестирует защитные механизмы сначала на менее мощных моделях. Opus 4.7 — первая такая модель с автоматическим обнаружением и блокировкой запросов, связанных с запрещёнными кибер-операциями.

Для легитимных специалистов по безопасности (пентестеры, red team) Anthropic запустила Cyber Verification Program — верифицированный доступ к полным возможностям модели.

Подводные камни при миграции

Переход с Opus 4.6 на 4.7 не безболезненный. Два момента, которые стоит учитывать. Первый: обновлённый токенизатор. Один и тот же текст может занимать на 1.0–1.35× больше токенов в зависимости от типа контента. Второй: модель больше «думает» на высоких уровнях effort, особенно в поздних ходах агентных сессий. Это улучшает надёжность, но увеличивает расход выходных токенов.

Ещё один неочевидный момент: промпты, написанные для старых моделей, могут давать неожиданные результаты. Где Opus 4.6 интерпретировал инструкции свободно или пропускал части, Opus 4.7 выполняет их буквально. Anthropic рекомендует перенастроить промпты при переходе.

Что это значит для рынка нейросетей в 2026 году

Выход Opus 4.7 подтверждает тренд: гонка моделей в 2026 году — это не гонка за размером или общими бенчмарками. Это гонка за надёжностью в реальных задачах. Кто может работать часами без деградации. Кто доводит задачу до конца. Кто не ломается при ошибке инструмента.

OpenAI ответила серией обновлений GPT-5 (5.1, 5.2, 5.4, 5.5), Google выпустила Gemini 3.1 Pro. Но пока именно Anthropic задаёт стандарт для разработчиков. Не потому что их модель «умнее» в абстрактном смысле — а потому что она надёжнее в конкретной работе.

Для обычных пользователей разница между моделями всё ещё незначительна. Но для тех, кто пишет код, строит агентов или автоматизирует бизнес-процессы — выбор модели в 2026 году стал таким же важным решением, как выбор языка программирования десять лет назад.