
Компанія Anthropic презентувала Claude Opus 4.8 та представила функціонал динамічних робочих процесів для Claude Code.
Представляємо Claude Opus 4.8: він базується на Opus 4.7 з точнішими судженнями, більшою відвертістю щодо власного прогресу та здатністю діяти автономно триваліший час, ніж його попередники.
Доступний вже сьогодні за тією ж вартістю. pic.twitter.com/EufxL7T1kb
— Claude (@claudeai) May 28, 2026
Цей інструмент дозволяє ШІ самостійно генерувати оркестраційні скрипти, запускати десятки чи сотні паралельних субагентів і верифікувати отримані результати.
Рішення призначене для вирішення комплексних завдань у великих кодових базах: проведення аудитів безпеки, виявлення помилок, міграцію між фреймворками та мовами програмування, модернізацію проєктів.
Функціонал доступний у режимі попереднього тестування через інтерфейс командного рядка Claude Code, десктопну версію та плагін для VS Code, за допомогою API, а також на платформах Amazon Bedrock, Vertex AI і Microsoft Foundry.
Активувати режим можна прямою командою для створення робочого процесу або через ultracode. Він максимізує рівень обчислювальних ресурсів та дозволяє моделі самостійно визначати, коли слід застосувати багатоетапну схему.
В Anthropic попередили, що динамічні робочі процеси споживають значно більше токенів порівняно зі стандартною сесією Claude Code.
Модель декомпозує завдання на підзадачі, розподіляє їх між паралельно працюючими агентами, а потім інтегрує висновки після взаємної верифікації та спроб спростування знайдених рішень.
Як приклад, Anthropic продемонструвала перенесення Bun з мови програмування Zig на Rust. Розробник Джаред Самнер використав динамічні робочі процеси для генерації приблизно 750 000 рядків Rust-коду. Порт пройшов 99,8% актуальних тестів, а процес від першого коміту до злиття зайняв 11 днів. Проте, в Anthropic уточнили, що ця версія наразі не використовується у продакшені.
Показники нової моделі Opus 4.8:
- 69,2% у SWE-Bench Pro;
- 49,8% у Humanity’s Last Exam без інструментів та 57,9% з ними;
- 83,4% в OSWorld-Verified;
- 1890 балів у GDPval-AA;
- 53,9% у Finance Agent v2.
У Terminal-Bench 2.1 Opus 4.8 поступилася GPT-5.5 — 74,6% проти 78,2%.
В Anthropic заявили, що Opus 4.8 стала відчутно «чеснішою» при виконанні завдань з агентами: модель частіше вказує на невизначеність, рідше декларує непідтверджений прогрес та краще виявляє проблеми у власному коді перед передачею результату користувачеві.
Нагадаємо, у травні Anthropic опублікувала перший звіт про Project Glasswing — програму пошуку вразливостей за допомогою моделі Claude Mythos.
