Claude Code тепер підтримує динамічні робочі процеси

Компанія Anthropic презентувала Claude Opus 4.8 та представила функціонал динамічних робочих процесів для Claude Code.

Цей інструмент дозволяє ШІ самостійно генерувати оркестраційні скрипти, запускати десятки чи сотні паралельних субагентів і верифікувати отримані результати.

Рішення призначене для вирішення комплексних завдань у великих кодових базах: проведення аудитів безпеки, виявлення помилок, міграцію між фреймворками та мовами програмування, модернізацію проєктів.

Функціонал доступний у режимі попереднього тестування через інтерфейс командного рядка Claude Code, десктопну версію та плагін для VS Code, за допомогою API, а також на платформах Amazon Bedrock, Vertex AI і Microsoft Foundry.

Активувати режим можна прямою командою для створення робочого процесу або через ultracode. Він максимізує рівень обчислювальних ресурсів та дозволяє моделі самостійно визначати, коли слід застосувати багатоетапну схему.

В Anthropic попередили, що динамічні робочі процеси споживають значно більше токенів порівняно зі стандартною сесією Claude Code.

Модель декомпозує завдання на підзадачі, розподіляє їх між паралельно працюючими агентами, а потім інтегрує висновки після взаємної верифікації та спроб спростування знайдених рішень.

Як приклад, Anthropic продемонструвала перенесення Bun з мови програмування Zig на Rust. Розробник Джаред Самнер використав динамічні робочі процеси для генерації приблизно 750 000 рядків Rust-коду. Порт пройшов 99,8% актуальних тестів, а процес від першого коміту до злиття зайняв 11 днів. Проте, в Anthropic уточнили, що ця версія наразі не використовується у продакшені.

Показники нової моделі Opus 4.8:

  • 69,2% у SWE-Bench Pro;
  • 49,8% у Humanity’s Last Exam без інструментів та 57,9% з ними;
  • 83,4% в OSWorld-Verified;
  • 1890 балів у GDPval-AA;
  • 53,9% у Finance Agent v2.

У Terminal-Bench 2.1 Opus 4.8 поступилася GPT-5.5 — 74,6% проти 78,2%.

В Anthropic заявили, що Opus 4.8 стала відчутно «чеснішою» при виконанні завдань з агентами: модель частіше вказує на невизначеність, рідше декларує непідтверджений прогрес та краще виявляє проблеми у власному коді перед передачею результату користувачеві.

Нагадаємо, у травні Anthropic опублікувала перший звіт про Project Glasswing — програму пошуку вразливостей за допомогою моделі Claude Mythos.

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *