
Anthropic поліпшила платформу для управління штучними агентами. У системі Claude з’явились можливості «мрій», оцінки результативності та узгодження кількох ботів.
Dreaming дозволяє агентам вивчати попередні сеанси та ідентифікувати повторювані тенденції в роботі. Система розпізнає постійні помилки та успішні моделі — і на їх основі змінює алгоритми без втручання людини. Користувачі можуть встановити автоматичне оновлення пам’яті ШІ або затверджувати правки вручну.
Розробники також додали інструменти Outcomes і Webhooks. Відтепер автори програм можуть визначати вимоги до якості роботи агента. Спеціальний «оцінювач» контролює результат на відповідність правилам — незалежно від основного процесу виконання завдання. Якщо результат не відповідає стандарту, агент починає виправляти недоліки.
За інформацією Anthropic, Outcomes покращив продуктивність виконання складних завдань на 10%. Якість створення документів форматів .docx і .pptx зросла в середньому на 9%.
Третя зміна — координування багатьох агентів. «Провідний» ШІ може розподіляти підзавдання вузькопрофільним спеціалістам: один аналізує історію деплою коду, інший — логи збоїв, третій — запити служби підтримки. Усі вони працюють одночасно над загальним набором файлів.
Harvey і Netflix випробовують оновлення
Нові можливості вже використовують партнери компанії. Платформа Harvey використовує Dreaming для створення юридичних документів — швидкість виконання завдань збільшилася в шість разів. Команда Netflix застосувала мультиагентну систему для вивчення логів збірки програм.
Можливість Dreaming доступна в режимі попереднього перегляду за запитом. Outcomes і мультиагентна оркестрація перейшли на стадію публічного бета-тестування.
Нагадаємо, 4 травня співзасновник фірми Anthropic Джек Кларк передбачив появу «здатного до самонавчання ШІ» до 2028 року.
