Sakana AI створює “ультраглибоких” агентів: звіти на 100+ сторінок за 8 годин.

Sakana AI створює "ультраглибоких" агентів: звіти на 100+ сторінок за 8 годин. 2

Японський стартап Sakana AI, що спеціалізується на штучному інтелекті, офіційно представив свій перший комерційний продукт — Sakana Marlin.

Marlin позиціонується як «віртуальний директор зі стратегії» (Virtual CSO). Це автономний B2B-агент для досліджень, який навмисно відходить від миттєвої генерації тексту, притаманної сучасним чат-ботам, на користь глибокого аналізу та довгострокового прогнозування.

Що відрізняє Marlin від нинішньої екосистеми інструментів ШІ, так це його часовий масштаб. Замість того, щоб повертати відповідь за лічені секунди, він запускає безперервні, самостійні цикли аналізу тривалістю до восьми годин, щоб надати глибоко досліджені, добре процитовані звіти зі стратегії обсягом до 100 сторінок та презентаційні слайди для керівництва. Компанія опублікувала зразки звітів, згенерованих Marlin, на вебсайті продукту.

Платформа доступна негайно через вебсайт компанії з можливістю оплати за використання. Вона розроблена виключно для корпоративного сегменту, зокрема для великих компаній, фінансових установ та аналітичних центрів.

Диференціація на ринку

Звісно, OpenAI, Google та Perplexity вже представили власні автономні агенти для «глибоких досліджень», здатні створювати багатосторінкові звіти. Проте, вони доступні для споживачів через звичайні індивідуальні підписки на ШІ-сервіси. Sakana Marlin займає чітко відмінну нішу на корпоративному ринку, відокремлюючись насамперед завдяки часовим рамкам, масштабу виведення даних та виключно B2B-орієнтації.

Найбільш разюча відмінність полягає у часовому масштабі автономності агента. Такі інструменти, як ChatGPT Deep Research від OpenAI, Gemini Deep Research Agent від Google та «Deep Research in Computer» від Perplexity, оптимізовані для швидкості в рамках діалогового робочого процесу.

Незалежно від того, чи використовують вони паралелізований «Search as Code» від Perplexity, чи коригування траєкторії в реальному часі від OpenAI, ці інструменти зазвичай завершують свої багатоетапні дослідницькі завдання від 3 до 30 хвилин, надаючи ретельно процитовані резюме обсягом від 5 до 10 сторінок або, за потреби, довші результати.

Sakana Marlin, натомість, не призначений для миттєвого чату. Він виконує безперервні, самостійні цикли аналізу тривалістю до восьми годин. Якщо OpenAI та Perplexity виступають як цифрові помічники, що готують швидкий брифінг перед зустріччю, то Marlin створений для заміни багатотижневих, вичерпних завдань, які зазвичай делегуються команді директора зі стратегії.

Робочі процеси та результати також підкреслюють різні філософії дизайну. Gemini Deep Research від Google отримав схвалення за функцію «спільне планування», яка представляє список для користувача для редагування перед виконанням пошуку. Marlin відтворює це за допомогою короткого початкового діалогу для уточнення обсягу дослідження, але значно розширює кінцевий результат.

Тоді як конкуренти зазвичай видають один документ (наприклад, PDF або Google Doc), Marlin автоматично генерує до 100 сторінок глибоких стратегічних опцій, доповнених додатками, посиланнями та окремим пакетом презентаційних слайдів для керівництва. Marlin призначений не лише для пошуку фактів, а й для відображення причинно-наслідкових зв’язків у складному бізнес-середовищі та їх структурування для перегляду керівництвом.

Нарешті, Sakana AI чітко визначила свою цільову аудиторію та політику щодо даних. OpenAI, Google та Perplexity активно працюють як на споживчому, так і на корпоративному ринках, пропонуючи свої можливості глибоких досліджень абонентам Pro-рівня та звичайним потужним користувачам.

Sakana Marlin явно виключає споживчий ринок; це виключно B2B-сервіс, створений для корпорацій, фінансових установ та аналітичних центрів. Це дозволяє Sakana впроваджувати політику корпоративних даних без компромісів. На відміну від споживчих моделей, які часто розмивають межі використання даних, Marlin гарантує, що введені користувачем дані та пропрієтарна інформація ніколи не будуть використані для навчання або доналаштування моделей без явного дозволу.

Для підприємств, що проводять чутливу перевірку M&A або аналіз конкурентів перед випуском продукту, така замкнена система безпеки є обов’язковою вимогою, яку загальні споживчі інструменти насилу можуть гарантувати.

З Marlin великі бізнеси більше не запитують, наскільки швидко ШІ може відповісти, а наскільки глибоко він може мислити.

Продукт: Віртуальний Директор зі Стратегії

Що саме отримує бізнес, використовуючи Sakana Marlin? Робочий процес принципово відрізняється від типових взаємодій з великими мовними моделями (LLM). Замість того, щоб брати участь у виснажливій сесії інженерії запитів, користувач просто надає основну тему дослідження. Після короткого початкового обміну для уточнення обсягу та напрямку розслідування, людина повністю відходить від процесу.

Протягом наступних кількох годин Marlin працює як самостійна команда стратегічного розвитку. Він формулює власні початкові гіпотези, здійснює пошук в Інтернеті для збору даних, перехресно перевіряє джерела для підтвердження результатів та моделює причинно-наслідкові зв’язки в складних бізнес-середовищах. По суті, він шукає «формулу успіху» в морі інформації.

Розглядайте це менше як пошукову систему, а більше як молодшого консультанта зі стратегії, замкненого в кімнаті з дошкою та доступом до Інтернету. Ви надаєте стратегічний запит вранці, а до кінця робочого дня система надає повний, професійний портфель рішень.

У випадку Marlin, кінцевий результат — це не загальний текстовий блок; це структурований набір стратегічних варіантів, доповнений короткими резюме для керівництва, додатками, списками літератури та глибоко проаналізованим звітом.

Компанія навела кілька прикладів реальних сценаріїв використання, щоб продемонструвати здатність Marlin до складного синтезу, зокрема: розробка детальних сценаріїв врегулювання теоретичної блокади Ормузької протоки, аналіз фрагментованого глобального регуляторного поля ШІ та дослідження макроекономічних тенденцій, таких як повернення «облігаційних кредиторів».

Sakana стверджує, що Marlin покладається на кілька моделей ШІ, але не надала конкретних назв моделей чи постачальників. Я звернувся до X, щоб дізнатися більше, і оновлю інформацію після отримання відповіді.

VB Transform · 14–15 липня · Менло-Парк · LLMs, ops & evals

Стандартні бенчмарки зазнають невдачі. Amazon і Waymo пояснюють, що вони тестують натомість.

Відстеження оцінок глибоко занурюється в чотири виміри надійності — узгодженість, стійкість, передбачуваність, безпека — і те, як команди в Amazon та Waymo впроваджують їх на практиці.

Дивіться повний порядок денний →

Рушійна сила довгострокового аналізу

Під капотом Marlin — комерційна реалізація численних лабораторних досягнень Sakana AI за останні два роки.

Продукт працює на основі рушійного механізму дослідження, що спирається на попереднє дослідницьке досягнення Sakana — метод адаптивного розгалуженого пошуку по дереву Монте-Карло (Adaptive Branching Monte Carlo Tree Search — AB-MCTS). Він використовує фреймворки, розроблені на основі «AI Scientist» — попереднього дослідницького проєкту Sakana AI, опублікованого в журналі Nature, який успішно автоматизував процес наукового відкриття від ідеї до рецензування.

Щоб зрозуміти, як це працює на практиці, розглянемо аналогію з реального життя: сучасні шахові рушії. Коли комп’ютер грає в шахи, він не просто дивиться на дошку і вгадує; він програє тисячі потенційних майбутніх ходів, оцінюючи силу кожної результативної позиції, перш ніж зробити хід.

Рушій AB-MCTS від Marlin робить щось подібне для досліджень.

Всередині рушія: Механіка AB-MCTS

Хронологія цієї технології бере початок у червні 2025 року, коли Sakana AI вперше представила фреймворк громадськості разом із дослідницькою статтею «Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search».

Тоді, щоб заохотити розробників до експериментів із колективним інтелектом ШІ, компанія випустила базовий алгоритм як бібліотеку програмного забезпечення з відкритим кодом під назвою TreeQuest, розповсюджувану під ліберальною ліцензією Apache 2.0. Ця віха відкритого коду заклала технічну основу для того, що згодом, через рік, перетворилося на пропрієтарний продукт корпоративного рівня Marlin.

Традиційно, коли розробники намагаються отримати вищу якість аналізу від великих мовних моделей, вони вдаються до методу грубої сили, який називається «повторна вибірка» — по суті, запуск моделі десятки разів паралельно і сподівання, що одна з відповідей буде правильною. Однак повторна вибірка працює наосліп; вона не може оцінювати власні проміжні кроки або змінювати напрямок на основі зовнішнього зворотного зв’язку.

AB-MCTS замінює цю парадигму принциповим, багатооборотним підходом, керованим байєсівським фреймворком прийняття рішень. Під час створення звіту зі стратегії система розглядає процес дослідження як розгалужене дерево можливостей. На кожному вузлі дерева алгоритм динамічно балансує дві різні поведінки на основі зовнішніх сигналів зворотного зв’язку:

  • Розширення (Exploration): Запуск абсолютно нових, альтернативних гіпотез або кандидатських відповідей, коли поточний шлях дає спадаючу віддачу або невирішені протиріччя.

  • Поглиблення (Exploitation): Методичне вдосконалення, аудит та розвиток існуючого кандидатського рішення, яке демонструє високий стратегічний потенціал.

Що перетворює це з лабораторного експерименту на комерційний рушій, так це його розширення до **Multi-LLM AB-MCTS**.

Архітектура Sakana AI вводить критичний третій вимір у дерево пошуку: здатність динамічно вибирати, *яку* модель викликати для конкретного підзавдання, розглядаючи провідні моделі галузі як мережу колективного інтелекту, яку можна підключати та використовувати.

Згідно з технічною документацією, опублікованою компанією, рушій може координувати високогетерогенні моделі — дозволяючи моделі оркестрації делегувати початкову ідею одній LLM, одночасно використовуючи модель з потужними аналітичними можливостями для аудиту, перевірки та виправлення проміжних помилок, згенерованих раніше в дереві пошуку.

Масштабуючи обчислення під час виведення даних — використовуючи відмінні «особистості» та сильні сторони кількох базових моделей протягом тисяч автоматизованих циклів — AB-MCTS забезпечує математичні гарантії, необхідні Marlin. Це гарантує, що результуючі 100-сторінкові звіти зі стратегії є не просто багатослівними генераціями ШІ, а високоперевіреним продуктом систематичного, автоматизованого методу спроб і помилок.

Ліцензування, дані та наслідки для підприємств

Важливо зазначити, що Sakana Marlin — це виключно не загальний споживчий інструмент; це комерційна пропозиція програмного забезпечення як послуги (SaaS), яка обмежена корпоративними суб’єктами, організаціями та індивідуальними підприємцями.

Для підприємств умови ліцензування та обробки даних часто є вирішальними факторами для впровадження програмного забезпечення. На відміну від багатьох споживчих інструментів ШІ, які мовчки збирають дані користувачів та пропрієтарну інформацію для навчання майбутніх базових моделей, Sakana Marlin працює відповідно до суворої політики щодо даних корпоративного рівня.

Ні Sakana AI, ні її зовнішні постачальники послуг ШІ не використовуватимуть дані клієнтів або введені дані для навчання чи доналаштування моделей, якщо клієнт не надасть явного дозволу на участь.

Навіть за наявності згоди, дані проходять ретельну обробку для видалення інформації, що дозволяє ідентифікувати особу. Така замкнена безпека є абсолютно життєво важливою для компаній, які займаються чутливими дослідженнями M&A, розробкою непублічних стратегій продуктів або пропрієтарним аналізом ринку.

Комерційне ліцензування структуроване за багаторівневими моделями ціноутворення, які відображають його корпоративний характер:

  • Оплата за використання: Користувачі можуть придбати кредити за запитом, при цьому один запуск коштує 100 кредитів, а додаткові кредити — по 98 японських єн (приблизно $0.61 USD) за кожен.

  • План Pro: За 150 000 японських єн (приблизно $935.68 USD) на місяць бізнеси отримують 2000 кредитів, що знижує вартість додаткових кредитів до 90 японських єн (приблизно $0.56 USD).

  • План Team: Призначений для великих відділів, цей план вартістю 400 000 японських єн (приблизно $2495.14 USD) на місяць включає 6000 кредитів, знижуючи вартість додаткових кредитів до 85 японських єн (приблизно $0.53 USD) за кредит.

  • Enterprise: Повністю індивідуальні пропозиції з виділеною підтримкою та кастомізованим розподілом кредитів.

Чому Sakana Варта Уваги

Перехід Sakana AI до потужного комерційного корпоративного гравця ґрунтується на заслугах її засновників, які, як відомо, допомогли розпалити поточний бум генеративного ШІ.

Заснований у Токіо у 2023 році, стартап був співзаснований Лліоном Джонсом — співавтором основоположної статті Google 2017 року «Attention Is All You Need», який ввів термін «трансформер», — і Девідом Ха, колишнім дослідником Google Brain та керівником досліджень у Stability AI.

Рішення створити нову лабораторію поза бульбашкою Кремнієвої долини було свідомою відмовою від нинішньої екосистеми ШІ. На конференції TED AI наприкінці 2025 року Джонс відкрито заявив, що він «абсолютно втомився» від трансформерів, попереджаючи, що шалений тиск з боку інвесторів та гіперфокус на масштабуванні однієї монолітної моделі окостеніли креативність індустрії та засліпили дослідників від наступного великого прориву.

Щоб вирватися з цієї «хвороби великих компаній», Джонс і Ха структурували Sakana AI на принципах біомімікрії та еволюційних обчислень.

Назва компанії, що походить від японського слова «риба», відображає її основну технічну філософію: використання колективного інтелекту, подібного до косяків риб, мурашників або роїв комах. Замість того, щоб намагатися створити одну величезну універсальну базову модель, дослідження Sakana послідовно зосереджувалися на розгортанні мереж менших, спеціалізованих моделей, які динамічно співпрацюють для адаптації до складних середовищ.

Ця філософія передбачає, що розглядаючи окремі моделі ШІ як членів «команди мрії» з взаємодоповнюючими сильними сторонами, системи можуть досягти більш надійного та економічно ефективного аналізу, ніж просто спираючись на масштаб.

Цей підхід, натхненний природою, швидко приніс дивіденди в суворих, конкурентних тестах. Sakana AI досягла значних успіхів у «масштабуванні під час виведення» — розподілі обчислювальних ресурсів на етапі вирішення проблеми, щоб дозволити моделям мислити, ітерувати та вдосконалювати власні відповіді протягом тривалих періодів.

На початку 2026 року ALE-Agent компанії посів перше місце у надзвичайно складному конкурсі евристик AtCoder (AHC058), змаганні з комбінаторної оптимізації, перевершивши понад 800 провідних програмістів, самостійно переробляючи та тестуючи сотні рішень протягом чотиригодинного вікна.

Аналогічно, Sakana представила «RL Conductor», невелику модель з 7 мільярдами параметрів, навчену за допомогою навчання з підкріпленням спеціально для оркестрації та делегування завдань різноманітному пулу робочих моделей — від GPT-5 до Claude Sonnet 4 — досягаючи найсучасніших результатів на бенчмарках аналізу за частку традиційних обчислювальних витрат.

Швидка еволюція Sakana від інноваційної дослідницької лабораторії до комерційного постачальника програмного забезпечення привернула значну увагу з боку світових фінансових гігантів.

До кінця 2025 року стартап з Токіо залучив величезний раунд фінансування серії B, який перевищив його оцінку після залучення інвестицій до 2,6 мільярда доларів, закріпивши його статус однієї з найдорожчих приватних технологічних компаній Японії. Фірма може похвалитися широким списком стратегічних інвесторів, включаючи ранніх венчурних бейкерів Khosla Ventures, Lux Capital та New Enterprise Associates (NEA), а також галузевих титанів, таких як Nvidia та Google.

Оскільки Sakana розширює свою діяльність на критично важливі сектори, такі як оборона та фінанси, вона також залучила інвестиції від великих глобальних банківських установ, таких як Mitsubishi UFJ Financial Group (MUFG) та Citi, а також від корпоративного технологічного гіганта Salesforce, що позиціонує стартап для активного формування корпоративної ШІ-інфраструктури з нуля.

Реакція спільноти та польові випробування

Перехід Sakana AI до комерційних агентів довгострокового аналізу відбувся не у вакуумі. Компанія провела ретельне закрите бета-тестування, розпочавши його у квітні 2026 року, надавши інструмент приблизно 300 професіоналам з фінансових установ, консалтингових фірм та аналітичних центрів. Відгуки підкреслюють чітку якісну відмінність між стандартними генеративними чат-ботами та автономним, фактологічним підходом Marlin.

Старший консультант великої токійської консалтингової фірми зазначив, що інструмент «перевершив очікування, виявивши ракурси, які ми навіть не уявляли», відзначивши його здатність забезпечувати людську всеосяжність, усуваючи при цьому людську упередженість. Тим часом, відділ кібербезпеки великого японського інтегратора ІТ-систем високо оцінив систему за надання «дуже переконливого звіту, заснованого на високоякісних первинних дослідженнях», а не на перероблених вторинних джерелах.

У соціальних мережах оголошення компанії знайшло відгук у зростаючому апетиті ширшої технологічної спільноти до автономних агентів.

З дозріванням галузі ШІ, цінність пропозиції чітко зміщується. Інструменти, що діють як швидкі, розмовні енциклопедії, стають стандартизованими. З Sakana Marlin фокус повністю зміщується на відокремлення важкої роботи мислення від фінального акту прийняття рішення. Делегуючи вичерпне моделювання причинно-наслідкових зв’язків агенту, здатному до тривалого аналізу, керівники звільняються для виконання того, що у них виходить найкраще: діяти.


Порада від INFBusiness:

Sakana Marlin — це новаторський інструмент для корпоративного сегменту, який обіцяє трансформувати стратегічне планування та дослідження. Якщо ваша компанія потребує глибокого, багатогранного аналізу, який виходить за рамки можливостей традиційних чат-ботів, цей продукт може стати цінним активом для отримання конкурентних переваг та прийняття обґрунтованих рішень.

За даними порталу: venturebeat.com

Поділитися новиною:TelegramViberFacebook
No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *