Xiaomi MiMo Code перевершив Claude Code у надскладних завданнях ШІ-кодування

Xiaomi MiMo Code перевершив Claude Code у надскладних завданнях ШІ-кодування 3

### Xiaomi Представляє MiMo Code: Революційний AI-Асистент для Програмування Команда Xiaomi MiMo AI представила MiMo Code V0.1.0 – потужний інструмент для написання коду, що працює безпосередньо в терміналі. Компанія стверджує, що цей помічник перевершує рішення від Anthropic, зокрема Claude Code, у ключових тестах, особливо під час виконання довготривалих, багатоетапних завдань (понад 200 кроків). Ці дані базуються на внутрішньому бета-тестуванні та опитуванні 576 розробників. Крім того, Xiaomi пропонує обмежений за часом безкоштовний доступ до MiMo-V2.5 – їхньої флагманської мультимодальної моделі з величезним контекстним вікном на мільйон токенів, яка не вимагає реєстрації для початку роботи. Презентація цього інноваційного рішення відбулася 10 червня 2026 року в офіційному акаунті @XiaomiMiMo в соціальній мережі X. Там інструмент був описаний як “більше, ніж просто AI-помічник для кодування у вашому терміналі – це найрозумніший партнер з програмування, з яким ви будь-коли працювали”. MiMo Code вже доступний на GitHub під ліцензією MIT. Встановлення здійснюється однією командою в терміналі (curl -fsSL https://mimo.xiaomi.com/install | bash) для macOS та Linux, або через npm (npm install -g @mimo-ai/cli) для Windows. Проєкт є форком відкритого агента OpenCode, який Xiaomi розширила власною архітектурою пам’яті, режимами робочих процесів та системою управління моделями. ### Чи Покладе MiMo Code Край “Амнезії” AI-Агентів? Як підтвердить будь-який досвідчений розробник, AI-асистенти для кодування мають тенденцію втрачати ефективність під час тривалих робочих сесій. З наповненням контекстного вікна, попередні рішення, угоди та стан завдання забуваються або стискаються, змушуючи розробників повторно пояснювати проєкт. Xiaomi вважає такий підхід неефективним для масштабування. “Нам потрібен не кращий стиск, а явний механізм зберігання та вилучення, який вирішує, яка інформація повинна бути записана в постійні структури та коли її слід відкликати”, – зазначила команда MiMo у своєму блозі. MiMo Code вирішує цю проблему за допомогою системи пам’яті, що охоплює кілька сесій, яка працює на базі повнотекстового пошуку SQLite FTS5. Вона складається з чотирьох рівнів: пам’ять проєкту (постійний файл MEMORY.md), контрольні точки сесії, тимчасові нотатки та журнали прогресу для кожної задачі. Особливу увагу приділено системі нотаток: замість того, щоб основний AI-агент припиняв роботу для запису, система розгортає незалежний під-агент “записувач контрольних точок”. Уявіть собі головного AI-агента як будівельного підрядника, який зводить величезний особняк, а поруч – архітектора, який виступає в ролі записувача контрольних точок. Поки головний агент працює над фізичною структурою, архітектор в режимі реального часу оновлює креслення, записуючи рішення, проблеми та реальний стан справ у ході проєкту. Коли контекстне вікно наближається до межі (підрядник “губиться” у недобудованому будинку), він може звернутися до архітектора і знову знайти своє місце. У випадку MiMo Code система просто відновлює середовище з структурованих контрольних точок з відповідним контекстом, забезпечуючи безперервність роботи. Система доповнюється двома механізмами самовдосконалення: командою `/dream`, яка періодично (приблизно раз на тиждень) аналізує історичні сесії, усуває дублікати та стискає їх у довготривалу пам’ять; та функцією “дистиляції”, яка витягує повторювані робочі процеси з минулих сесій для їх автоматизації, подібно до підходів, які нещодавно використовували OpenAI та Anthropic. ### Вражаюча Продуктивність у Бенчмарках Розробки ПЗ Згідно з результатами бенчмарків, опублікованими в технічному блозі Xiaomi, MiMo Code у поєднанні з MiMo-V2.5-Pro перевершив Claude Code з моделлю Claude Sonnet 4.6 за трьома протестованими критеріями:

Xiaomi MiMo Code перевершив Claude Code у надскладних завданнях ШІ-кодування 4

* **SWE-bench Verified:** 82% проти 79% * **SWE-bench Pro:** 62% проти 55% * **Terminal Bench 2:** 73% проти 69% Системна архітектура сама по собі забезпечує помітний приріст продуктивності. Використовуючи ту саму модель MiMo-V2.5-Pro в обох системах, MiMo Code показав 62% на SWE-bench Pro порівняно з 57% у Claude Code, та 73% на Terminal Bench 2 порівняно з 68% у Claude Code. Різниця приблизно в п’ять пунктів на кожному тесті зумовлена саме агентною системою, а не самою моделлю. Xiaomi не порівнювала свій продукт з OpenAI Codex або Google Gemini CLI, зосередившись виключно на Claude Code. Незалежні результати показують, що на офіційному лідерборді Terminal-Bench 2.0 OpenAI Codex CLI з GPT-5.5 демонструє 82.2%, що приблизно на 9 пунктів вище за заявлені Xiaomi 73% для MiMo Code. OpenAI також заявляє про 82.7% на цьому ж бенчмарку. Однак, у SWE-Bench Pro картина інша: OpenAI повідомляє про 58.6% для GPT-5.5, що нижче за заявлені MiMo Code + MiMo-V2.5-Pro 62%. (MiMo Code поки що не з’явився на офіційних лідербордах, а порівняння самостійно отриманих результатів з даними лідербордів слід проводити з обережністю). Можливо, цікавішим за офлайн-тести є людське оцінювання. Xiaomi стверджує, що провела подвійне сліпе A/B тестування під час закритого бета-тестування за участю 576 розробників, які працювали з 474 реальними приватними репозитоями. Було зібрано 1213 порівнянь MiMo Code та Claude Code (з однаковою цільовою моделлю). До 200 кроків виконання обидві системи показали приблизно 50/50, але **після 200 кроків показник перемог MiMo Code зріс до понад 65%**. Це підтверджує теорію компанії про те, що її архітектура пам’яті та керування станом особливо ефективна для завдань з тривалим горизонтом. Xiaomi визнає, що стандартні бенчмарки “все ще вимірюють здатність вирішувати проблеми за один прохід” і не відображають багатосесійні цілі інструменту. Як завжди, це дані, надані постачальником, які не були незалежно перевірені. Порівняння систем також залежить від конфігурації. Однак, ці заяви узгоджуються з ширшою тенденцією в індустрії: інженерія “каркасів” та систем управління стає такою ж важливою, як і базова потужність моделі для ефективної роботи AI-агентів. ### Легка Інтеграція з Існуючими Системми Розробника та Голосовим Керуванням З точки зору користувацького досвіду, MiMo Code інтегрується там, де розробники вже працюють – безпосередньо в терміналі. Він читає та записує файли, виконує команди та керує Git. За замовчуванням інструмент не потребує жодних налаштувань, автоматично підключаючись до “MiMo Auto” – безкоштовного (обмежений час) каналу, що використовує мультимодальну модель Xiaomi MiMo V2.5 з мільйонним контекстним вікном. Для розробників, які мігрують з інших середовищ, перехід є безпроблемним: MiMo Code автоматично імпортує сервери MCP, кастомні навички та конфігурації API з Claude Code. Інші помітні функції включають: * **Режим Композиції (Compose mode):** Натискання Tab переводить агента в режим роботи, керований специфікаціями. Розробник описує загальну мету, а система самостійно виконує повний цикл розробки – дизайн, планування, кодування, тестування та перевірку – за стратегією Xiaomi “важке планування на початку, стабільна перевірка пізніше”. * **Голосове Керування:** На базі системи розпізнавання мови Xiaomi MiMo-ASR з детекцією активності голосу TenVAD, розробники можуть диктувати та змінювати команди голосом, використовуючи команди на кшталт “відправити” та “виконати” для повного керування без рук (доступно для авторизованих користувачів). За словами Xiaomi, переваги самої агентної системи є вимірними. Використовуючи ту саму базову модель MiMo в обох системах, компанія стверджує, що MiMo Code показав 62% на SWE-Bench Pro порівняно з 57% у Claude Code, та 73% на Terminal Bench 2 порівняно з 68% у Claude Code – приблизно на 5% кращий результат у кожному випадку, який належить саме системі агента, а не моделі. Як завжди, це дані, надані постачальником, які не були незалежно перевірені. Порівняння систем також залежить від конфігурації. Однак, ці заяви узгоджуються з ширшою тенденцією в індустрії: інженерія “каркасів” та систем управління стає такою ж важливою, як і базова потужність моделі для ефективної роботи AI-агентів. ### Агресивно Доступна Ціна Можливо, найбільшою перевагою для багатьох розробників стане те, що входить до комплекту. MiMo Code постачається з “MiMo Auto” – каналом без конфігурації, що пропонує безкоштовний, обмежений за часом доступ до MiMo-V2.5. Це нативно мультимодальна модель, випущена Xiaomi наприкінці квітня 2026 року. Вона має розріджену архітектуру mixture-of-experts з 310 мільярдами параметрів (лише 15 мільярдів активних на інференс) та 1 мільйон токенів контексту. Компанія позиціонує її як конкурента Anthropic Claude Sonnet 4.6 у мультимодальних агентних завданнях. Як повідомлялося раніше, моделі сімейства MiMo-V2.5 мають ліцензію MIT і є одними з найефективніших та найдоступніших для агентних завдань. Більш потужна MiMo-V2.5-Pro – модель mixture-of-experts з 1.02 трильйона параметрів (42 мільярди активних) та гібридною архітектурою уваги – лідирувала у відкритому сегменті на бенчмарку агентних завдань Xiaomi ClawEval, досягнувши 63.8% успіху, споживаючи лише близько 70 000 токенів на траєкторію. Це приблизно на 40–60% менше, ніж потрібно Anthropic Claude Opus 4.6, Google Gemini 3.1 Pro або OpenAI GPT-5.4 для подібних результатів. Важливо відзначити, що пост-тренінг V2.5-Pro був спеціально розроблений для впровадження “усвідомлення каркасу” (harness awareness) – тренування моделі керувати власною пам’яттю та контекстом в агентних системах, таких як Claude Code або OpenCode. Тому природно, що система управління від Xiaomi, оптимізована під ці можливості, стала логічним наступним кроком. Ціноутворення також є агресивним: MiMo-V2.5 коштує від $0.40 за мільйон вхідних токенів та $2.00 за мільйон вихідних, тоді як V2.5-Pro коштує $1.00/$3.00 за мільйон (вхідні/вихідні) до 256K контексту, подвоюючись при більшому обсязі. Вартість вхідних запитів при кешуванні знижується до $0.20–$0.40 за мільйон, що робить її однією з найдешевших передових моделей у світі. **Огляд Ціноутворення API Моделей Frontier від VentureBeat** | Модель | Вхідні Токени | Вихідні Токени | Загальна Вартість | Джерело | | :——————— | :———— | :————- | :—————- | :—————— | | MiMo-V2.5 Flash | $0.10 | $0.30 | $0.40 | Xiaomi MiMo | | deepseek-v4-flash | $0.14 | $0.28 | $0.42 | DeepSeek | | deepseek-v4-pro | $0.435 | $0.87 | $1.305 | DeepSeek | | MiniMax-M3 | $0.30 | $1.20 | $1.50 | MiniMax | | Gemini 3.1 Flash-Lite | $0.25 | $1.50 | $1.75 | Google | | Qwen3.7-Plus | $0.40 | $1.60 | $2.00 | Alibaba Cloud | | MiMo-V2.5 | $0.40 | $2.00 | $2.40 | Xiaomi MiMo | | Grok 4.3 (low context) | $1.25 | $2.50 | $3.75 | xAI | | MiMo-V2.5 Pro (≤256K) | $1.00 | $3.00 | $4.00 | Xiaomi MiMo | | GLM-5 | $1.00 | $3.20 | $4.20 | Z.ai | | Kimi-K2.6 | $0.95 | $4.00 | $4.95 | Moonshot/Kimi | | GLM-5.1 | $1.40 | $4.40 | $5.80 | Z.ai | | Grok 4.3 (high context)| $2.50 | $5.00 | $7.50 | xAI | | **MiMo-V2.5 Pro (>256K)** | **$2.00** | **$6.00** | **$8.00** | **Xiaomi MiMo** | | Qwen3.7-Max | $2.50 | $7.50 | $10.00 | Alibaba Cloud | | Gemini 3.5 Flash | $1.50 | $9.00 | $10.50 | Google | | Gemini 3.1 Pro Preview (≤200K) | $2.00 | $12.00 | $14.00 | Google | | GPT-5.4 | $2.50 | $15.00 | $17.50 | OpenAI | | Gemini 3.1 Pro Preview (>200K) | $4.00 | $18.00 | $22.00 | Google | | Claude Opus 4.8 | $5.00 | $25.00 | $30.00 | Anthropic | | GPT-5.5 | $5.00 | $30.00 | $35.00 | OpenAI | | Claude Fable 5 / Claude Mythos 5 | $10.00 | $50.00 | $60.00 | Anthropic | Для розробників, які не бажають використовувати моделі Xiaomi, MiMo Code також підтримує сторонні бекенди, включаючи тарифи DeepSeek, Kimi від Moonshot та GLM від Zhipu, а також будь-які API, сумісні з OpenAI. Це забезпечує гнучкість використання власних моделей, аналогічну його батьківському проєкту OpenCode. ### Глобальна Гонка AI-Агентів у Терміналі MiMo Code з’являється на вже насиченому ринку термінальних AI-агентів, де представлені Claude Code від Anthropic, Codex CLI від OpenAI, Gemini CLI від Google, а також відкриті рішення, такі як OpenCode та Aider. Новизною є поява Xiaomi – третього за величиною виробника смартфонів у світі, який також активно розвиває бізнес електромобілів. Компанія методично будує свій підрозділ MiMo AI з моменту випуску моделі MiMo-7B у квітні 2025 року, за яким послідували серії MiMo-VL (vision-language), MiMo-V2-Flash, 1-трильйонна MiMo-V2-Pro у березні 2026 року та флагманська родина V2.5 у квітні. Проєкт очолює Фулі Луо, ветеран проєкту DeepSeek R1, який охарактеризував стратегію Xiaomi як “тихий напад” та підкріпив її грантом у 100 трильйонів безкоштовних токенів для розробників, оголошеним разом із запуском V2.5. Схема дій знайома за прикладами DeepSeek, Qwen від Alibaba, MiniMax та серією Kimi від Moonshot AI: випуск справді потужних моделей та інструментів під гнучкими ліцензіями за ціною, що значно нижча за рішення американських лабораторій, та перетворення отриманої уваги розробників на стійку екосистему. Поєднуючи відкриту систему агентів з безкоштовною передовою моделлю, Xiaomi ефективно усуває як витрати на ліцензування, так і на використання – принаймні, на даний момент. ### Що Це Означає для Підприємств та Технічних Лідерів Для керівників інженерних відділів, MiMo Code є кандидатом для оцінки з низьким ризиком та потенційно високою цінністю. Ліцензія типу MIT дозволяє модифікацію та комерційну інтеграцію. Походження від OpenCode означає, що архітектура є відкритою для вивчення, а підтримка власних моделей дозволяє спрямувати його на внутрішньо схвалені сервери, а не на хмару Xiaomi. Система постійної пам’яті вирішує реальну та широко відчутну проблему в робочих процесах розробки з AI-агентами – проблему, яку конкуренти також активно намагаються вирішити. З іншого боку, слід врахувати такі аспекти: безкоштовний доступ до моделі “обмежений у часі” є тимчасовим і передає контекст коду через сервери Xiaomi, що неприйнятно для організацій зі суворими політиками щодо даних або інтелектуальної власності. Перевага над Claude Code є заявленою постачальником, а версія V0.1.0 свідчить про поточний рівень зрілості. Команди, які підпадають під обмеження урядових закупівель США щодо китайських технологічних компаній, також повинні враховувати цей фактор перед впровадженням. ### Порада від INFBusiness: MiMo Code – це значний крок уперед для AI-асистентів розробки, особливо завдяки його інноваційній системі пам’яті, що вирішує проблему “забування” AI під час довгих проєктів. Безкоштовний доступ до потужних моделей та гнучкі можливості інтеграції роблять його привабливим для індивідуальних розробників та компаній, які шукають ефективні та економічні інструменти для підвищення продуктивності кодування. Особливо цінним є те, що ви можете використовувати власні моделі, забезпечуючи відповідність політикам безпеки даних. “`

За даними порталу: venturebeat.com

Поділитися новиною:TelegramViberFacebook
No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *