Meituan відкриває LongCat-2.0: модель кодування на 1.6T, що лідирує в OpenRouter, тренована на китайських чипах

Meituan відкриває LongCat-2.0: модель кодування на 1.6T, що лідирує в OpenRouter, тренована на китайських чипах 3

Кілька годин тому китайська компанія-розробник додатків для доставки Meituan офіційно представила LongCat-2.0 на платформах GitHub, Hugging Face та власному майданчику. Ця модель стала обчислювальним ядром для “Owl Alpha” — анонімної “стелс”-моделі, яка протягом останніх двох місяців очолювала світові рейтинги розробників на OpenRouter.

Система Mixture-of-Experts (MoE) з 1,6 трильйона параметрів, розроблена для того, щоб кинути виклик домінуванню пропрієтарних рішень у сфері автономної інженерії програмного забезпечення, тепер доступна широкому загалу під надзвичайно гнучкою, комерційно придатною ліцензією MIT. Особливістю є вбудоване вікно контексту на 1 мільйон токенів. Варто зазначити, що повні вагові коефіцієнти моделі поки що не опубліковані — на сторінках GitHub та Hugging Face вказано: “Вагові коефіцієнти моделі незабаром — слідкуйте за оновленнями!”

Комерційний доступ до архітектури пропонує агресивний ціновий рівень. Реалізовано механізм, за яким усі звернення до кешу контексту обробляються абсолютно безкоштовно. Паралельно діє програма тимчасового розпродажу “Пакетів Токенів”. Також передбачено стандартний API “оплати за використання” для звернень, що не потрапляють до кешу, за ціною $0.75 (приблизно 29 ₴) за мільйон вхідних токенів та $2.95 (приблизно 114 ₴) за мільйон вихідних.

Однак, завдяки обмеженій у часі акції, ці експлуатаційні витрати значно знижено: $0.30 (приблизно 12 ₴) за мільйон вхідних токенів та $1.20 (приблизно 47 ₴) за мільйон вихідних. Ці показники ставлять LongCat-2.0 серед найдоступніших моделей із високою продуктивністю на світовому ринку.

Модель

Вхідні ($/1М)

Вихідні ($/1М)

Разом ($/1М)

Джерело

MiMo-V2.5 Flash

$0.10

$0.30

$0.40

Xiaomi

deepseek-v4-flash

$0.14

$0.28

$0.42

DeepSeek

deepseek-v4-pro

$0.435

$0.87

$1.305

DeepSeek

MiniMax-M3

$0.30

$1.20

$1.50

MiniMax

LongCat-2.0 — обмежена промо-акція

$0.30

$1.20

$1.50

LongCat

Gemini 3.1 Flash-Lite

$0.25

$1.50

$1.75

Google

Qwen3.7-Plus

$0.40

$1.60

$2.00

Alibaba Cloud

MiMo-V2.5

$0.40

$2.00

$2.40

Xiaomi

LongCat-2.0 — стандартні ціни

$0.75

$2.95

$3.70

LongCat

Grok 4.3 (низький контекст)

$1.25

$2.50

$3.75

xAI

MiMo-V2.5 Pro (≤256K)

$1.00

$3.00

$4.00

Xiaomi

Kimi-K2.6

$0.95

$4.00

$4.95

Moonshot AI

GLM-5.2

$1.40

$4.40

$5.80

Z.ai

GPT-5.6 Luna

$1.00

$6.00

$7.00

OpenAI

Grok 4.3 (високий контекст)

$2.50

$5.00

$7.50

xAI

MiMo-V2.5 Pro (>256K)

$2.00

$6.00

$8.00

Xiaomi

Qwen3.7-Max

$2.50

$7.50

$10.00

Alibaba Cloud

Gemini 3.5 Flash

$1.50

$9.00

$10.50

Google

Gemini 3.1 Pro Preview (≤200K)

$2.00

$12.00

$14.00

Google

GPT-5.6 Terra

$2.50

$15.00

$17.50

OpenAI

GPT-5.4

$2.50

$15.00

$17.50

OpenAI

Gemini 3.1 Pro Preview (>200K)

$4.00

$18.00

$22.00

Google

Claude Opus 4.8

$5.00

$25.00

$30.00

Anthropic

GPT-5.5

$5.00

$30.00

$35.00

OpenAI

GPT-5.5 Instant (chat-latest)

$5.00

$30.00

$35.00

OpenAI

Sakana Fugu Ultra (≤272K)

$5.00

$30.00

$35.00

Sakana AI

GPT-5.6 Sol

$5.00

$30.00

$35.00

OpenAI

Claude Fable 5 / Claude Mythos 5

$10.00

$50.00

$60.00

Anthropic

Реліз цієї моделі стає визначальним моментом для світової технологічної інфраструктури завдяки її операційній незалежності. Величезна модель була навчена виключно на кластері з понад 50 000 вітчизняних китайських спеціалізованих інтегральних схем (ASIC). Це доводить, що передові моделі ШІ можуть бути масштабовані успішно без залежності від типових американських GPU від Nvidia, які до цього моменту були основою для тренування багатьох глобальних генеративних ШІ-моделей.

Успішне розгортання альтернативного кремнію сигналізує про глибоку структурну зміну. Якщо китайські конгломерати зможуть послідовно розробляти архітектури з трильйонами параметрів, використовуючи власні ASIC замість універсальних GPU, це може поставити під загрозу домінування Nvidia в цьому секторі.

Критично важливо, що цей технологічний поворот відбувається саме тоді, коли Вашингтон чинить тиск на провідні американські лабораторії, вимагаючи обмежити доступ до їхніх останніх моделей. Після запиту уряду США OpenAI була змушена обмежити доступ до своїх нових моделей GPT-5.6, а Anthropic раніше також отримала від США наказ обмежити доступ до своїх останніх моделей Claude Fable 5 / Mythos 5, повністю вилучивши їх з доступу. Водночас, зростаюча кількість технологів, активістів та експертів галузі попереджає, що ці оборонні регуляторні заходи мали зворотний ефект. Обмежуючи доступ до західних пропрієтарних моделей та підвищуючи вартість API, уряд США залишив широкий простір для глобальних розробників, які шукають доступні високопродуктивні альтернативи, подібні до китайських моделей з відкритим кодом, таких як Meituan LongCat-2.0.

Сирі операційні показники підтвердили ентузіазм розробників: під час свого анонімного перебування на OpenRouter, Owl Alpha обробляла приблизно 10,1 трильйона токенів на місяць, що в середньому становить 559 мільярдів токенів на день. Це представляє вибухове зростання обсягу на 242% порівняно з попереднім місяцем, що вивело її до трійки лідерів платформи.

До моменту, коли Meituan взяла на себе відповідальність за архітектуру, модель вже забезпечила перше місце в робочому просторі Hermes Agent, друге місце в розгортаннях Claude Code та третє місце в міжнародних середовищах OpenClaw.

VB Transform · 14–15 липня · Менло-Парк · Інференс та ШІ-інфраструктура

GM отримали 300% зростання об’єднаних PR завдяки реархітектурі для агентів. Ось що вони побудували.

Трек інфраструктури на Transform охоплює генерацію відео в реальному часі, стеки машинного розуміння та те, що насправді потрібно для роботи агентів на корпоративному рівні.

Дивіться повну програму →

Технології: Інженерія Розрідженого Контексту на 1М Токенів

В основі LongCat-2.0 лежить агресивна оптимізація розрідженості Mixture-of-Experts (MoE). Загальна кількість параметрів сягає 1,6 трильйона, тоді як активні обчислення обмежуються в середньому 48 мільярдами параметрів на токен.

Залежно від структурної складності запиту, динамічна активація моделі коливається від 33 до 56 мільярдів параметрів. Така конструкція реалізує фреймворк “Zero-Compute Experts”, який гарантує, що рутинні елементи виконання проходять через легші підмережі, повністю усуваючи невикористане обчислювальне навантаження, яке зазвичай ускладнює роботу надзвичайно щільних моделей.

Для підтримки функціонального вікна контексту на 1 мільйон токенів без катастрофічних апаратних вузьких місць, Meituan впровадила LongCat Sparse Attention (LSA). Розроблена як еволюційна ітерація DeepSeek Sparse Attention, LSA вирішує проблеми квадратичних витрат на оцінку та фрагментації пам’яті, які зазвичай ускладнюють роботу дрібнозернистих розріджених механізмів, завдяки трьом чітким, ортогональним векторам:

  • Streaming-aware Indexing (SI):** Ця система перебудовує конвеєр вибору токенів, поєднуючи апаратні послідовні зчитування даних з динамічним випадковим вибором. Перетворюючи фрагментований доступ до пам’яті на високопередбачувані, послідовні блоки, система досягає згуртованого використання High Bandwidth Memory (HBM) та підвищеної ефективної пропускної здатності.

  • Cross-Layer Indexing (CLI):** Використовуючи емпіричну реальність того, що значущість уваги залишається надзвичайно стабільною між суміжними прихованими шарами, CLI амортизує обчислювальні витрати. Один прохід індексації успішно керує кількома послідовними шарами під час виведення, що посилюється дистиляцією між шарами протягом фази тренування.

  • Hierarchical Indexing (HI):** Цей підхід застосовує двоступеневу схему оцінки від загального до детального. Індексатор виконує швидке, приблизне блочне вилучення для фільтрації кандидатів, перш ніж виконувати дрібнозернистий вибір токенів виключно серед решти населення.

Крім того, Meituan інтегрувала модуль N-gram Embedding, успадкований від своїх легших моделей. Розширюючи виділення параметрів у розріджених вимірах, повністю ортогональних до плану експертів MoE, архітектура додає 135 мільярдів параметрів до системи комбінування 5-грамних токенів.

Це розширює базовий простір вкладень приблизно в 100 разів, дозволяючи моделі захоплювати щільні локальні взаємозв’язки токенів та прискорювати операції виведення з великими пакетами, зменшуючи вузькі місця вводу-виводу пам’яті.

Продукт: Пост-тренування, Фреймворк MOPD та Продуктивність у Бенчмарках

Хоча загальні великі мовні моделі надають перевагу плавним розмовним інтерфейсам, LongCat-2.0 зосереджується виключно на багатоетапних інженерних завданнях, інтеграції інструментів та автоматизованому маніпулюванні репозиторіями — тобто, на агентних завданнях.

У стандартизованих оцінках LongCat-2.0 демонструє емпіричний результат 59.5 на SWE-bench Pro, перевершуючи показник GPT-5.5 — 58.6. Модель також підтверджує свою спеціалізацію на агентних завданнях, досягнувши 70.8 на Terminal-Bench 2.1, 77.3 на SWE-bench Multilingual та 73.2 на загальному симуляторі корпоративних робочих процесів FORTE.

Meituan відкриває LongCat-2.0: модель кодування на 1.6T, що лідирує в OpenRouter, тренована на китайських чипах 4

Точна операційна поведінка досягається завдяки структурному шару пост-тренування під назвою Multi-Teacher Optimization via Mixture of Specialized Experts (MOPD). Замість змішування сильного людського зворотного зв’язку в єдину функцію винагороди, архітектура MOPD розділяє оптимізацію після тренування на три незалежні, високоспеціалізовані кластери експертів.

  • Експерти Агентів оптимізовані виключно для структурного виконання, спеціалізуючись на точному виклику інструментів, парсингу параметрів API у багатоходівкових діалогах та механізмах самокорекції для уникнення стагнації виконання.

  • Експерти Міркувань оптимізовані окремо для просування логіки з множинними стрибками, інженерії складних ланцюжків думок, математики та вирішення високорівневих STEM-завдань.

  • Експерти Взаємодії повністю зосереджені на узгодженні з людьми, нюансах дотримання інструкцій, фактичному обґрунтуванні для придушення галюцинацій та підтримці жорстких запобіжних заходів без зниження загальної корисності моделі.

Розділяючи ці вектори під час пост-тренування, LongCat-2.0 запобігає деградації функціональності. Динамічний механізм маршрутизації воріт безшовно об’єднує ці спеціалізовані поведінки під час роботи, дозволяючи фінальній моделі одночасно координувати глибокі міркування, стабільне виконання інструментів та безпечну взаємодію з користувачем.

Хоча LongCat-2.0 загалом поступається преміальним передовим системам, таким як Claude Opus 4.8, за загальними бенчмарками для агентів, як-от FORTE та BrowseComp, вона явно перевершує конкурентів у сфері розробки програмного забезпечення.

Що робить цю архітектуру з відкритими ваговими коефіцієнтами особливою, так це її гіперфокус на автономній розробці; їй вдається незначно перевищити пропрієтарну GPT-5.5 від OpenAI на суворому бенчмарку програмної інженерії SWE-bench Pro (показник 59.5 проти 58.6), доводячи свою високу здатність та жорстку конкурентоспроможність для складних завдань кодування, попри менший обчислювальний ресурс.

Комерційна модель: Оплата за використання проти Пакетів Токенів зі Знижками

Стратегія розгортання Meituan представляє спеціалізовану комерційну модель, яка розділяє мережевий доступ між звичайним білінгом API у реальному часі та структурованими “Пакетами Токенів”.

Для традиційної корпоративної інтеграції доступні стандартні облікові записи з поповненням, які в реальному часі списують операційний капітал на основі метрик введення та генерації токенів.

Однак, для підтримки непередбачуваних сплесків обчислень, характерних для автономних агентів розробки, Meituan запустила структурований фреймворк Пакетів Токенів. Придбані як фіксовані, одноразові об’ємні квоти, дійсні протягом суворого 30-денного періоду, ці пакети додаються безпосередньо до існуючого базового API-рахунку організації.

Для управління мережевим навантаженням на своїх ASIC-кластерах, Meituan випускає ці високооб’ємні пакети під час обмежених флеш-розпродажів чотири рази на день, точно о 10:00, 16:00, 21:00 та 23:00 за пекінським часом, на основі принципу “хто перший прийшов, той і отримав”. Економічно вигідною особливістю цього фреймворку є обробка звернень до кешу контексту безкоштовно.

У масових агентних середовищах, де помічник з кодування повинен неодноразово читати, посилатися та модифікувати один і той самий багатомільйонний репозиторій коду протягом тривалого сеансу, стандартні архітектури штрафують розробників, стягуючи повну плату за повторний вхідний контекст.

В інфраструктурі Meituan лише звернення, що не потрапляють до кешу, та фінальна генерація токенів споживають квоту пакету. Така архітектура повністю змінює економіку операційних витрат масштабної розробки програмного забезпечення за допомогою агентів, дозволяючи глибоко ітеративне дослідження контексту без зростання витрат.

Ліцензування: Відкрита Структурна Свобода

Зареєструвавши репозиторій LongCat-2.0 під ліцензією відкритого програмного забезпечення MIT, Meituan надає архітектурі максимальну юридичну гнучкість для корпоративної інтеграції.

На відміну від копілефт-парадигм, таких як GNU General Public License (GPL), яка юридично зобов’язує розробників відкривати вихідний код будь-яких похідних фреймворків або внутрішнього програмного забезпечення, що пов’язується з кодом, ліцензія MIT дозволяє майже необмежену свободу.

Для корпоративних інженерних команд цей юридичний стандарт гарантує, що LongCat-2.0 може бути глибоко модифікована, скомпільована та жорстко закодована безпосередньо в комерційні додатки із закритим вихідним кодом, пропрієтарні інструменти розробки та внутрішні автоматизовані бекенди.

Корпорації можуть форкнути репозиторій, оптимізувати внутрішні механізми LSA для приватних баз даних і продавати отриманий програмний стек кінцевим користувачам без будь-яких зобов’язань розкривати свою пропрієтарну інтелектуальну власність або структурні покращення.

Еволюція Meituan: Від Delivery Super App до AI Powerhouse

Заснована у березні 2010 року підприємцем Ван Сінгом, Meituan спочатку стартувала як сайт щоденних пропозицій у стилі Groupon, перш ніж стрімко перетворитися на один із домінуючих китайських “супер-додатків”.

Після масового злиття у 2015 році з Dianping, пекінський технологічний гігант закріпив домінуючу частку ринку в міських логістичних коридорах країни, поєднуючи місцеві відгуки споживачів, миттєву роздрібну торгівлю, бронювання готелів та доставку їжі. Працюючи як публічно торгуваний гігант на Гонконгській фондовій біржі, Meituan обслуговує понад 770 мільйонів транзакційних користувачів на рік і підтримує мережу з понад 14,5 мільйонів продавців.

Однак, стикаючись із жорсткою внутрішньою ринковою конкуренцією, серйозним стисненням маржі та спадними показниками прибутку, компанія агресивно змінила свою стратегію, вийшовши за межі логістики. Meituan публічно зобов’язалася інвестувати “мільярди” в штучний інтелект та вітчизняні чіпові технології, щоб відродити свої технологічні пропозиції.

Цей стратегічний перехід у світову гонку ШІ почав матеріалізуватися наприкінці 2025 року з випуском LongCat-Flash, моделі Mixture-of-Experts з 560 мільярдами параметрів, за якою швидко послідувала передова модель для міркувань LongCat-Flash-Thinking. Відкриваючи ці передові моделі під ліцензіями, дружніми до підприємств, Meituan продемонструвала своє прагнення стати фундаментальним гравцем у глобальній ШІ-інфраструктурі, а не залишатися виключно регіональним гігантом електронної комерції та доставки.

Наслідки для Підприємств: Автономні Операційні Робочі Процеси

Для сучасних підприємств випуск LongCat-2.0 відкриває чіткі операційні стратегії в галузі розробки програмного забезпечення, системної експлуатації та інтерпретації довгострокових даних.

Комбінація моделі з відкритими ваговими коефіцієнтами, ліцензією MIT та розширеним контекстним вікном на 1 мільйон токенів означає, що організації можуть уникнути проблем із конфіденційністю даних та поточних витрат, пов’язаних із розміщенням пропрієтарних сторонніх API.

У масштабних корпоративних середовищах розробки команди можуть використовувати спеціалізованих експертів агентів моделі для оркестрації автономних міграцій кодової бази. Замість того, щоб виділяти сотні годин розробників на ручне переписування застарілих фреймворків додатків, інженери можуть передати весь корпоративний репозиторій разом із сучасною документацією SDK безпосередньо в контекстне вікно на 1 мільйон токенів. LongCat-2.0 може відображати залежності, виконувати структурні оновлення на рівні репозиторію, компілювати новий код та виявляти помилки компіляції та виконання автономно в локальних пісочницях, перш ніж генерувати фінальний pull request.

Архітектурне розділення моделі за допомогою механізму маршрутизації воріт MOPD дає значні переваги для суворого корпоративного дотримання нормативних вимог. Маршрутизуючи конкретні операційні запити через ізольовані кластери експертів, фінансова установа або медична компанія можуть виконувати глибокі логічні та математичні міркування без ризику фактичних галюцинацій або порушення жорстких безпекових меж. Експерти взаємодії функціонують як неявний рівень запобіжних заходів, пригнічуючи помилки та забезпечуючи дотримання протоколів інструкцій без зниження сирої обчислювальної потужності внутрішніх експертів міркувань. У поєднанні з моделлю кешування з нульовою вартістю, підприємства можуть підтримувати гіперфокусовані автономні програмні мережі, які можуть неодноразово інспектувати корпоративні пули даних, постійно підтримуючи та оптимізуючи внутрішню інфраструктуру за частку стандартних операційних витрат.

Порада від INFBusiness: Ця новина є надзвичайно цінною для розробників та бізнесів, які шукають потужні, але економічно ефективні рішення у сфері ШІ. LongCat-2.0 пропонує унікальне поєднання величезного контекстного вікна, відкритої ліцензії та інноваційної моделі ціноутворення, що робить його привабливою альтернативою для завдань, особливо пов’язаних із програмною інженерією та автономними агентами. Особливо цікавим є потенціал для зниження операційних витрат завдяки безкоштовній обробці кешованих даних.

Подробиці можна знайти на сайті: venturebeat.com

Поділитися новиною:TelegramViberFacebook
No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *