Нові ШІ-моделі від Alibaba обійшли GPT-4o в математиці

Alibaba запустила групу великих мовних моделей (LLM) з акцентом на математику під назвою Qwen2-Math, які «перевершують GPT-4o і Claude 3.5» у цій галузі.

Today we release a new model series for math-specific language models, Qwen2-Math, which is based on Qwen2. The flagship model, Qwen2-Math-72B-Instruct, outperforms proprietary models, including GPT-4o and Claude 3.5, in math related downstream tasks!

Feel free to check our blog… pic.twitter.com/9P4BiBweFY

— Qwen (@Alibaba_Qwen) August 8, 2024

«За останній рік ми доклали чимало зусиль для вивчення і розширення можливостей міркувань великих мовних моделей, приділяючи особливу увагу їхній здатності розв’язувати арифметичні та математичні задачі», — зазначила команда Qwen, що входить до складу підрозділу хмарних обчислень Alibaba.

Моделі Qwen2-Math випущені на базі представлених у червні LLM Qwen2. Стверджується, що флагманська Qwen2-Math-72B-Instruct перевершила американських конкурентів у математиці, зокрема GPT-4o від OpenAI, Claude 3.5 Sonnet від Anthropic, Gemini 1.5 Pro від Google і Llama-3.1-405B від Meta Platforms.

Порівняння Qwen2-Math з іншими ШІ-моделями. Джерело: Qwen.

На початку серпня ШІ-підрозділ Google DeepMind випустив експериментальну версію своєї провідної ШІ-моделі Gemini 1.5 Pro, яка привернула увагу громадськості через високі результати під час тестів.

«Ми сподіваємося, що Qwen2-Math зможе зробити свій внесок у наукову спільноту, розв’язуючи складні математичні задачі, які потребують багатоетапних логічних міркувань», — зазначили розробники.

Згідно з наданою інформацією, нові ШІ-моделі Alibaba протестовані на математичних завданнях англійською та китайською мовами. Вони включали:

Порівняння Qwen2-Math з іншими ШІ-моделями в різних тестах. Джерело: Qwen.

За словами команди, нові ШІ-моделі мають деякі обмеження через підтримку лише англійської мови. Найближчим часом планується випуск двомовних LLM, а пізніше — багатомовних.

Нагадаємо, у серпні стало відомо про роботу Alibaba над генератором зображень Tora.

Раніше техгігант анонсував випуск чат-бота зі штучним інтелектом Tongyi Qianwen.

Источник

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *






Цей сайт використовує Akismet для зменшення спаму. Дізнайтеся, як обробляються ваші дані коментарів.

6 листопада 43 макаки-резуса втекли з дослідницького центру Alpha Genesis у місті Йемассі,…

Протягом 2022-2023 років стартапи в екосистемі Ethereum отримали $497 млн як фінансування, зокрема $240,3 млн…

Anthropic слідом за Meta відкрила свої ШІ-технології розвідувальним і оборонним агентствам США. Для…

Співзасновник FTX, що зазнала краху, Гері Ван допомагає уряду США у створенні програмного…

У ніч на 8 листопада котирування Solana досягли позначки $200, яку востаннє спостерігали…

Генеральний директор канадської криптовалютної компанії WonderFi Дін Скурка став жертвою викрадення.…

Чанпен Чжао (CZ) отримував пропозиції про продаж свого контрольного пакета акцій…

Адміністрація Дональда Трампа, ймовірно, створить більш сприятливі умови для криптовалют, включно…

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *