OpenAI розкрила передову ШІ-модель GPT-5.5.

OpenAI презентувала GPT‑5.5. Дану модель представляють як «новий рівень інтелекту для практичної діяльності та забезпечення роботи агентів».

Штучна нейромережа «розроблена для розуміння непростих завдань, застосування інструментарію, перевірки результатів праці та реалізації більшої кількості задач до завершення».

Модель здатна розпізнавати наміри користувача, самостійно планувати діяльність і завершувати задачі з отриманням кінцевого результату. GPT‑5.5 «чудово впорається» з написанням та налагодженням коду, пошуком інформації в мережі інтернет, аналізуванням даних, творенням документів і таблиць, керуванням програмним забезпеченням і перемиканням між інструментами.

«Замість пильного контролю кожного кроку, ви можете доручити GPT‑5.5 складну багатоетапну задачу та довіритися їй у плануванні, застосуванні інструментів, перевірці її роботи, вирішенні невизначеностей і продовженні діяльності», — зазначено в анонсі.

image

Тестування GPT‑5.5 у різних випробуваннях. Джерело: OpenAI.

OpenAI наголосила, що нова модель особливо дієва в агентному програмуванні, управлінні комп’ютером, інтелектуальній діяльності та початкових наукових дослідженнях — сферах, де важливо формувати тривалі ланцюжки міркувань і дій.

«GPT‑5.5 надає значний прорив в інтелекті, не впливаючи на швидкість. Більші та потужніші моделі часто працюють повільніше, але GPT‑5.5 відповідає GPT‑5.4 за затримкою на токен у реальних умовах, при цьому демонструючи значно вищий рівень інтелекту», — заявили у стартапі.

Штучна нейромережа використовує «значно менше» токенів під час функціонування в Codex.

OpenAI повідомила про впровадження «найдієвішого» набору запобіжних заходів перед випуском. Компанія взаємодіяла з внутрішніми та зовнішніми експертами.

Доступність

GPT‑5.5 функціонує в ChatGPT і Codex для користувачів планів Plus, Pro, Business і Enterprise. Окрема модифікація GPT‑5.5 Pro представлена для Pro, Business і Enterprise.

Найближчим часом обидві варіації з’являться через API за вартістю $5 млн за 1 млн вхідних токенів і $30 млн — вихідних. Обсяг контексту — 1 млн токенів.

У Codex GPT‑5.5 доступна для тарифних планів Plus, Pro, Business, Enterprise, Edu і Go з обсягом контексту 400 000. GPT‑5.5 представлена в режимі Fast, створюючи токени в 1,5 раза швидше за 2,5х ціни.

GPT‑5.5 коштує дорожче ніж GPT‑5.4. Це пояснюється більшою результативністю застосування токенів.

Можливості GPT‑5.5

Нова модель використовує менше токенів і рідше потребує повторних спроб під час розв’язання завдань. У показнику програмування Artificial Analysis вона забезпечує «передовий рівень інтелекту» за вдвічі менших витрат порівняно з конкурентами.

image

Джерело: OpenAI.

GPT‑5.5 — найпотужніше рішення компанії в сфері агентного програмування. У Terminal‑Bench 2.0, де перевіряють складні сценарії функціонування в командному рядку, точність — 82,7%.

У SWE‑Bench Pro результат досягав 58,6%, в Expert‑SWE нейромережа перевершила GPT‑5.4.

За всіма трьома показниками новинка обійшла попередню версію, водночас використовуючи менше токенів.

image

Джерело: OpenAI.

«Сильні сторони моделі в області програмування особливо помітні в Codex, де вона має змогу виконувати інженерні завдання — від реалізації та рефакторингу до налагодження, тестування та валідації», — зазначено в блозі компанії.

GPT‑5.5 краще розуміє структуру системи: чому певні елементи не працюють, де потрібно виконати зміни та на які частини коду це вплине.

Модель «відчутно перевершує» GPT‑5.4 і Claude Opus 4.7 за здатністю до логічного мислення та автономності: вона заздалегідь виявляє проблеми, передбачає потреби в тестуванні та рецензуванні без прямих вказівок.

У тесті GDPval⁠⁠, який перевіряє здатність агентів виконувати чітко окреслені інтелектуальні задачі в 44 професіях, GPT‑5.5 набирає 84,9%. В OSWorld‑Verified — 78,7%, у Tau2‑bench — 98%.

image

Джерело: OpenAI.

GPT‑5.5 демонструє високі показники й в інших тестах: 60% у FinanceAgent, 88,5% — у задачах внутрішнього моделювання інвестиційного банкінгу та 54,1% — в OfficeQA Pro.

image

Джерело: OpenAI.

Робота з інформацією

GPT‑5.5 є «ефективним інструментом для повсякденної праці на комп’ютері». Модель краще розуміє задум користувача та впевненіше виконує весь цикл операцій з інформацією: пошук, аналіз, застосування інструментів, перевірка та перетворення вихідних даних у готовий результат.

У Codex GPT‑5.5 перевершує GPT‑5.4 у створенні документів, таблиць і слайд‑презентацій.

Понад 85% працівників різних відділів OpenAI щотижня користуються Codex, зокрема в розробці програмного забезпечення, фінансах, комунікаціях, маркетингу, аналітиці даних і продакт‑менеджменті.

Наукові дослідження

У науково‑технічних робочих процесах GPT‑5.5 також показує кращі результати. Маються на увазі задачі, які не зводяться до надання відповіді на конкретне питання: модель здатна послідовно досліджувати ідею, збирати докази, аналізувати гіпотезу та інтерпретувати отримані відомості.

image

Джерело: OpenAI.

GPT‑5.5 демонструє покращення порівняно з GPT‑5.4 на GeneBench — платформі для багатоетапного аналізу наукових даних у генетиці та кількісній біології.

У BixBench нова модель також обійшла попередницю.

image

Джерело: OpenAI.

Нагадаємо, у квітні OpenAI презентувала «агентів для робочого простору» в ChatGPT. Команди можуть створювати спільних помічників для вирішення складних задач і тривалих процесів.

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *