OpenAI представила GPT-5.4 з функцією розпізнавання зображень.

Компанія OpenAI представила GPT‑5.4 і GPT‑5.4 Pro через дві доби після випуску версії 5.3 Instant. 

Звичайна модифікація GPT‑5.4 наявна у веб‑інтерфейсі ChatGPT, за допомогою API і в інструменті Codex. Варіант GPT‑5.4 Thinking відкрили для підписників Plus, Team і Pro. 

Для користувачів плану Pro і корпоративних замовників Enterprise призначена GPT‑5.4 Pro, котра також доступна через API. 

Основна ціна використання складає $2,5 за 1 млн вхідних токенів і $15 за 1 млн вихідних. Розцінки для версії Pro значно вищі: $30 і $180 за 1 млн токенів відповідно.

Результативність у робочих задачах

GPT‑5.4 дає більш стійкі та якісні результати у реальних прикладах використання. У бенчмарку GDPval, що оцінює здійснення завдань за 44 професіями, версія досягла показника 83%. Це свідчить, що модель діє на рівні профільних спеціалістів або перевершує їх. Для зіставлення, результат GPT‑5.2 дорівнював 70,9%.

image

Джерело: OpenAI. 

Окрему увагу розробники зосередили на роботі з таблицями, презентаціями та документами. У завданнях рівня молодшого аналітика інвестбанку GPT‑5.4 отримала 87,3% проти 68,4% у GPT‑5.2. 

Презентації від нової моделі оцінювачі надавали перевагу у 68% випадків — через кращу естетику, різноманітність та дієве застосування генерації зображень.

image

Джерело: OpenAI. 

GPT‑5.4 також стала найбільш точною моделлю OpenAI з точки зору роботи з фактами. Під час перевірки на промптах із заздалегідь відомими помилками:

  • окремі ствердження виявлялися неправдивими на 33% рідше;
  • повні відповіді містили похибки на 18% рідше в порівнянні з GPT‑5.2.

Комп’ютерний зір 

Версія вперше здобула вбудовані здатності комп’ютерного зору та управління ПК. Модель може використовувати мишку і клавіатуру, орієнтуючись на скриншоти, а також писати код для автоматизації через Playwright. 

Поведінку налаштовують під конкретні сценарії з урахуванням припустимого рівня ризику.

У бенчмарку OSWorld‑Verified (керування робочим столом) GPT‑5.4 успішно виконала 75% завдань, обійшовши попередню версію (47,3%) і людину (72,4%). Прогрес пов’язаний із покращеним візуальним сприйняттям:

  • у тесті MMMU‑Pro (розуміння і логіка) результат склав 81,2% проти 79,5% у GPT‑5.2;
  • в OmniDocBench (аналіз документів) середній показник помилок зменшився з 0,140 до 0,109.

Програмування 

У кодингу модель зрівнялася зі спеціалізованою GPT‑5.3‑Codex, проте працює швидше. 

У Codex з’явився режим /fast, що прискорює генерацію у півтора раза без втрати якості. За підсумками внутрішніх тестувань GPT‑5.4 показала високі результати у важких завданнях фронтенд‑розробки. 

Також представлено експериментальну навичку Playwright (Interactive). Вона дозволяє моделі візуально налагоджувати веб‑ та Electron‑застосунки, тестуючи власний код просто в процесі написання.

Інструменти 

У GPT‑5.4 з’явилася функція пошуку інструментів (Tool Search). Раніше системі доводилося наперед завантажувати в контекст описи всіх доступних плагінів. Це додавало тисячі зайвих токенів до кожного запиту та збільшувало вартість.

Тепер модель отримує лише базовий перелік і за потреби самостійно знаходить і завантажує потрібні параметри. У тестах на основі MCP Atlas такий підхід зменшив споживання токенів на 47% без втрати точності.

Вебпошук також став продуктивнішим: у бенчмарку BrowseComp показники піднялися на 17%, а версія Pro досягла рекордних 89,3%. GPT‑5.4 Thinking ефективніше збирає інформацію з багатьох джерел, краще обробляє складні запити й видає більш структуровані відповіді.

Керованість і контекст

Під час роботи зі складними запитами GPT‑5.4 Thinking у ChatGPT спершу демонструє користувачу план дій. Це дає змогу на ходу скоригувати напрям без перезапуску генерації та зайвих уточнень. Функція вже доступна на сайті й в Android‑застосунку, незабаром з’явиться на iOS.

Модель також краще утримує контекст у довгих діалогах і довше розмірковує над складними завданнями. Це допомагає зберігати зв’язність і релевантність відповідей навіть під час роботи з великими масивами інформації.

Нагадаємо, на початку березня користувачі бойкотували ChatGPT на тлі угоди OpenAI з Пентагоном. 

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *