
OpenAI представила “розумний” генератор зображень ChatGPT Images 2.0 — “прогресивну модель, здатну вирішувати непрості візуальні завдання та створювати докладні, готові до застосування роботи”.
Представляємо ChatGPT Images 2.0
Інноваційна модель для візуалізацій, яка бере на себе важкі візуальні завдання та виробляє докладні, відразу готові до використання візуальні матеріали з більш акуратним редагуванням, розширеними макетами та інтелектом рівня “мислення”.
Відео створене за допомогою ChatGPT Images pic.twitter.com/3aWfXakrcR
— OpenAI (@OpenAI) 21 квітня 2026
У компанії підкреслили “суттєвий прогрес” у дотриманні вказівок, точному розміщенні та пропорціях об’єктів, а також у візуалізації насиченого тексту.
Модель впевнено оперує кількома мовами та автоматично заповнює пробіли у запиті, покладаючись на візуальний і загальний контекст. У результаті користувач отримує бажаний результат із меншою кількістю корегувань.
Акуратність і контроль
ChatGPT Images 2.0 освоює складні ідеї та чітко втілює їх візуально.
Модель виконує інструкції, зберігає встановлені деталі та відтворює дрібні елементи з роздільною здатністю до 2K.
Більша акуратність і контроль
ChatGPT Images 2.0 може концептуалізувати складніші зображення, а потім ефективно реалізовувати це бачення в життя.
Вона вміє дотримуватися вказівок, зберігати запитані деталі та рендерити дрібні елементи, які часто “ламають” зображення… pic.twitter.com/n29165pV9Q
— OpenAI (@OpenAI) 21 квітня 2026
Робота зі стилями
ChatGPT Images 2.0 більш точно передає характерні особливості фотографій, кінематографічних кадрів, піксельної графіки, манги та інших візуальних стилів. LLM забезпечує високу узгодженість текстур, освітлення, компонування та незначних деталей.
Така точність стане в нагоді під час створення ігрових прототипів, у розробці розкадрувань, підготовці маркетингових матеріалів і створенні робіт у визначеному медіаформаті чи жанрі.
Вміє мислити
ChatGPT Images 2.0 — перша модель OpenAI для роботи із зображеннями, яка здатна міркувати перед генерацією.
У зв’язці з ChatGPT модель уміє знаходити інформацію в інтернеті в реальному часі, створювати кілька варіантів за одним промтом, перевіряти результати та генерувати робочі QR-коди.
«Це дозволяє моделі взяти на себе більшу частину важкої роботи між ідеєю та зображенням, особливо коли акуратність, актуальність інформації, узгодженість і візуальна цілісність мають першорядне значення», — заявляють в OpenAI.
Модель підтримує співвідношення сторін від 3:1 по ширині до 1:3 по висоті. Вона доступна користувачам ChatGPT і Codex.
Функція Images with thinking доступна в тарифних планах ChatGPT Plus, Pro і Business.
Нагадаємо, у квітні OpenAI надала обмеженому колу користувачів доступ до нової ШІ-моделі GPT-5.4-Cyber.
