OpenAI анонсувала нові ШІ-моделі o3, які «думають»

На завершення 12-денного івенту OpenAI представила найбільший анонс — нову модель з орієнтиром на міркування o3.

Today, we shared evals for an early version of the next model in our o-model reasoning series: OpenAI o3 pic.twitter.com/e4dQWdLbAD

— OpenAI (@OpenAI) December 20, 2024

Нейромережа є наступником o1. Вона демонструє «нові стандарти можливостей у сфері програмування, математики та наукового мислення».

Нова модель є проривом і показує поліпшення в найскладніших тестах, наголосив співзасновник OpenAI Грег Брокман.

o3, our latest reasoning model, is a breakthrough, with a step function improvement on our hardest benchmarks. we are starting safety testing & red teaming now. https://t.co/4XlK1iHxFK

— Greg Brockman (@gdb) December 20, 2024

Також представлено o3-mini — швидшу, оптимізовану версію o3. Вона першою з лінійки стане доступною широкому загалу на початку 2025 року.

Орієнтовані на міркування моделі витрачають більше часу на відповідь, перевіряючи інформацію. Завдяки цьому можна очікувати отримання більш правдивих і точних даних.

Після випуску o1 стався вибух «нейромереж, що думають». Google почала розробку аналогічного рішення, дізналися ЗМІ в жовтні. У листопаді китайська лабораторія DeepSeek представила «конкурента o1 від OpenAI» — «надпотужну» ШІ-модель DeepSeek-R1-Lite-Preview, яка міркує. Того ж місяця Alibaba показала аналогічний інструмент.

Модель o3 здатна планувати та виконувати низку дій перед відповіддю. OpenAI описує цей процес як «побудову ланцюжка думок». Нововведенням є можливість «коригувати» час міркування. Нейромережу можна налаштувати на низькі, середні або високі обчислення. Що значення вище, то краща і довша відповідь.

У грудні експерти з безпеки виявили, що o1 більш схильна до обману людей порівняно зі стандартною версією GPT-4o і ШІ-моделями від інших компаній.

У новому опублікованому дослідженні OpenAI виклала метод, який застосовується для того, щоб нейромережі дотримувалися цінностей компанії. Стартап застосував цей спосіб для навчання o1 і o3 «думати» про політику безпеки під час відповіді.

Згідно із заявою компанії, підхід поліпшив загальну відповідність o1 принципам фірми.

Порівняно з GPT-4o та іншими сучасними великими мовними моделями, o1 випереджає межу Парето, відмовляючись відповідати на шкідливі запити і не відхиляючи доброякісні. Джерело: OpenAI.

Для створення «ланцюжка думок» o1 і o3 після отримання запиту від користувача виділяють собі від кількох секунд до хвилин для розбору проблеми на складові частини. Для підвищення безпеки OpenAI навчила нейромережі перевіряти себе двічі з упором на свою політику.

Тим часом The Wall Street Journal повідомило, що наступна флагманська модель GPT-5 відстає від графіка, а зростання продуктивності не виправдовує величезних витрат.

Нова нейромережа під кодовою назвою Orion навчена на величезній кількості даних.

Також повідомляється, що OpenAI під час навчання ШІ покладалася не тільки на загальнодоступну інформацію та ліцензовані угоди. Застосовувалися, зокрема, синтетичні дані, створені o1.

Нагадаємо, в рамках 12-денного івенту OpenAI представила ШІ-генератор відео Sora.

Источник

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *






Цей сайт використовує Akismet для зменшення спаму. Дізнайтеся, як обробляються дані ваших коментарів.

Більшість криптовалют не має реальної економічної основи і функціонує лише завдяки…

16 квітня інвестори вивели $169,9 млн зі спотових біткоїн-ETF, що призвело…

Ціна на першу криптовалюту залишається вище $80 000, демонструючи просідання в…

Біржа Binance надає консультації ряду країн щодо регулювання цифрових активів і…

У майбутньому організаціям можуть «послабити» вимоги, що стосуються цифрових активів. Таку інформацію…

Зловмисники скористалися X-акаунтом депутата парламенту Великої Британії та лідера Палати громад Люсі…

У той момент, коли золото продовжує встановлювати нові рекорди на фоні свіжих сплесків…

У першому кварталі 2025 року токени, пов’язані з ШІ та мемами,…

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *