Розумний Google: Gemini, ШІ-математик та відкриття ліків з допомогою ШІ

Google модернізувала режим аргументації Gemini 3 Deep Think. Інструмент подається як рішення для непростих задач у сфері науки та інженерії.

У випробуваннях модель обігнала GPT-5.2 від OpenAI і Claude Opus 4.6 від Anthropic, зокрема в ARC-AGI-2 з візуальними завданнями, MMMU-Pro для оцінювання мультимодальних здібностей, Elo 3455 та «Кінцевому екзамені людства».

image

Джерело: Google.

«Ми покращили Gemini 3 Deep Think у тісній взаємодії з вченими та дослідниками, щоб мати змогу розв’язувати складні наукові проблеми — там, де умови часто не мають чіткого окреслення або єдиного вірного результату, а інформація надана не в повному обсязі», — зазначено у блозі компанії.

Gemini 3 Deep Think показує вражаючі результати в математиці та кодуванні, а також «чудово» демонструє себе в природничих науках, зокрема в хімії та фізиці. Оновлена версія розв’язує завдання на рівні золотих медалістів міжнародних олімпіад.

У CMT-Benchmark модель отримала 50,5%, засвідчивши глибокі пізнання в царині теоретичної фізики.

image

Джерело: Google.

«Крім передових показників, Deep Think націлений на практичне застосування: він допомагає науковцям інтерпретувати заплутані дані, а інженерам — моделювати фізичні системи за допомогою коду», — повідомили в Google.

Новий Deep Think доступний у додатку Gemini для користувачів Google AI Ultra та в Gemini API для певних розробників.

ШІ-математик від DeepMind

Підрозділ Google DeepMind представив ШІ-агента Aletheia. Модель встановила свіжий рекорд у бенчмарку IMO-ProofBench Advanced, вирішивши 91,9% задач. Тест вважається одним із найбільш складних у математичній науці.

Нейронну мережу збудовано на базі Gemini Deep Think. Система має модуль верифікації: він знаходить огріхи в чернетках розв’язків і запускає ітеративний процес їх покращення.

Основна риса агента — здатність визнати неможливість розв’язання задачі, що значно заощаджує час науковців.

Aletheia використовує Google Search для орієнтування в заплутаних наукових матеріалах, запобігаючи ймовірності використання неправдивих посилань і обчислювальних помилок під час роботи з науковими працями.

Серед здобутків моделі:

  • повна генерація наукової статті з обчисленням структурних констант в арифметичній геометрії;
  • спільне з людиною доведення оцінок для систем взаємодіючих частинок (незалежних множин);
  • автономне розв’язання чотирьох задач зі списку Ердеша, одна з яких раніше вважалася нерозв’язаною.

У DeepMind підкреслили, що успіх Aletheia підтверджує актуальність законів масштабування: у доказовій математиці якість і надалі зростає завдяки ефективному застосуванню агентів.

Прорив у медицині

Дочірня компанія DeepMind — Isomorphic Labs — презентувала рушій IsoDDE для розробки лікарських засобів. У важких тестах новинка вдвічі перевершила AlphaFold 3 за точністю передбачень.

Остання стала важливим проривом, тому що змогла передбачати тривимірні структури білків та їхню взаємодію з молекулами. IsoDDE натомість демонструє абсолютно новий рівень:

  • модель прогнозує силу зв’язування (афінність) точніше за традиційні методи;
  • рушій може знаходити приховані структури («кишені») білків, у яких може зв’язуватися препарат;
  • підтримується широкий спектр складних молекул, зокрема антитіла та великі біологічні структури.

«IsoDDE пропонує масштабовану основу для ШІ-дизайну ліків, надаючи точність передбачень, необхідну для роботи з новими біологічними системами з безпрецедентною достовірністю», — зазначено в блозі компанії.

Нагадаємо, у січні медики позитивно відгукнулися на запуск ChatGPT Health для консультацій з питань здоров’я.

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *