Велика обнова Chrome: Gemini на бічній панелі, Nano Banana і “Особистий інтелект”

Google впроваджує в браузер Chrome свіжі ШІ-інструменти на основі Gemini. Головні нововведення — творець зображень Nano Banana, «Персональний інтелект» та «Автоперегляд».

Інтеграція в інтерфейс

ШІ-помічник, доданий у вересні 2025 року як спливаюче віконце, зараз зафіксований у бічній панелі. Користувач може ставити питання про вебсайт, котрий він розглядає, або інші відкриті розділи.

Серед покращень — розбір декількох вкладок як єдиного цілого. Коли користувач відкриває різні сторінки одного ресурсу, цифровий асистент сприймає їх не окремо, а як єдину контекстну групу.

Раніше Gemini в Chrome був доступний тільки користувачам Windows та macOS. Після оновлення він відкритий і для власників Chromebook Plus.

Personal Intelligence

Корпорація застосовує нещодавно запущену функцію Personal Intelligence, що під’єднується до акаунтів Gmail, Search, YouTube і Google Photos та дає можливість ставити питання з урахуванням особистих даних. Функціональність з’явиться протягом найближчих місяців.

Nano Banana

Інструмент дозволяє обробляти та змінювати зображення, використовуючи як зразки інші картинки, віднайдені в мережі інтернет.

«Автоперегляд»

ШІ-агент здатний самостійно виконувати завдання: переходити за гіперпосиланнями, робити покупки або шукати дисконтні купони. Він попросить втрутитися в разі потреби оперувати з конфіденційними відомостями.

Ризики безпеки

ШІ-браузери стають тенденцією в секторі штучного інтелекту, проте несуть значні ризики для користувачів. У грудні 2025 року OpenAI розповіла про наявні уразливості.

Компанія визнала, що атаки типу «ін’єкція промпта» являють собою проблему.

«Подібна вразливість, як і шахрайство та соціальна інженерія в інтернеті, навряд чи колись будуть цілком усунені», — написали представники OpenAI.

Anthropic та Google дотримуються подібної позиції зі ставкою на багаторівневий захист та регулярні стрес-тести.

Agentic Vision у Gemini

Одночасно Google презентувала Agentic Vision — функцію, що дає змогу детальніше досліджувати файли в режимі ШІ-агента.

У компанії пояснили, що LLM нового покоління на зразок Gemini зазвичай опрацьовують інформацію про навколишній світ за один статичний погляд. Якщо вони пропускають незначні деталі на кшталт серійного номера на мікросхемі або віддаленого дорожнього знаку, то «роблять припущення».

Agentic Vision у Gemini 3 Flash перетворює розуміння зображень зі статичної дії на активний процес. Модель поводиться як аналітик-людина:

  • оцінює загальну картину;
  • виокремлює першочергові зони;
  • складає план перевірки гіпотез;
  • детально вивчає дрібні елементи.

У результаті точність розпізнавання зростає на 5–10%.

image

Джерело: Google.

Agentic Vision вводить цикл «думати, діяти, спостерігати» в завдання розуміння зображень:

  • думати — ШІ аналізує запит користувача та початкову ілюстрацію, формуючи багатоетапний план;
  • діяти — модель генерує та виконує код Python для роботи з картинкою (кадрування, поворот);
  • спостерігати — трансформоване зображення додається в контекстне вікно моделі.

image

Джерело: Google.

Gemini 3 Flash навчена збільшувати зображення задля виявлення дрібних деталей.

Бета-версія Agentic Vision доступна безкоштовно в Google AI Studio, Vertex AI, Gemini API для розробників та чат-боті Gemini в режимі Thinking.

Нагадаємо, у грудні 2025 року Google випустила мовну модель Gemini 3 Flash і зробила її стандартною в застосунку Gemini та режимі ШІ в пошуковій системі.

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *