
Корпорація Google DeepMind представила ШІ-модель Lyria 3, призначену для створення музики. Компанія інтегрувала її до чат-бота Gemini.
Ця нейронна мережа дозволяє формувати аудіо на основі текстових запитів, світлин або відеоматеріалів.
«Достатньо описати концепцію або завантажити зображення, наприклад: “забавний неквапливий R&B‑хіт про шкарпетку, яка відшукала свою пару”, — і всього за декілька секунд Gemini трансформує це у високоякісну та незабутню мелодію», — зазначено в повідомленні.
У порівнянні з попередніми варіаціями, в Lyria 3 покращили три ключові області:
- нема потреби у створенні власного тексту — LLM згенерує його, спираючись на запит;
- можливість творчого контролю над стилем, вокалом і темпом;
- здатність створювати реалістичні й музично складні композиції.
Gemini генерує 30‑секундне аудіо з індивідуальною обкладинкою, розробленою Nano Banana. Отриманим результатом можна поділитися з приятелями.
«Завдання полягає не в творенні музичного шедевру, а в наданні цікавого й унікального засобу для самовираження», — підкреслили в Google.
Модель підтримує англійську, німецьку, іспанську, французьку, гінді, японську, корейську та португальську мови. Спочатку запуск відбувся на настільних комп’ютерах, мобільна версія з’явиться найближчими днями. Абоненти Google AI Plus, Pro та Ultra отримають збільшені ліміти.
Ідентифікація ШІ
Створення музики за допомогою ШІ стає все більш поширеним явищем. Стрімінговий сервіс Deezer, який має 9,7 млн платних користувачів, зафіксував понад 50 000 ШІ‑треків, що завантажуються щодня, — приблизно третину від сукупного показника.
При цьому, 97% слухачів не здатні розрізнити пісні, згенеровані ШІ, від тих, що написані людьми.
Усі композиції, створені Lyria 3, мають вбудовану позначку SynthID — непомітний цифровий водяний знак для визначення ШІ‑контенту.
Нагадаємо, дані звіту за четвертий квартал 2025 року вказують на те, що обсяг щомісячних активних користувачів (MAU) чат-бота Gemini від Google перевищив 750 млн.
