Google показала “двійника Криса Гедіша” для пришвидшення нейромережевих розрахунків

Дослідницький відділ Google анонсував TurboQuant — алгоритм для компресії пам’яті для штучного інтелекту. Користувачі мережі зіставили цю розробку з технологією компанії Pied Piper з телесеріалу “Силіконова долина”.

TurboQuant суттєво зменшує потреби в ресурсах для функціонування великих мовних моделей та систем векторного пошуку.

ШІ працює зі складними багатовимірними масивами, які зберігають відомості про слова або зображення. Ці відомості займають значний обсяг у кеші та уповільнюють створення відповідей. Стандартні підходи до стиснення потребують зберігання додаткових параметрів, що часто зводить нанівець позитивний ефект від оптимізації.

TurboQuant розв’язує питання надмірного використання пам’яті за допомогою двох механізмів. Перший алгоритм конвертує вектори в полярну систему координат та компресує основний обсяг інформації. Другий діє як математичний регулятор, використовуючи лише один біт пам’яті для нівелювання залишкових прихованих похибок.

Генеральний директор Cloudflare Меттью Прінс порівняв алгоритм із здобутками китайської моделі DeepSeek, яка раніше продемонструвала високу результативність при мінімальних витратах на апаратуру.

Розробники протестували технологію на відкритих моделях Llama, Gemma та Mistral. Алгоритм стиснув кеш до трьох біт без погіршення якості відповідей. Витрата пам’яті зменшилася щонайменше у шість разів, а швидкість обчислень на графічних прискорювачах H100 зросла у вісім разів.

Інновація не потребує додаткового навчання нейромереж. За заявою корпорації, технологію впровадять у пошукові алгоритми та власні ШІ-продукти, зокрема Gemini. Офіційна презентація проєкту пройде на тематичних конференціях ICLR та AISTATS у 2026 році.

Слід згадати, 25 березня Google оголосила про свої наміри щодо переходу на постквантову криптографію.

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *