Google Cloud представляє модель Gemini 3.2 Flash Lite з витратами на інференс на 95% нижчими, ніж у GPT-5.5

2026-05-17 02:37:23

За моніторингом Beating.AI, нова опція моделі під назвою gemini-3.2-flash-lite-live-preview з’явилася в списку вибору моделей у Google Cloud станом на 17 травня. Суфікси «lite» і «live» вказують, що Google створює спеціалізовану версію, оптимізовану під наднизьку затримку для взаємодій у режимі реального часу.

Генеральний директор Abacus.AI Бінду Редді раніше повідомляла, що Gemini 3.2 Flash досягає 92% можливостей кодування та міркувань GPT-5.5, зберігаючи при цьому вартість інференсу лише на рівні 1/20 вартості GPT-5.5, а більшість запитів отримує відповіді швидше ніж за 200 мілісекунд. Представники галузі очікують, що цю оптимізовану за витратами полегшену модель офіційно представлять на Google I/O 20 травня.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

05-17 01:29

Claude Mythos прибирає тег прев’ю з консолі Google Cloud 17 травня

05-16 06:28

Grok-4.20 і GPT 5.4 Pro поділили перше місце за найвищими результатами тесту Mensa на IQ — 145 балів

05-14 10:49

Утечка про 24-годинного агента Google Gemini Spark сталася сьогодні; може виконувати покупки без підтвердження користувача

05-14 06:25

Google запустить Gemini 3.2 Flash на I/O 20 травня, досягнувши продуктивності, як у GPT-5.5, але за 1/15 вартості

05-12 20:41

Google представляє Gemini Intelligence для Android, запуск на Galaxy S26 і Pixel 10 цього літа

Поглиблений аналіз