Google Cloud представляє модель Gemini 3.2 Flash Lite з витратами на інференс на 95% нижчими, ніж у GPT-5.5

За моніторингом Beating.AI, нова опція моделі під назвою gemini-3.2-flash-lite-live-preview з’явилася в списку вибору моделей у Google Cloud станом на 17 травня. Суфікси «lite» і «live» вказують, що Google створює спеціалізовану версію, оптимізовану під наднизьку затримку для взаємодій у режимі реального часу.

Генеральний директор Abacus.AI Бінду Редді раніше повідомляла, що Gemini 3.2 Flash досягає 92% можливостей кодування та міркувань GPT-5.5, зберігаючи при цьому вартість інференсу лише на рівні 1/20 вартості GPT-5.5, а більшість запитів отримує відповіді швидше ніж за 200 мілісекунд. Представники галузі очікують, що цю оптимізовану за витратами полегшену модель офіційно представлять на Google I/O 20 травня.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів