Microsoft Researcher перемогла у власному бенчмарку Perplexity: двомодельна рецензія увійшла у Frontier, Cowork одночасно відкриває довгі завдання-агенти

BlockBeatNews

Згідно з моніторингом 1M AI News, Microsoft через Frontier (програма попереднього доступу для корпоративних користувачів, учасники можуть заздалегідь спробувати функції Copilot, які ще не вийшли офіційно) синхронно відкрила дві нові можливості Microsoft 365 Copilot.

Researcher (вбудований у Copilot Agent для глибоких досліджень) отримав два нові режими взаємодії з кількома моделями: Critique та Council. Critique реалізовано через співпрацю моделей від Anthropic і OpenAI: одна відповідає за планування, пошук і підготовку чернетки, інша — за спеціальну перевірку та вдосконалення; при виборі Auto за замовчуванням увімкнено. Council також паралельно запускає дві моделі: кожна генерує повний звіт, а потім окрема модель для рецензування узагальнює відмінності та збіги. Microsoft використовує GPT-5.2 як модель для оцінювання (найсуворішу з трьох методик оцінювання з оригінальної роботи). На базі DRACO (100 складних дослідницьких завдань, опублікованих дослідниками Perplexity, що охоплюють 10 напрямів) Microsoft тестує Critique: комплексний результат на 7.0 балів вищий за найкращу систему в межах цього бенчмарку — Perplexity Deep Research (із використанням Claude Opus 4.6), що відповідає відносному зростанню на 13.88%. У первинній статті про DRACO Critique не було включено — це дані, які Microsoft отримала під час власного тестування за тією ж оцінною процедурою.

Copilot Cowork орієнтований на довші багатокрокові роботи: спочатку генерує план відповідно до цілі, потім послідовно просувається через інструменти та файли, відображаючи прогрес у процесі; користувач може в будь-який момент втрутитися. Microsoft як приклад раннього випробування наводить Capital Group: там заявляють, що його вже застосовують для планування проєктів, графіків, підготовки матеріалів для здачі та організації підготовки до повторних розборів керівництва.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів