Berdasarkan pemantauan 1M AI News, Microsoft secara bersamaan membuka dua kemampuan baru Microsoft 365 Copilot melalui Frontier (program pratinjau untuk pengguna bisnis; peserta dapat mencoba lebih dulu fitur Copilot yang belum dirilis secara resmi).
Peneliti (Agent riset mendalam bawaan Copilot) menambahkan dua jenis mode kolaborasi multi-model: Critique dan Council. Critique bekerja sama antara model milik Anthropic dan OpenAI: satu bertugas merencanakan, melakukan penelusuran, dan menyusun draf, sementara yang lain khusus meninjau dan menghaluskan; saat Auto dipilih, mode ini diaktifkan secara default. Council juga menjalankan dua model secara paralel; masing-masing menghasilkan laporan lengkap, lalu model penilai terpisah mengompilasi persamaan dan perbedaannya. Microsoft menggunakan GPT-5.2 sebagai model penilai (salah satu dari tiga metode penilaian dalam makalah asli yang paling ketat) untuk menguji Critique pada benchmark DRACO (100 soal riset kompleks yang dirilis oleh peneliti Perplexity, mencakup 10 bidang). Skor gabungan lebih tinggi 7,0 poin dibanding sistem terbaik pada benchmark, yaitu Perplexity Deep Research (menggunakan Claude Opus 4.6), atau peningkatan relatif sebesar 13,88%. Makalah asli DRACO tidak memasukkan Critique; ini adalah data yang diuji sendiri oleh Microsoft menggunakan protokol evaluasi yang sama.
Copilot Cowork ditujukan untuk pekerjaan multi-langkah yang lebih panjang: mula-mula menghasilkan rencana berdasarkan tujuan, lalu mendorong langkah demi langkah lintas alat dan file, sambil menampilkan progres; pengguna dapat ikut campur kapan saja. Microsoft menjadikan Capital Group sebagai contoh uji coba awal, dan menyatakan bahwa fitur tersebut telah digunakan untuk perencanaan proyek, penjadwalan, pembuatan materi serah terima, serta menyiapkan tinjauan ulang untuk para eksekutif.