Peneliti Microsoft unggul di atas standar pengujian Perplexity buatan sendiri: peninjauan model ganda masuk ke Frontier, Cowork secara bersamaan membuka proxy tugas panjang

BlockBeatNews

Berdasarkan pemantauan 1M AI News, Microsoft secara bersamaan membuka dua kemampuan baru Microsoft 365 Copilot melalui Frontier (program pratinjau untuk pengguna bisnis; peserta dapat mencoba lebih dulu fitur Copilot yang belum dirilis secara resmi).

Peneliti (Agent riset mendalam bawaan Copilot) menambahkan dua jenis mode kolaborasi multi-model: Critique dan Council. Critique bekerja sama antara model milik Anthropic dan OpenAI: satu bertugas merencanakan, melakukan penelusuran, dan menyusun draf, sementara yang lain khusus meninjau dan menghaluskan; saat Auto dipilih, mode ini diaktifkan secara default. Council juga menjalankan dua model secara paralel; masing-masing menghasilkan laporan lengkap, lalu model penilai terpisah mengompilasi persamaan dan perbedaannya. Microsoft menggunakan GPT-5.2 sebagai model penilai (salah satu dari tiga metode penilaian dalam makalah asli yang paling ketat) untuk menguji Critique pada benchmark DRACO (100 soal riset kompleks yang dirilis oleh peneliti Perplexity, mencakup 10 bidang). Skor gabungan lebih tinggi 7,0 poin dibanding sistem terbaik pada benchmark, yaitu Perplexity Deep Research (menggunakan Claude Opus 4.6), atau peningkatan relatif sebesar 13,88%. Makalah asli DRACO tidak memasukkan Critique; ini adalah data yang diuji sendiri oleh Microsoft menggunakan protokol evaluasi yang sama.

Copilot Cowork ditujukan untuk pekerjaan multi-langkah yang lebih panjang: mula-mula menghasilkan rencana berdasarkan tujuan, lalu mendorong langkah demi langkah lintas alat dan file, sambil menampilkan progres; pengguna dapat ikut campur kapan saja. Microsoft menjadikan Capital Group sebagai contoh uji coba awal, dan menyatakan bahwa fitur tersebut telah digunakan untuk perencanaan proyek, penjadwalan, pembuatan materi serah terima, serta menyiapkan tinjauan ulang untuk para eksekutif.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar