Menurut Beating, Microsoft baru-baru ini merilis kode sumber terbuka keluarga model Phi-Ground, yang dirancang untuk memecahkan masalah ke mana AI harus mengklik pada layar komputer. Versi 4 miliar parameter, dipasangkan dengan model bahasa yang lebih besar untuk perencanaan instruksi, melampaui akurasi klik OpenAI Operator dan Claude Computer Use dalam benchmark Showdown serta menempati peringkat pertama di antara semua model dengan parameter di bawah 100 miliar pada lima evaluasi, termasuk ScreenSpot-Pro.
Tim melatih menggunakan lebih dari 40 juta sampel data dan menemukan bahwa tiga teknik pelatihan umum yang digunakan dalam paper akademik menjadi tidak efektif saat diskalakan. Pendekatan utamanya terbukti sederhana: keluarkan koordinat sebagai bilangan biasa, seperti “523, 417.” Penelitian sebelumnya menciptakan kosakata posisi khusus untuk koordinat, tetapi itu gagal untuk diskalakan. Tim juga menemukan bahwa menempatkan instruksi teks sebelum gambar meningkatkan kinerja, karena model dapat mengidentifikasi target saat memproses piksel. Selain itu, metode reinforcement learning seperti DPO meningkatkan akurasi bahkan setelah fine-tuning.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Cerebras Menaikkan Kisaran Harga IPO menjadi $150–$160 per Saham pada Senin, Naik 30%
Menurut Bloomberg, Cerebras Systems sedang mempertimbangkan untuk menaikkan kisaran harga IPO-nya menjadi $150–$160 per saham pada Senin (12 Mei), dari $115–$125, di tengah lonjakan permintaan. Produsen chip AI itu berencana meningkatkan penerbitan saham dari 28 juta menjadi 30 juta saham, yang berpotensi mengumpulkan sekitar $4,8 miliar dibanding target awal $3,5 miliar. Pesanan langganan telah melampaui jumlah saham yang tersedia lebih dari 20 kali, dengan harga final dijadwalkan pada 13 Mei.
GateNews41menit yang lalu
Risiko Geopolitik Mendominasi Survei Musim Semi 2026 Federal Reserve, AI Naik ke Urutan Ketiga
Menurut survei Federal Reserve yang dilakukan pada musim semi 2026, responden menempatkan risiko geopolitik sebagai perhatian utama, naik satu peringkat dari survei musim gugur 2025. Kecerdasan buatan naik ke peringkat ketiga dari kelima, sementara kredit swasta melesat ke peringkat keempat dari kesembilan. Inflasi dan pengetatan moneter turun ke peringkat kelima dari peringkat ketiga, mencerminkan pergeseran dalam persepsi risiko ekonomi di antara para peserta survei.
GateNews3jam yang lalu
Google Meluncurkan Protokol Pembayaran Agen AI dengan 120+ Mitra Termasuk PayPal
Menurut CoinDesk, para eksekutif Google Cloud dan PayPal membahas bagaimana pembayaran kripto akan menjadi fondasi bagi perdagangan yang digerakkan AI Agent. Pimpinan strategi Web3 Google Cloud, Richard Widmann, mengumumkan bahwa Google telah meluncurkan Agentic Payments Protocol (AP2), berdonasi ke FIDO Foundation, dengan lebih dari 120 mitra termasuk PayPal yang kini turut berpartisipasi. Widmann mencatat bahwa AI Agents tidak bisa membuka rekening bank tradisional karena kendala teknis dan re
GateNews9jam yang lalu
Kasus penyelesaian Apple senilai 250 juta dolar AS atas iklan AI iPhone yang menyesatkan: kompensasi hingga 95 dolar AS per perangkat
Apple setuju membayar 250 juta dolar AS untuk menyelesaikan gugatan class action yang menuduh perusahaan tersebut melebih-lebihkan fitur AI “Apple Intelligence” di iPhone. Ringkasan Top Class Actions: Para penggugat berpendapat Apple dalam kampanye pemasaran iPhone 16 dan beberapa model iPhone 15 secara tersirat menyatakan bahwa fitur AI (termasuk Siri yang ditingkatkan secara signifikan) sudah akan tersedia saat perangkat diluncurkan, namun kenyataannya peluncuran fitur tersebut ditunda. Penggu
ChainNewsAbmedia9jam yang lalu
Alphabet dalam setahun naik 160%, kapitalisasi pasar sempat melampaui Nvidia pasca penutupan: menguangkan nilai dari “tumpukan AI” lengkap
Harga saham Alphabet(GOOGL)dalam setahun terakhir naik sekitar 160%. Setelah laporan keuangan kuartal 1 2026, analis mengaitkan lonjakan itu dengan posisi kompetitif Google dalam “tumpukan AI” secara lengkap (full stack). CNBC merangkum: pendapatan gabungan Alphabet pada Q1 naik 22% year-on-year menjadi 109,9 miliar dolar AS, dan laba bersih melonjak 81% menjadi 62,6 miliar dolar AS; pendapatan Google Cloud naik 63% year-on-year menjadi 20 miliar dolar AS, dan untuk pertama kalinya menembus amba
ChainNewsAbmedia9jam yang lalu
Investasi Ekuitas Nvidia Melebihi 400 Miliar Dolar AS pada 2026, Memperluas Ekosistem AI
Menurut Gelonghui, investasi ekuitas Nvidia telah melampaui 400 miliar dolar AS pada tahun 2026 per 9 Mei. Investasi tersebut mencakup perusahaan hulu dan hilir di seluruh sektor AI, membentuk ekosistem terpadu dari manufaktur chip hingga pengembangan model AI. Pengamat industri mencatat bahwa strategi investasi ini memungkinkan Nvidia mengamankan klien di hilir sekaligus memperkuat pipeline permintaan perangkat kerasnya.
GateNews10jam yang lalu