Grok 4.1 dari xAI meningkatkan standar kinerja model berbasis RAG di berbagai domain. Tolok ukur terbaru menceritakan sebuah cerita—ketika Anda menghadapi tugas pemrograman, Grok mencetak 86, mengambil posisi teratas. Di aplikasi spesifik keuangan, ia mendorong lebih keras dengan skor 93.0, menetapkan keunggulan kompetitif yang jelas. Dalam analisis hukum, ia mempertahankan posisinya melawan alternatif utama.



Apa yang membuat ini sangat relevan adalah bagaimana angka-angka ini diterjemahkan ke dalam penggunaan dunia nyata. Dokumen yang kompleks dan panjang—jenis yang biasanya menantang sebagian besar sistem—tampaknya ditangani dengan konsistensi yang terukur. Ini memposisikan Grok bukan hanya sebagai pemain lain di ruang AI, tetapi sebagai pilihan yang berarti bagi pengguna yang membutuhkan kinerja yang dapat diandalkan saat menangani beban informasi yang rumit.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 3
  • Posting ulang
  • Bagikan
Komentar
0/400
MoneyBurnerSocietyvip
· 12-23 07:44
Keuangan 93.0...angka kegagalan algoritme arbitrase saya juga sama, hanya saja arahnya berlawanan. Grok benar-benar luar biasa, kontrak pintar saya tidak ada bandingannya.
Lihat AsliBalas0
MEVvictimvip
· 12-23 07:40
Skor 93.0? Ini skor agak gila, harus dicoba apakah benar bisa digunakan Saya percaya pada performa Grok di dokumen yang kompleks, tapi takutnya ini hanya data di atas kertas Encoding 86 pertama... Namun semua benchmark ini tidak nyata, bagaimana dalam praktiknya yang penting Apakah bidang hukum juga bisa bersaing? Rasanya kali ini xAI datang dengan serius Angka yang bagus memang bagus, tapi masalahnya apakah bisa menangani dokumen panjang dengan stabil, ini yang kuncinya Model RAG sekarang sudah sangat kompetitif, siapa sebenarnya alat produktivitas yang sejati?
Lihat AsliBalas0
SnapshotStrikervip
· 12-23 07:37
Skor 93 untuk finansial? Angka ini agak keras, tetapi seberapa jauh ini bisa digunakan tergantung... --- Pengkodean 86 pertama, finansial 93... data di atas kertas selalu terlihat bagus, masalah sebenarnya adalah apakah ini dapat berjalan dengan stabil --- Kemampuan pemrosesan file besar memang menyentuh titik sakit, tetapi apakah Grok benar-benar bisa melakukan ini masih harus dicoba --- Sekumpulan angka benchmark datang, tetapi saya hanya ingin tahu apakah alat ini bisa menggantikan alat yang saya gunakan sekarang --- Skor 93 untuk aplikasi finansial terdengar hebat, tetapi sektor finansial memiliki hambatan tinggi, stabilitas jauh lebih penting daripada skor --- Oh jadi maksudnya Grok memiliki kemampuan dalam menangani file kompleks, tetapi seberapa murah harganya? --- Pengkodean, finansial, hukum semuanya datang? Apakah ini ingin serba bisa atau hanya bisa sedikit setiap bidang?
Lihat AsliBalas0
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)