Wah, Grok 4 baru saja mengklaim tahta di papan peringkat GPQA Diamond. Kita sedang berbicara tentang menghancurkan setiap model AI lainnya ketika datang ke pertanyaan sains yang paling sulit yang bisa Anda berikan.
Ini bukanlah peningkatan kecil—ini adalah model yang menangani masalah yang membuat PhD berkeringat. Ujian GPQA Diamond dirancang secara khusus untuk sangat sulit, jenis hal yang memerlukan pemikiran mendalam di berbagai domain ilmiah. Dan Grok 4? Langsung ke nomor satu.
Apa yang membuat ini sangat menarik adalah seberapa cepat model-model ini beriterasi. Beberapa bulan yang lalu, kami merayakan berbagai tolok ukur, dan sekarang standar terus bergerak. Implikasi untuk penelitian, komputasi ilmiah, dan ya, bahkan optimisasi infrastruktur blockchain? Cukup besar ketika Anda memikirkan tentang kekuatan komputasi dan kemampuan pemecahan masalah yang kita buka di sini.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
16 Suka
Hadiah
16
7
Posting ulang
Bagikan
Komentar
0/400
GameFiCritic
· 7jam yang lalu
Data adalah raja! Grok sudah menduduki peringkat teratas, a16z akan gila
Lihat AsliBalas0
failed_dev_successful_ape
· 14jam yang lalu
Lebih cepat dari otak saya sendiri
Lihat AsliBalas0
ShortingEnthusiast
· 14jam yang lalu
Penerus yang lebih baik juga tidak ada yang bisa mengalahkan.
Lihat AsliBalas0
LiquidationSurvivor
· 14jam yang lalu
Tidak ada yang keren, kecepatan Grok ini di web3 di on-chain mungkin akan meledak.
Lihat AsliBalas0
airdrop_whisperer
· 14jam yang lalu
Katak sapi, GPT benar-benar semakin tidak masuk akal
Wah, Grok 4 baru saja mengklaim tahta di papan peringkat GPQA Diamond. Kita sedang berbicara tentang menghancurkan setiap model AI lainnya ketika datang ke pertanyaan sains yang paling sulit yang bisa Anda berikan.
Ini bukanlah peningkatan kecil—ini adalah model yang menangani masalah yang membuat PhD berkeringat. Ujian GPQA Diamond dirancang secara khusus untuk sangat sulit, jenis hal yang memerlukan pemikiran mendalam di berbagai domain ilmiah. Dan Grok 4? Langsung ke nomor satu.
Apa yang membuat ini sangat menarik adalah seberapa cepat model-model ini beriterasi. Beberapa bulan yang lalu, kami merayakan berbagai tolok ukur, dan sekarang standar terus bergerak. Implikasi untuk penelitian, komputasi ilmiah, dan ya, bahkan optimisasi infrastruktur blockchain? Cukup besar ketika Anda memikirkan tentang kekuatan komputasi dan kemampuan pemecahan masalah yang kita buka di sini.