Hanya sebuah pemikiran: mungkin "bitstream" lebih menangkap esensi daripada "token" ketika kita berbicara tentang arsitektur AI. Dan inilah masalahnya - mengapa kita masih terobsesi dengan jumlah parameter? Kendala nyata ada tepat di depan kita: kapasitas memori, batasan bandwidth, dan operasi komputasi. Ukuran file memberi tahu Anda lebih banyak tentang apa yang sebenarnya dapat dilakukan. Kita seharusnya mengukur model AI berdasarkan apa yang secara fisik membatasi mereka, bukan angka abstrak yang terlihat mengesankan di atas kertas.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
12 Suka
Hadiah
12
5
Posting ulang
Bagikan
Komentar
0/400
BanklessAtHeart
· 4jam yang lalu
Lompat pikiran begitu cepat, terjebak.
Lihat AsliBalas0
DataPickledFish
· 11jam yang lalu
Hardware bull adalah bull sejati!
Lihat AsliBalas0
AirdropLicker
· 11jam yang lalu
Ukuran file adalah yang terpenting~
Lihat AsliBalas0
HallucinationGrower
· 11jam yang lalu
Sebuah parameter model ditambah setumpuk air saja.
Lihat AsliBalas0
ZKProofster
· 11jam yang lalu
secara teknis, ukuran != kemampuan... ini hanya teori informasi dasar smh
Hanya sebuah pemikiran: mungkin "bitstream" lebih menangkap esensi daripada "token" ketika kita berbicara tentang arsitektur AI. Dan inilah masalahnya - mengapa kita masih terobsesi dengan jumlah parameter? Kendala nyata ada tepat di depan kita: kapasitas memori, batasan bandwidth, dan operasi komputasi. Ukuran file memberi tahu Anda lebih banyak tentang apa yang sebenarnya dapat dilakukan. Kita seharusnya mengukur model AI berdasarkan apa yang secara fisik membatasi mereka, bukan angka abstrak yang terlihat mengesankan di atas kertas.