Лише думка: можливо, "бітстрім" краще передає суть, ніж "токен", коли ми говоримо про архітектуру ШІ. І ось у чому справа - чому ми досі одержимі кількістю параметрів? Справжні вузькі місця знаходяться прямо перед нами: обсяг пам'яті, обмеження пропускної здатності та обчислювальні операції. Розмір файлу говорить вам набагато більше про те, що насправді можливо. Ми повинні оцінювати моделі ШІ за тим, що фізично їх обмежує, а не за якимись абстрактними числами, які виглядають вражаюче на папері.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
19 лайків
Нагородити
19
6
Репост
Поділіться
Прокоментувати
0/400
BearMarketLightning
· 11-09 07:02
Ця модельна межа зачепила моє серце.
Переглянути оригіналвідповісти на0
BanklessAtHeart
· 11-06 17:22
Думки стрибають так швидко, що я заплутався.
Переглянути оригіналвідповісти на0
DataPickledFish
· 11-06 10:09
Тверді бики справжні бики!
Переглянути оригіналвідповісти на0
AirdropLicker
· 11-06 10:07
Розмір файлу — це справжня цінність~
Переглянути оригіналвідповісти на0
HallucinationGrower
· 11-06 09:57
Це всього лише модельний параметр плюс купа води.
Переглянути оригіналвідповісти на0
ZKProofster
· 11-06 09:50
технічно кажучи, розмір != можливість... це просто базова інформаційна теорія смх
Лише думка: можливо, "бітстрім" краще передає суть, ніж "токен", коли ми говоримо про архітектуру ШІ. І ось у чому справа - чому ми досі одержимі кількістю параметрів? Справжні вузькі місця знаходяться прямо перед нами: обсяг пам'яті, обмеження пропускної здатності та обчислювальні операції. Розмір файлу говорить вам набагато більше про те, що насправді можливо. Ми повинні оцінювати моделі ШІ за тим, що фізично їх обмежує, а не за якимись абстрактними числами, які виглядають вражаюче на папері.