2025-12-23 12:24:37

Конкуренція між великими мовними моделями дійсно досягла апогею. Судячи з прогресу за останні кілька місяців, GLM-4.7 демонструє досить сильні результати в завданнях, пов'язаних з агентами — будь то виклик інструментів, веб-сканування або математичне мислення, він показує чималі переваги. Проте в здатності до програмної інженерії (стандарт SWE-bench) та точності командного рядка Claude та GPT все ще залишаються на провідних позиціях.

Цікаво, що ці моделі демонструють ще більш помітні відмінності в крипто-додатках. Кожна компанія підкреслює свою здатність до аналізу даних на блокчейні, аудиту смарт-контрактів та взаємодії з DeFi, але фактичні результати все ще залежать від завдання. Особливо при обробці складних багатоступеневих операцій та генерації коду на інженерному рівні, різниця в можливостях між різними моделями може бути досить великою.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

10 лайків

Нагородити
10
4
Репост
Поділіться

Прокоментувати

0/400

GhostWalletSleuth

· 2025-12-24 19:36

GLM останнім часом дійсно потужний, але кажучи чесно, ці моделі на ланцюгу дійсно мають обмежені застосування... Просто хвалитися тим, наскільки добре вони підходять для DeFi, без реальних аудиторських результатів — це нічого не варте.

Переглянути оригіналвідповісти на0

EternalMiner

· 2025-12-23 12:55

Ха-ха, GLM дійсно має щось, але в шифрувальному колі все ще потрібно дивитися, хто насправді зможе впоратися з у блокчейні складними операціями, просто базікати не допоможе. --- Чесно кажучи, результати цих кількох моделей у сценах Децентралізовані фінанси різні, іноді здається, що всі просто хвалять один одного. --- Яка користь від потужних Agent завдань, якщо не можна стабільно викликати смартконтракти, тут дійсно велика різниця. --- GLM-4.7 виглядає непогано, але я все ж чекаю, чи можна буде дійсно використовувати його для аудиту смартконтрактів, зараз все занадто ідеалістично. --- У web3 додатках кожен хвалить себе, але хто насправді кращий, адже потрібно провести реальні тести у блокчейні. --- Різниця в інженерному коді така велика, як можна очікувати, що модель зможе написати надійний контракт? Трохи турбує. --- Це ж просто у кожного свої сильні сторони, потрібно вибирати інструменти залежно від сцени, не потрібно намагатися розділити на перше, друге і третє.

Переглянути оригіналвідповісти на0

RektCoaster

· 2025-12-23 12:46

GLM ця хвиля справді має щось, секція Agent дійсно може вразити. Проте на swe-bench все ж треба дивитися на Claude і GPT, різниця все ще є. У блокчейні кожен хвалить себе, хто спробує, той і дізнається...Аудит DeFi контрактів все ж вимагає більше моделей для перехресної перевірки, одна модель не зможе впоратися з цією справою.

Переглянути оригіналвідповісти на0

PriceOracleFairy

· 2025-12-23 12:34

glm швидко наздоганяє агентські завдання, але лол... давайте будемо відвертими, коли мова йде про фактичне виконання арбітражу в ланцюгу та аудит контрактів? я все ще довіряю клауду зі своїми сухими запасами. агентська гнучкість нічого не означає, якщо ти не можеш спіймати 2-секундне mev-вікно без галюцинацій calldata 🤔

Переглянути оригіналвідповісти на0