DeepSeek发布多模态推理报告“thinking with visual primitives”，提出推理时直接将坐标嵌入推理链，像用手指点物般锁定每个视觉对象。以边界框/点坐标为最小推理单元，缓解指代鸿沟。基于v4-flash架构，极端压缩视觉token，在拓扑推理与迷宫导航等任务中领先。 GitHub开源，MIT许可。

CoinNetwork

2026-04-30 23:50:34

Генерация тезисов в процессе

Китайский сайт CoinWorld сообщает, что DeepSeek опубликовала технический отчет о мультимодальном выводе «thinking with visual primitives», предложив новый парадигмальный подход к рассуждению: модель при размышлении, как человек, использует указание пальцем, прямо вставляя координаты в цепочку мышления, чтобы зафиксировать каждый визуальный объект, участвующий в процессе. Этот проект открыт на GitHub под лицензией MIT. Одним из ключевых узких мест современных мультимодальных моделей является «пропасть указаний»: модель хорошо видит изображение, но при выводе может использовать только естественный язык для описания визуальных объектов, что затрудняет локализацию в сложных сценах. DeepSeek решает эту проблему, превращая рамки границ и координаты точек в минимальные единицы рассуждения. Модель основана на архитектуре v4-flash, с экстремальным сжатием визуальных токенов, и результаты тестирования показывают отличные показатели на нескольких бенчмарках, особенно в топологическом рассуждении и навигации по лабиринтам, значительно превосходя другие модели.

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
WCTCTradingKingPK
471.76K Популярность
#
USSeeksStrategicBitcoinReserve
58.71M Популярность
#
IsraelStrikesIranBTCPlunges
37.67K Популярность
#
BitcoinETFOptionLimitQuadruples
999.74K Популярность
#
#FedHoldsRateButDividesDeepen
31.64K Популярность

Закрепить

Карта сайта

DeepSeek多模态技术报告：教模型「用手指点着想」，迷宫导航超GPT-5.4近17个百分点

Популярные темы

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

Закрепить