Google представила новый алгоритм TurboQuant: может сжать требования памяти AI в 6 раз, акции производителей памяти упали в цене

動區BlockTempo

Google выпустила алгоритм сжатия TurboQuant, не требующий обучения, заявляя, что он способен уменьшить потребность в памяти AI как минимум в 6 раз; после объявления акции памяти резко упали, но аналитики имеют разные мнения.
(Предыстория: Google планирует завершить миграцию на квантовую криптографию к 2029 году, что на шесть лет раньше правительственной цели, индустрия шифрования должна поспевать)
(Дополнительный фон: Wall Street Journal: Трамп планирует назначить Зукерберга, Хуана Хуана и Элисона в PCAST для создания «национальной команды AI США»)

Новый алгоритм вызвал крах акций памяти? Google Research 25 числа официально представила алгоритм сжатия TurboQuant, утверждая, что он может квантовать KV-кэш больших языковых моделей (LLM) до всего 3 бит, при этом полностью сохраняя точность модели и уменьшая использование памяти как минимум в 6 раз.

После новости акции гигантов памяти резко упали: Micron в течение торгового дня упала на 6.1%, закрывшись на 382.09 долларов — минимум за три недели. Также Sandisk упала на 3.5%, Seagate — на 2.59%, Western Digital — на 1.63%, что привело к полном краху сектора памяти.

Азиатские рынки сегодня также испытывают давление: Samsung Electronics открылась с падением на 3.6%, SK Hynix — на 4.5%. Инвесторы делают логичный вывод: если AI-модели больше не требуют столько памяти, то мощное ценовое влияние, поддерживаемое дефицитом компонентов, может рухнуть.

Анализ технологии TurboQuant: двухэтапное устранение ошибок, скорость в 8 раз выше

KV-кэш (Key-Value Cache) — это ключевой механизм, позволяющий LLM «запоминать» уже обработанные данные, сохраняя ранее вычисленные данные внимания, что позволяет модели при генерации каждого токена не пересчитывать всё заново. Но по мере расширения контекстного окна KV-кэш становится серьёзным узким местом по памяти.

TurboQuant нацелен именно на эту проблему. Google отмечает, что традиционные методы векторного квантования создают дополнительные расходы в 1-2 бита на каждое число в памяти, а TurboQuant устраняет эту нагрузку через двухэтапный процесс:

Первый этап — использование метода PolarQuant для вращения векторных данных, обеспечивая высококачественное сжатие.

Второй этап — применение квантованного алгоритма Johnson-Lindenstrauss для устранения остаточных ошибок.

В бенчмарках на GPU Nvidia H100, 4-битный TurboQuant показывает в 8 раз более высокую эффективность при вычислении внимания по сравнению с неквантованными 32-битными ключами, а использование памяти KV-кэша сокращается как минимум в 6 раз.

Что важнее, этот алгоритм не требует обучения или тонкой настройки, его выполнение очень мало нагружает систему, что делает его подходящим для внедрения в реальные системы инференса и масштабных поисковых систем по векторам. Официально заявлено, что статья по данной технологии будет опубликована на конференции ICLR 2026 в апреле.

Парадокс Джевонса: потребность в памяти может даже возрасти?

Однако не все разделяют мнение о «конце памяти».

Некоторые аналитики приводят парадокс Джевонса: когда технологии снижают издержки ресурсов, доступность ресурсов способствует росту их общего спроса. Поддерживающие считают, что если TurboQuant действительно значительно снизит порог входа в AI, это ускорит распространение моделей, что в конечном итоге приведёт к увеличению спроса на память, а не к его сокращению.

Аналитик Lynx Equity Strategies прямо заявил: «Методы, описанные Google, в ближайшие 3-5 лет практически не снизят спрос на память и флеш-память, поскольку предложение всё ещё крайне ограничено». Поэтому организация сохраняет целевую цену для Micron на уровне 700 долларов.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев