Источник: CryptoNewsNet
Оригинальное название: Открытый ИИ-гамбит Америки: две лаборатории, один вопрос — может ли США конкурировать?
Оригинальная ссылка:
На этой неделе две американские лаборатории искусственного интеллекта выпустили модели с открытым исходным кодом, каждая из которых выбрала кардинально разные подходы к одной и той же проблеме: как конкурировать с доминированием Китая в общедоступных системах ИИ.
Deep Cogito выпустила Cogito v2.1, массивную модель с 671 миллиардами параметров, которую ее основатель, Дришан Арора, называет “лучшей открытой LLM от американской компании.”
Не так быстро, возразил Институт Аллена по искусственному интеллекту, который только что выпустил Olmo 3, позиционируя его как “лучшую полностью открытую базовую модель”. Olmo 3 обладает полной прозрачностью, включая свои тренировочные данные и код.
Иронично, что флагманская модель Deep Cognito построена на китайском основании. Арора признал, что Cogito v2.1 “отделяется от открытой лицензии модели базового Deepseek с ноября 2024 года.”
Это вызвало критику и дебаты о том, считается ли тонкая настройка китайской модели достижением американского ИИ или это просто доказывает, как далеко американские лаборатории отстали.
Тем не менее, преимущества эффективности, которые демонстрирует Cogito по сравнению с DeepSeek, реальны.
Компания Deep Cognito утверждает, что Cogito v2.1 производит цепочки рассуждений на 60% короче, чем DeepSeek R1, при этом поддерживая конкурентоспособную производительность.
Используя то, что Арора называет “Итеративной дистилляцией и усилением” — обучая модели развивать лучшее понимание через циклы самосовершенствования — стартап обучил свою модель всего за 75 дней на инфраструктуре от RunPod и Nebius.
Если эталоны верны, это будет самый мощный открытый LLM, в настоящее время поддерживаемый американской командой.
Почему это важно
На данный момент Китай задает темп в области открытого ИИ, и компании США все больше полагаются—тихо или открыто—на китайские базовые модели, чтобы оставаться конкурентоспособными.
Эта динамика рискованна. Если китайские лаборатории станут стандартной инфраструктурой для открытого ИИ по всему миру, стартапы США потеряют техническую независимость, переговорную силу и возможность формировать отраслевые стандарты.
Открытый ИИ определяет, кто контролирует сырые модели, от которых зависит каждый downstream продукт.
Прямо сейчас китайские открытые модели (DeepSeek, Qwen, Kimi, MiniMax) доминируют в глобальном использовании, потому что они дешевы, быстры, высокоэффективны и постоянно обновляются.
Многие стартапы в США уже строят на них, даже когда публично избегают этого признавать.
Это означает, что американские компании строят бизнес на основе иностранной интеллектуальной собственности, иностранных учебных программ и иностранных аппаратных оптимизаций. Стратегически это ставит Америку в такую же позицию, с которой она столкнулась когда-то в производстве полупроводников: все более зависимой от чей-то цепочки поставок.
Подход Deep Cogito, исходящий от форка DeepSeek, демонстрирует преимущества (быстрой итерации) и недостатки (зависимости).
Подход Института Аллена — создание Olmo 3 с полной прозрачностью — демонстрирует альтернативу: если США хотят открытого лидерства в области ИИ, им необходимо заново построить стек от данных до рецептов обучения и контрольных точек. Это трудоемкий и медленный процесс, но он сохраняет суверенитет над базовой технологией.
В теории, если вам уже понравился DeepSeek и вы используете его онлайн, Cogito в большинстве случаев даст вам лучшие ответы. Если вы используете его через API, вы будете вдвое более довольны, так как вы будете платить меньше денег за получение хороших ответов благодаря его повышенной эффективности.
Институт Аллена выбрал противоположный подход. Вся семья моделей Olmo 3 приходит с Dolma 3, обучающим набором данных из 5,9 триллионов токенов, созданным с нуля, плюс полный код, рецепты и контрольные точки из каждой стадии обучения.
Некоммерческая организация выпустила три модели-варианта — Base, Think и Instruct — с 7 миллиардами и 32 миллиардами параметров.
“Истинная открытость в ИИ заключается не только в доступе — это вопрос доверия, подотчетности и совместного прогресса,” — написало учреждение.
Olmo 3-Think 32B — это первая полностью открытая модель рассуждений такого масштаба, обученная примерно на одной шестой токенов по сравнению с аналогичными моделями, такими как Qwen 3, при этом демонстрируя конкурентоспособные результаты.
Deep Cognito привлек $13 миллионов долларов в виде начального финансирования, возглавляемого Benchmark в августе. Стартап планирует выпустить модели на передовом уровне с количеством параметров до 671 миллиарда, обученные на “значительно большем объеме вычислений с лучшими наборами данных.”
Тем временем Nvidia поддержала разработку Olmo 3, и вице-президент Кари Бриски назвала это необходимым для “разработчиков, чтобы масштабировать ИИ с помощью открытых моделей, созданных в США.”
Институт обучался на GPU-кластерах H100 Google Cloud, достигнув в 2,5 раза меньших вычислительных требований, чем у Meta's Llama 3.1 8B.
Cogito v2.1 доступен для бесплатного онлайн-тестирования. Модель можно скачать, но будьте осторожны: для её запуска требуется очень мощная видеокарта.
Olmo доступен для тестирования. Модели можно загрузить. Эти из них более удобны для потребителей, в зависимости от того, какую вы выберете.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Гамбит открытого исходного кода ИИ Америки: две лаборатории, один вопрос — может ли США конкурировать?
Источник: CryptoNewsNet Оригинальное название: Открытый ИИ-гамбит Америки: две лаборатории, один вопрос — может ли США конкурировать? Оригинальная ссылка: На этой неделе две американские лаборатории искусственного интеллекта выпустили модели с открытым исходным кодом, каждая из которых выбрала кардинально разные подходы к одной и той же проблеме: как конкурировать с доминированием Китая в общедоступных системах ИИ.
Deep Cogito выпустила Cogito v2.1, массивную модель с 671 миллиардами параметров, которую ее основатель, Дришан Арора, называет “лучшей открытой LLM от американской компании.”
Не так быстро, возразил Институт Аллена по искусственному интеллекту, который только что выпустил Olmo 3, позиционируя его как “лучшую полностью открытую базовую модель”. Olmo 3 обладает полной прозрачностью, включая свои тренировочные данные и код.
Иронично, что флагманская модель Deep Cognito построена на китайском основании. Арора признал, что Cogito v2.1 “отделяется от открытой лицензии модели базового Deepseek с ноября 2024 года.”
Это вызвало критику и дебаты о том, считается ли тонкая настройка китайской модели достижением американского ИИ или это просто доказывает, как далеко американские лаборатории отстали.
Тем не менее, преимущества эффективности, которые демонстрирует Cogito по сравнению с DeepSeek, реальны.
Компания Deep Cognito утверждает, что Cogito v2.1 производит цепочки рассуждений на 60% короче, чем DeepSeek R1, при этом поддерживая конкурентоспособную производительность.
Используя то, что Арора называет “Итеративной дистилляцией и усилением” — обучая модели развивать лучшее понимание через циклы самосовершенствования — стартап обучил свою модель всего за 75 дней на инфраструктуре от RunPod и Nebius.
Если эталоны верны, это будет самый мощный открытый LLM, в настоящее время поддерживаемый американской командой.
Почему это важно
На данный момент Китай задает темп в области открытого ИИ, и компании США все больше полагаются—тихо или открыто—на китайские базовые модели, чтобы оставаться конкурентоспособными.
Эта динамика рискованна. Если китайские лаборатории станут стандартной инфраструктурой для открытого ИИ по всему миру, стартапы США потеряют техническую независимость, переговорную силу и возможность формировать отраслевые стандарты.
Открытый ИИ определяет, кто контролирует сырые модели, от которых зависит каждый downstream продукт.
Прямо сейчас китайские открытые модели (DeepSeek, Qwen, Kimi, MiniMax) доминируют в глобальном использовании, потому что они дешевы, быстры, высокоэффективны и постоянно обновляются.
Многие стартапы в США уже строят на них, даже когда публично избегают этого признавать.
Это означает, что американские компании строят бизнес на основе иностранной интеллектуальной собственности, иностранных учебных программ и иностранных аппаратных оптимизаций. Стратегически это ставит Америку в такую же позицию, с которой она столкнулась когда-то в производстве полупроводников: все более зависимой от чей-то цепочки поставок.
Подход Deep Cogito, исходящий от форка DeepSeek, демонстрирует преимущества (быстрой итерации) и недостатки (зависимости).
Подход Института Аллена — создание Olmo 3 с полной прозрачностью — демонстрирует альтернативу: если США хотят открытого лидерства в области ИИ, им необходимо заново построить стек от данных до рецептов обучения и контрольных точек. Это трудоемкий и медленный процесс, но он сохраняет суверенитет над базовой технологией.
В теории, если вам уже понравился DeepSeek и вы используете его онлайн, Cogito в большинстве случаев даст вам лучшие ответы. Если вы используете его через API, вы будете вдвое более довольны, так как вы будете платить меньше денег за получение хороших ответов благодаря его повышенной эффективности.
Институт Аллена выбрал противоположный подход. Вся семья моделей Olmo 3 приходит с Dolma 3, обучающим набором данных из 5,9 триллионов токенов, созданным с нуля, плюс полный код, рецепты и контрольные точки из каждой стадии обучения.
Некоммерческая организация выпустила три модели-варианта — Base, Think и Instruct — с 7 миллиардами и 32 миллиардами параметров.
“Истинная открытость в ИИ заключается не только в доступе — это вопрос доверия, подотчетности и совместного прогресса,” — написало учреждение.
Olmo 3-Think 32B — это первая полностью открытая модель рассуждений такого масштаба, обученная примерно на одной шестой токенов по сравнению с аналогичными моделями, такими как Qwen 3, при этом демонстрируя конкурентоспособные результаты.
Deep Cognito привлек $13 миллионов долларов в виде начального финансирования, возглавляемого Benchmark в августе. Стартап планирует выпустить модели на передовом уровне с количеством параметров до 671 миллиарда, обученные на “значительно большем объеме вычислений с лучшими наборами данных.”
Тем временем Nvidia поддержала разработку Olmo 3, и вице-президент Кари Бриски назвала это необходимым для “разработчиков, чтобы масштабировать ИИ с помощью открытых моделей, созданных в США.”
Институт обучался на GPU-кластерах H100 Google Cloud, достигнув в 2,5 раза меньших вычислительных требований, чем у Meta's Llama 3.1 8B.
Cogito v2.1 доступен для бесплатного онлайн-тестирования. Модель можно скачать, но будьте осторожны: для её запуска требуется очень мощная видеокарта.
Olmo доступен для тестирования. Модели можно загрузить. Эти из них более удобны для потребителей, в зависимости от того, какую вы выберете.