Google Ironwood TPU: 10x de desempenho + quatro parceiros contra a Nvidia

ChainNewsAbmedia

Com base em uma reportagem aprofundada da Bloomberg e em um anúncio oficial do Google, o Google, em 22 de abril, expandiu oficialmente sua linha de chips de IA desenvolvidos internamente: a TPU Ironwood (7ª geração), dedicada a inferência, passou a ser fornecida em caráter integral no Google Cloud e, simultaneamente, lançou parcerias de design de próxima geração com quatro empresas — Broadcom, MediaTek, Marvell e Intel — com o objetivo de, com uma cadeia de suprimentos de chips customizados, desafiar a posição dominante da Nvidia no mercado de capacidade de IA.

Ironwood: TPU de 7ª geração, primeira feita especificamente para inferência

A Ironwood é o produto de 7ª geração da série de TPUs da Google e o primeiro chip dedicado a inferência no âmbito da estratégia de “divisão entre treinamento e inferência”. As especificações divulgadas pelo Google incluem: desempenho de pico por chip de 10 vezes o da TPU v5p, 192GB de memória HBM3E, largura de banda de memória de 7,2 TB/s, capacidade de um único superpod de escalar até 9.216 unidades de Ironwood resfriadas a líquido, com volume de computação FP8 total de 42,5 exaflops.

O Google afirma oficialmente que a Ironwood já está “totalmente disponível para clientes do Google Cloud usarem”, e que a remessa deste ano deve atingir o nível de “1 milhão de unidades”. A Anthropic se comprometeu a adotar até 1 milhão de TPUs Ironwood; a Meta, por sua vez, assinou um “contrato plurianual de vários bilhões de dólares” para usar TPUs via Google Cloud.

Divisão entre as quatro parceiras: treinamento com a Broadcom, inferência com a MediaTek

A cadeia de suprimentos de chips de próxima geração do Google tem a seguinte divisão clara:

Parceira Código Papel Destaque Broadcom Sunfish Treinamento dedicado Mantém a relação existente de colaboração com TPUs e lidera nós de grande escala de treinamento MediaTek (聯發科) Zebrafish Inferência dedicada Alega ser 20–30% mais barato em custo do que a solução da Broadcom Marvell Em negociações Unidade de Processamento de Memória (MPU) + TPU de inferência adicional, para otimizações em HBM e inference Intel Não divulgado Participação em design Fortalecer a diversificação da cadeia de suprimentos

Este é o primeiro modelo visto na indústria de IA em que “quatro parceiras em paralelo” e “divisão clara entre treinamento e inferência”. Por meio da dispersão do risco de IP e de negociações competitivas, a Google evita a dependência estrutural de um único fornecedor como a Nvidia. O roadmap se estende até o fim de 2027 na TPU v8, a ser produzida no processo de 2nm da TSMC.

Significado da estratégia: desafiar a Nvidia não com um único chip, mas com a cadeia de suprimentos

Nos últimos três anos, o mercado de chips de IA foi quase monopolizado pela Nvidia, com uma dupla barreira de proteção: o ecossistema de software CUDA e os chips H100/GB200. A estratégia da Ironwood da Google e a dos quatro parceiros não tem como alvo “superar em especificações pontuais”, e sim replicar a lógica que a Nvidia estabeleceu na indústria: “plataforma padronizada + compras de vários clientes” — para que as TPUs não sejam apenas para uso interno da Google, mas uma opção de capacidade computacional comercial que pode ser compartilhada por grandes empresas de IA como Anthropic e Meta.

O significado do compromisso da Anthropic com 1 milhão de TPUs é especialmente crucial: é a maior promessa de capacidade computacional por uma única empresa de IA fora da Nvidia. Isso se complementa com os compromissos de 5GW/US$ 10 bilhões da Anthropic, anunciados em 4/20, e da Amazon — de um lado, atrelando-se ao AWS Trainium; de outro, atrelando-se ao Google TPU. Com a estratégia de “dois chips customizados”, a Anthropic reduz a dependência da Nvidia. A Meta, por sua vez, foi a primeira a tornar público que incorporaria TPUs em suas próprias cargas de trabalho de treinamento/inferência de IA, criando outro sinal.

Reação do mercado e ligação com a indústria

A MediaTek já era vista antes desta revelação como uma “beneficiária de chips customizados da Google”, e a exposição do código Zebrafish foi a primeira vez em que a MediaTek foi listada diretamente como parceira de design de chips de inferência da Google. Isso amplia a narrativa de “aliança de chips não-Nvidia”, envolvendo recentemente a linha AMD × GlobalFoundries de silício-fotônica e Marvell × Google MPU.

A Nvidia, no mesmo período, ainda tem suporte de GB200 e do próximo platform Rubin, mas a composição de capacidade computacional do lado dos clientes está saindo de “somente Nvidia” para a via tripla “Nvidia + TPU + AWS Trainium”. Isso também significa que a capacidade da TSMC em 2nm terá clientes — Google, Nvidia, Apple e Amazon — na fila, elevando continuamente o poder de negociação nas negociações de fundição.

Este artigo “Google Ironwood TPU: 10x de desempenho + quatro parceiros contra a Nvidia” foi publicado pela primeira vez em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Hoskinson discute o papel do Midnight no ecossistema da Cardano no The Breakdown

Charles Hoskinson, fundador da Cardano e cofundador da Ethereum, apareceu como convidado no episódio 701 do podcast "The Breakdown", apresentado por David Gokhshtein, para discutir o projeto Midnight, os desafios de experiência do usuário no cripto e sua visão para o futuro da blockchain. Durante a entrevista, Hoskinson

CryptoFrontier5h atrás

A Berkshire Energy vê oportunidade de crescimento na demanda por energia impulsionada por IA

De acordo com Beating, na assembleia de acionistas da Berkshire, o CEO Abel destacou que a demanda de eletricidade impulsionada por IA está criando novas oportunidades de crescimento para o negócio de energia da empresa, com metade das suas concessionárias de energia já atendendo requisitos de energia relacionados a IA. Em Iowa, data centers agora contabilizam

GateNews8h atrás

Depoimentos na 1ª semana do processo de Musk vs. Altman: ele admite que a XAI está “destilando” a OpenAI, e alerta que a IA é como um Exterminador

馬斯克, na primeira semana de depoimento em um tribunal federal de Oakland, acusou Altman e Brockman de fraudar recursos iniciais de uma organização sem fins lucrativos, alertou sobre riscos catastróficos de fim do mundo com a IA e admitiu que parte do xAI foi “destilada” de modelos da OpenAI; ele declarou ter investido US$ 38 milhões e ter visto a OpenAI se transformar de uma entidade sem fins lucrativos em uma empresa avaliada em US$ 800 bilhões. O investimento da Microsoft em 2022 é visto como um ponto de virada na quebra de confiança. A OpenAI argumenta que Musk tentou aliciar pessoas e contesta com a alegação de motivações competitivas. Na segunda semana, novos depoentes incluem Russell e Brockman.

ChainNewsAbmedia10h atrás

A AI Finance ligada a Trump adquire a Block Street por US$ 43 milhões

De acordo com a Fortune, a AI Financial, uma empresa de criptomoedas ligada à família Trump e que antes se chamava Alt5 Sigma, adquiriu a Block Street, uma empresa de infraestrutura cripto, por US$ 43 milhões na semana passada. Matthew Morgan, assessor da AI Financial e CEO da Block Street, afirmou que a aquisição não foi um

GateNews10h atrás

Ações da Riot Disparam 8% Após Expandir A Acordo com a AMD para Data Center

As ações da mineradora de Bitcoin Riot subiram 8% após a expansão de seu acordo com a AMD para data centers. A parceria ampliada inclui melhores condições de financiamento, destacando a mudança estratégica da Riot, saindo da mineração de bitcoin em direção à operação de data centers de inteligência artificial. A medida sinaliza confiança crescente

GateNews13h atrás

Minnesota proíbe ferramentas de IA para imagens íntimas não consensuais e impõe multas de até $500K

De acordo com a Decrypt, a legislatura de Minnesota aprovou, em 2 de maio, um projeto de lei que proíbe sites e aplicativos de fornecerem ferramentas de IA que gerem imagens íntimas não consensuais de indivíduos identificáveis. A lei impede as plataformas de permitirem que usuários acessem ou usem essas ferramentas de “deepfake” e proíbe

GateNews15h atrás
Comentário
0/400
Sem comentários