A rivalidade entre Intel e Nvidia na inferência de IA intensifica-se: poderá a Crescent Island Xe3P transformar o panorama dos centros de dados?

Markets
Atualizado: 06/03/2026 09:08

À medida que a indústria da IA transfere o seu foco do treino de modelos para a inferência em larga escala, a estrutura de custos dos recursos computacionais está a sofrer uma transformação fundamental. Em junho de 2026, a Intel apresentou o seu acelerador de inferência de IA de próxima geração para centros de dados, "Crescent Island", durante a Computex 2026. Baseada na arquitetura Xe3P e equipada com memória LPDDR5X, esta solução assinala uma mudança estratégica clara do gigante tradicional dos semicondutores na infraestrutura de IA. Em vez de desafiar diretamente a posição dominante da Nvidia no mercado de treino, a Intel aposta no segmento da inferência com um posicionamento diferenciado: "baixo custo, desempenho suficiente".

Análise da Arquitetura do Produto: A Lógica Técnica por Detrás do Xe3P e do LPDDR5X

A característica mais distintiva do Crescent Island reside na sua arquitetura de memória. Ao contrário da maioria dos aceleradores de treino de IA atuais, que dependem de memória de elevada largura de banda, a Intel optou pelo LPDDR5X — uma tecnologia de memória madura e de baixo consumo energético, amplamente utilizada em dispositivos móveis e eletrónica de consumo de grande escala.

Em termos de especificações, o design de referência inclui 160 GB de memória LPDDR5X, expansível até 480 GB através de parcerias com ODM. O consumo energético da placa é de 350 W, com refrigeração a ar, e suporta toda a gama de tipos de dados, desde FP4/MXFP4 nativos até FP64. Segundo cálculos da TechTimes, com base numa interface de memória de 640 bits e LPDDR5X a 10,7 Gbps, a largura de banda da memória ronda os 684 GB/s, em comparação com os cerca de 4,8 TB/s da Nvidia H200 com HBM3e. Esta diferença de largura de banda é significativa para tarefas de treino, mas, para operações de inferência em larga escala e alta concorrência com grandes modelos de linguagem, o benefício marginal da largura de banda é inferior ao valor marginal da eficiência energética e do custo. A Intel sublinha que este chip foi "desenhado para IA Agentic", sendo a métrica central o "Token/Watt" — ou seja, maximizar o número de pedidos de inferência processados por unidade de energia.

No que respeita à compatibilidade de implementação, o perfil de baixo consumo do LPDDR5X permite a solução de 350 W com refrigeração a ar. Isto significa que o Crescent Island não exige infraestruturas especializadas de refrigeração líquida e pode ser integrado diretamente em racks padrão e ambientes de centros de dados já existentes, reduzindo os custos de adaptação pós-compra.

Contexto de Mercado: Expansão e Diferenciação Estrutural no Mercado de Inferência de IA

Para compreender o posicionamento estratégico do Crescent Island, é essencial calibrar, em primeiro lugar, a dimensão e a lógica de crescimento do mercado atual de inferência de IA.

Existem várias formas de definir o mercado de inferência de IA, pelo que as distinções são importantes. A definição restrita — mercado de chips de inferência de IA (apenas hardware IC, excluindo software e serviços auxiliares) — deverá crescer de cerca de 17 730 milhões $ em 2025 para 20 510 milhões $ em 2026, com uma taxa de crescimento anual composta (CAGR) de aproximadamente 15,6%. A definição mais abrangente — mercado de inferência de IA (incluindo hardware, software e serviços de plataforma) — situou-se em cerca de 103 730 milhões $ em 2025 e deverá atingir 117 800 milhões $ em 2026, com uma CAGR de cerca de 12,98%. Esta última reflete a escala global do investimento em infraestrutura e é o palco onde os fornecedores de centros de dados (CPU, GPU, redes, memória, stack de software) competem.

Do ponto de vista estrutural, as cargas de trabalho de inferência estão a aumentar rapidamente a sua quota no total do processamento de IA. Especialistas da plataforma Nebius referiram recentemente que a inferência já representa 90% a 95% da procura empresarial de IA. Cada vez mais empresas recorrem a modelos pré-treinados ou serviços API, em vez de treinarem modelos de base a partir do zero. Como resultado, a proposta de valor da infraestrutura de IA está a passar de "maximizar o desempenho de treino" para "otimizar os custos de inferência". O ritmo de crescimento mais acelerado das cargas de trabalho de inferência, em comparação com o treino, constitui o fundamento lógico para a entrada do Crescent Island no mercado.

A posição da Nvidia no treino de IA permanece incontestada. Análises do setor indicam que a quota de mercado global da Nvidia em aceleradores de IA (treino e inferência combinados) ultrapassa os 70%, e no segmento de treino de topo aproxima-se de um quase-monopólio, com 98%. No entanto, esta estrutura comporta riscos: à medida que a inferência se torna dominante, o "prémio de monopólio" do treino — atualmente a componente mais lucrativa das receitas da Nvidia — será diluído, sendo substituído por um mercado de inferência mais amplo, mas com margens inferiores. O Crescent Island pretende capitalizar esta transição.

Análise Competitiva: Estruturas de Custos Divergentes entre Intel e Nvidia

A concorrência entre o Crescent Island e os produtos da Nvidia traduz-se, essencialmente, num confronto direto entre duas curvas de custos fundamentalmente distintas para a mesma tarefa.

No que respeita à lista de materiais (BOM), dados de desmontagem da Silicon Analysts revelam que o custo total de fabrico da Nvidia H100 ronda os 3 320 $ (wafer lógico ~300 $, HBM3 ~1 350 $, embalagem CoWoS-S ~750 $, testes/montagem ~920 $). A H200, com capacidade HBM aumentada para 141 GB, eleva o custo de fabrico para cerca de 4 800 $. A B200 utiliza um design dual-die, reduzindo os custos do wafer lógico, mas aumentando os custos de memória e embalagem, totalizando cerca de 6 400 $. A parcela do HBM no BOM total subiu de cerca de 14% na A100 para 43% na H200, tornando-se a principal variável de custo.

No mercado de aluguer, o preço on-demand da H100 situa-se em cerca de 2,95 $/hora, a H200 em torno de 3,50 $/hora e a B200 varia entre 4,90 $ e 6,50 $/hora. Com contratos de 1 a 2 anos e uma compra mínima de 10 000 unidades, os preços descem significativamente: H100 para ~1,50 $/hora, H200 para ~2,20 $/hora e B200 para ~3,50 $/hora. Importa salientar que os preços de aluguer da H200 subiram após maio de 2026 — a plataforma Nebius aumentou o valor da H200 de 1,45 $ para 2,45 $/hora a partir de 1 de junho de 2026 — elevando ainda mais os custos operacionais da inferência.

O preço do Crescent Island ainda não foi anunciado, mas o custo por capacidade do LPDDR5X é significativamente inferior ao do HBM, o perfil de 350 W reduz as despesas com eletricidade e refrigeração, e a refrigeração a ar simplifica a infraestrutura dos centros de dados. Isto cria um espaço teórico para que o custo total de propriedade do Crescent Island seja substancialmente inferior ao dos produtos equivalentes da Nvidia. Kevork Kechichian, responsável pelo Data Center Group da Intel, afirmou ao Financial Times que o Crescent Island evitará o domínio da Nvidia no treino, focando-se em tarefas de inferência que processam pedidos de utilizadores, com o objetivo principal de reduzir os custos de hardware e refrigeração para os clientes de IA.

No que toca à entrega, a Intel planeia disponibilizar amostras aos clientes no segundo semestre de 2026 e iniciar envios limitados antes do final do ano. A validação de implementações em larga escala deverá estar concluída no início de 2027.

Perspetiva Estratégica: Desfasamentos de Oferta e Procura na Inferência e o Posicionamento da Intel

A contradição estrutural do mercado de inferência atual reside no facto de as GPU desenhadas para treino oferecerem largura de banda e capacidade de cálculo em excesso, frequentemente subutilizadas em cenários de inferência. As empresas que adquirem GPU topo de gama para responder a picos de procura de inferência enfrentam um desperdício persistente de capital "sobreprovisionado" durante a operação regular. O Crescent Island posiciona-se precisamente neste ponto de interseção — oferecendo "inferência suficiente" em vez de "cálculo excessivo de treino", alcançando assim menores custos iniciais e operacionais.

Esta abordagem é logicamente semelhante à de novos fornecedores focados em inferência, como a Groq. No entanto, a Intel dispõe de capacidades de integração muito mais abrangentes ao nível do sistema. Na Computex 2026, a Intel lançou também soluções de infraestrutura de IA à escala de rack, construindo arquiteturas heterogéneas de inferência com processadores Xeon 6+ e a RDU (Reconfigurable Dataflow Unit) da SambaNova, cobrindo toda a cadeia de processamento, do chip ao rack. A lógica competitiva subjacente é que, à medida que os estrangulamentos das cargas de trabalho de IA transitam do puro cálculo para a movimentação de dados, orquestração de tarefas e coordenação de sistemas, o valor das CPU como plano de controlo generalista é amplificado — uma área em que a Intel possui reservas profundas de infraestrutura.

No ecossistema de software, o CUDA da Nvidia construiu uma lealdade excecional dos programadores ao longo de mais de 20 anos, com mais de 5 milhões de programadores a desenvolver aplicações de IA e mais de 90% das tarefas de treino de IA a correr sobre CUDA. O framework unificado oneAPI da Intel, na versão 2026.0, fundiu o Base Toolkit e o HPC Toolkit num único pacote, oferecendo um modelo de programação transversal para CPU, GPU, FPGA e aceleradores, otimizado para os mais recentes processadores Xeon e GPU Arc, tanto para treino como para inferência. No entanto, a migração de CUDA para oneAPI continua a ser dispendiosa — as ferramentas automáticas atuais de conversão de CUDA para DPC++ conseguem converter cerca de 90% a 95% do código, mas o restante exige reescrita e otimização manuais. Este custo de fricção terá um impacto significativo na velocidade e abrangência da adoção do Crescent Island em cenários de inferência.

Riscos e Variáveis

Os principais fatores de risco a considerar incluem:

Em primeiro lugar, os dados de desempenho não foram divulgados. À data do lançamento na Computex de junho de 2026, a Intel ainda não forneceu benchmarks específicos de cálculo para o Crescent Island. O desfasamento entre o desempenho e as expectativas do mercado será um fator decisivo na sua aceitação.

Em segundo lugar, volatilidade na cadeia de abastecimento de HBM. A escolha da Intel pelo LPDDR5X pressupõe implicitamente que a capacidade de HBM continuará limitada durante vários anos. Prevê-se que os preços do HBM3e aumentem entre 15% e 20% nos próximos trimestres, a capacidade de embalagem CoWoS permanece 40% a 50% aquém da procura e os prazos de entrega das encomendas estendem-se por 40 a 52 semanas. Se a cadeia de abastecimento de HBM aliviar significativamente entre 2027 e 2028, o prémio dos produtos HBM diminuirá e a vantagem marginal de custo do LPDDR5X será reduzida.

Em terceiro lugar, custos de migração do ecossistema. A fortaleza do ecossistema CUDA constitui uma barreira competitiva que vai além da lógica técnica. Para grandes empresas com bases de código substanciais de treino e inferência, os custos de migração não são apenas técnicos — envolvem inércia organizacional, reservas de talento e avaliação de riscos. Esta barreira não técnica é, por vezes, mais difícil de ultrapassar do que as próprias especificações técnicas.

Em quarto lugar, ciclos macroeconómicos de procura. O sucesso do Crescent Island dependerá, em última análise, da adoção por operadores de centros de dados de hiperescala. Em junho de 2026, a validação da implementação junto dos clientes da Intel ainda se encontra numa fase inicial. O chip Maia 2 AI da Microsoft utiliza o processo 18A da Intel, mas o Maia 2 é um ASIC de inferência personalizado, distinto do posicionamento do Crescent Island. A Google Cloud e a AWS mantêm uma colaboração profunda com os processadores Intel Xeon ao nível da CPU, mas permanece incerto se irão utilizar o Crescent Island para aceleração de inferência de IA.

Conclusão: O Desafio Verificável da Inferência de Baixo Custo

A lógica técnica do Crescent Island assenta numa base clara de entrada no mercado: as cargas de trabalho de inferência estão a crescer rapidamente, a oferta de HBM mantém-se limitada e o custo marginal de expansão dos centros de dados continua a aumentar. Contudo, uma direção sólida não garante resultados.

O que o mercado exige não é um caso teórico sobre "porque poderá o Crescent Island ter sucesso", mas sim dados verificáveis — incluindo métricas publicadas de cálculo TOPS ou TFLOPS, valores específicos de Token/Watt e feedback real de implementações junto dos clientes da Intel. A entrega e validação destes dados decorrerão à medida que as amostras cheguem no segundo semestre de 2026 e as implementações reais arranquem em 2027.

Para o mercado de inferência de IA, a importância do Crescent Island pode não residir numa alteração imediata da quota de mercado da Nvidia, mas sim em oferecer uma alternativa clara: à medida que a inferência se torna o principal cenário da infraestrutura de IA, "suficiente e acessível" poderá afirmar-se como uma opção de negócio viável a par de "mais potente e mais caro". Se esta hipótese se confirmará, será o próprio mercado a responder nos próximos 12 a 18 meses.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Curta o Conteúdo