torygreen

vip
Idade 2.8 Ano
Nível máximo 0
Ainda sem conteúdo
Passei tempo com os números de inferência e uma estatística continua a voltar.
70% da inferência de IA em 2026 é executada na periferia. Não num centro de dados de hiperescala. Não na AWS. Em sistemas industriais, equipamento autónomo e dispositivos conectados onde o percurso de ida e volta para um servidor na nuvem não é um problema de latência, é um modo de falha.
O mercado de inferência de 106 mil milhões de dólares não está a crescer porque as pessoas estão a enviar mais consultas de "chat" para a sua IA. Está a crescer porque a IA está a ser incorporada em infraestruturas físicas que func
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Aparentemente, estar próximo da tecnologia física tem muito pouco a ver com adotá-la efetivamente.
A Califórnia é o lar de todos os laboratórios de IA de ponta que importam. Nova Iorque tem mais empresas Fortune 500 do que qualquer outro estado. Ambos foram ultrapassados pelo Colorado, que atingiu 23,2% de adoção empresarial de IA, enquanto Nova Iorque alcançou 13,8%.
O que o Colorado e o Arizona têm não é melhor infraestrutura ou talento. É uma disposição para avançar antes que a indústria sinalize que é seguro fazê-lo. Os estados mais próximos da tecnologia são frequentemente os mais lentos
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Em teoria, os custos da IA já deviam ter colapsado até agora.
A mesma tarefa de nível avançado que custava 30 dólares por milhão de tokens no lançamento do GPT-4 em 2023 custa hoje 1,25 dólares com o GPT-5. Uma redução de 96 vezes em três anos, entre modelos nomeados com preços publicados.
Por qualquer regra normal, as faturas de IA das empresas deviam estar a cair a pique. Em vez disso, os orçamentos médios de IA das Fortune-500 passaram de $7M em 2024 para $19M em 2026. Quase 3 vezes em dois ciclos orçamentais.
A razão: tokens baratos não são poupados, são armados. Um chatbot dispara token
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Algo mudou discretamente na computação de IA este ano, e isso altera o propósito real da construção da infraestrutura.
Em 2023, 2/3 da computação de IA foi para o treino, o trabalho efetivo de construir um modelo. A fatia mais pequena foi para a inferência, o trabalho de o executar depois de construído. Mas essa proporção começou discretamente a inverter-se.
A inferência representa agora 2/3 e continua a subir, segundo a Deloitte, e os chips construídos para a executar ultrapassaram $50B este ano.
A principal razão pela qual esta inversão é importante (e não apenas em termos percentuais): o t
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Há dois anos, um modelo aberto neste gráfico estaria perto do fundo. Os laboratórios fechados estavam gerações à frente, e esse fosso era a razão principal pela qual as pessoas alugavam modelos em vez de possuir um.
Agora, o GLM-5.2 está no 51.º lugar do índice @ArtificialAnlys.
Pesos abertos, laboratório chinês, quinto no geral. E tira a Fable da lista por não estar disponível, e o modelo de pesos abertos está muito mais perto do topo do que o ranking deixa transparecer.
O argumento para os fechados sempre foi a liderança. Pagar a API, aceitar os termos, construir em algo que não controlas, p
GLM2,70%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Eis a divisão do poder computacional de IA que poucos estão a interpretar corretamente.
O treino de fronteira está a concentrar-se mais a cada trimestre, milhares de GPUs que têm de estar num único local interligados. Mas o treino representa apenas 30% da procura em 2026. Os outros 70% são inferência, e executá-la num hyperscaler significa pagar por infraestrutura construída para a tarefa mais difícil para fazer a mais fácil.
Em redes distribuídas, essa mesma inferência pode ser 45-75% mais barata e, para quem dimensiona um orçamento de infraestrutura de IA, essa diferença é toda a história.
O
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Tenho pensado nas recentes notícias do GLM 5.2 e no ângulo dos pesos abertos que toda a gente está a seguir, mas estão a perder um ângulo completamente diferente aqui.
Toda a gente está focada no facto de um laboratório chinês ter atingido desempenho de ponta e ter aberto o código, mas a parte que vale a pena considerar é como.
A ZAI e o resto dos laboratórios chineses foram cortados da Nvidia no início de 2025, por isso, presumivelmente, não têm tido H100s nem H200s diretamente desde então.
Eles ultrapassaram $128B num modelo treinado provavelmente em silício chinês que fica a poucos p
GLM2,70%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
95% da capacidade de GPU empresarial está atualmente ociosa.
Esse número vem da Cast AI, que mediu 23.000 clusters de produção reais, não uma pesquisa genérica.
A utilização média era de 5% e isso está acontecendo no exato momento em que a Nvidia aumentou os preços do H200 em 15%, o primeiro aumento em 20 anos. O hardware que todos dizem ser escasso está na maior parte sem fazer nada.
Se você está tentando entender por que o cálculo parece impossível de obter, é por isso. Ninguém devolve uma alocação pela qual esperaram meses. Então a frota fica a 5%, cobrada por hora, e a escassez se al
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Algumas grandes movimentações na política de IA da UE estão supostamente chegando, mas aqui está a realidade da infraestrutura com a qual eles estão trabalhando.
> Investimento em infraestrutura de IA soberana da UE em 2026: 12,6 bilhões de dólares.
> Capex de hyperscalers nos EUA no mesmo ano: 725 bilhões de dólares.
A Europa gastou seis anos construindo 19 Fábricas de IA e 14 supercomputadores e só a Amazon gastará mais que todo esse esforço em duas semanas este ano.
A maioria das equipes de IA europeias não usam infraestrutura europeia. Elas alugam de Virgínia e Iowa e pagam um prêmio de co
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Não esperava que este número surgisse este ano.
O GitHub está a caminho de atingir 14 mil milhões de commits em 2026 até agora.
Isso é um aumento de 1 mil milhão em 2025.
Um aumento de 14 vezes num único ano e a maior parte dele não é escrita por humanos.
A carga tornou-se tão severa que a Microsoft, que possui e gere a segunda maior nuvem do mundo, teve que encaminhar o tráfego através da AWS para manter a plataforma online.
Nove incidentes de serviço só em maio.
A disponibilidade caiu para 88,4%.
Para todas as equipas de engenharia, fornecedores de infraestrutura e provedores d
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A receita da Nvidia é a prova de que a “computação agentic” não é uma teoria. Já está na demonstração de resultados.
$26B há quatro anos. 215,9 mil milhões de dólares no ano passado. Esse aumento de 8x aconteceu enquanto a maior parte da IA ainda estava sentada numa caixa de chat à espera de você fazer uma pergunta.
A parte importante não é apenas o crescimento. É que a Nvidia transformou a sua arquitetura na entrada não negociável para o roteiro de quase todos os outros. Laboratórios, nuvens, empresas. Logos diferentes na API, o mesmo silício por baixo. Quase cada dólar gasto em infraestr
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Não esperava que o número de cinco anos da Goldman fosse tão grande.
Cinco hyperscalers estão projetados para gastar 5,3 trilhões de dólares em infraestrutura de IA entre 2025 e 2030. Em 2022, gastaram $162B combinados.
Este ano, estão no caminho para atingir 725 bilhões de dólares. Até 2027, os analistas projetam 1 trilhão de dólares em um único ano.
Para quem constrói produtos ou infraestrutura de IA fora dessas cinco balanças, essa trajetória é o número mais importante nas suas premissas de planejamento.
A diferença entre o que eles podem implantar e o que todos os outros podem ace
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Todos previram que a IA assumiria primeiro o trabalho administrativo repetitivo. Os dados dizem algo diferente.
A tomada de decisão agora representa 28% da atividade de IA no local de trabalho.
O caso de uso número um não é automação. É julgamento.
As pessoas estão usando IA para analisar opções, pesar compensações e apoiar conclusões pelas quais são responsáveis, e essa mudança importa além da questão do mercado de trabalho.
Cargas de trabalho baseadas em julgamento funcionam continuamente, exigem mais contexto por sessão e não agrupam de forma eficiente.
Os requisitos de infraestru
Ver original
post-image
  • Recompensa
  • 1
  • Republicar
  • Partilhar
Millionairetasks:
Ótima oportunidade para todos estarem
Infraestrutura global de nuvem no primeiro trimestre de 2026. 129 bilhões de dólares em um único trimestre. Crescendo 35% ao ano.
O mercado está se expandindo rapidamente, mas a concentração não está mudando. AWS, Azure e Google Cloud mantiveram aproximadamente a mesma participação há dois anos que possuem hoje, mas a diferença absoluta entre eles e todos os outros é maior em termos de dólares do que nunca foi.
Essa é a parte que o gráfico de porcentagem não mostra. A fatia dos Outros não está crescendo para se tornar uma alternativa real. Ela permanece proporcionalmente igual enquanto os três
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A PJM gere a rede elétrica em 13 estados dos EUA e 65 milhões de pessoas. É o maior mercado de eletricidade por atacado competitivo do mundo.
O preço de liquidação do mercado de capacidade, a taxa que indica se o fornecimento futuro de energia pode atender à demanda, passou de $28,92 por MW em 2024 para $329,17 em 2026. Dois ciclos de leilão.
A demanda dos centros de dados foi identificada como o principal impulsionador. O leilão de 2027/2028 acabou sendo liquidado a $333,44, com a PJM atribuindo diretamente 5.100 MW do aumento de carga aos centros de dados.
Isso não é um choque de ofert
Ver original
post-image
  • Recompensa
  • 2
  • Republicar
  • Partilhar
DiveNate:
2026 GOGOGO 👊
Ver mais
Dois números deste gráfico.
Preço da API de IA: caiu 96% desde 2022.
Capex de hyperscaler: aumentou 12 vezes no mesmo período.
A maioria das pessoas vê o primeiro número e chama-lhe democratização, mas ninguém está a construir uma estratégia em torno do segundo.
Não é uma coincidência. É uma jogada de captura estrutural.
Cada startup de IA que celebra modelos baratos está a correr em computação que não possui, numa infraestrutura que não consegue replicar, controlada por três empresas.
IA soberana começa com infraestrutura soberana. Todo o resto é apenas uma dependência com preço m
Ver original
post-image
  • Recompensa
  • 1
  • Republicar
  • Partilhar
Yuhuan:
gsgsgshsokzkzkzkxhxj
A coisa que a sexta-feira revelou não é que os governos podem desligar modelos de IA.
É que toda a base de utilizadores global dos modelos mais capazes do mundo está por trás de uma única decisão operacional de uma única empresa respondendo a uma única diretiva. Sem redundância ou aviso.
Três das maiores empresas de IA controlam atualmente 88% do acesso à IA de fronteira e uma superfície de conformidade para tudo isso.
O que a sexta-feira tornou visível é que, quando o acesso ao cálculo e ao modelo está dentro de um punhado de empresas, toda a pilha herda o seu único ponto de falha. Isso
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Em 2024, o mapa de computação de IA tinha duas superpotências. EUA com 53,7 GW, China com 31,9 GW.
Em 2026, a China está com 2,5 GW.
Isso é uma demolição controlada da capacidade de infraestrutura de IA de uma nação através de política de exportação. Sem bombas, sem sanções, apenas regras de chips.
O que isso prova é que a computação agora é uma arma geopolítica. Qualquer país que não possui sua infraestrutura não quer descobrir como é estar na linha de recebedor dessa arma.
A questão não é se a computação descentralizada vence. É se ela chega antes da próxima decisão de política reest
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A maior oferta pública inicial de tecnologia dos anos 2000 foi a Visa, com 28 bilhões de dólares. A maior dos anos 2010 foi a Alibaba, com 168 bilhões de dólares. Aproximadamente 6x por década.
Agora, estenda a linha. OpenAI e Anthropic já estão em $1T antes mesmo de serem listadas.
Se somar os maiores estreias tecnológicas dos últimos 25 anos. Alibaba, Facebook, Uber, Rivian, Snowflake, Palantir, Cerebras, CoreWeave, todos eles. Você chega a aproximadamente 800 bilhões de dólares.
OpenAI + Anthropic sozinhas valem quase 2 trilhões de dólares. Ainda privadas. 2,5x maiores do que um quarto de s
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Durante a maior parte da história, o capital crescia através de máquinas.
Agora, cresce através da cognição.
Uma startup pode despertar com o equivalente a um milhão de analistas, investigadores, programadores e estrategistas a trabalhar em paralelo com um custo marginal quase zero.
A revolução da IA é diferente de qualquer revolução técnica anterior.
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
  • Fixado