HBM vs. DRAM: ¿Por qué los grandes modelos de IA dependen de ellas?

Mercados
Actualizado: 30/06/2026 04:10

30 de junio de 2026: Bitcoin cotiza en un rango estrecho cerca de 60 000 $, mientras que Ethereum se mantiene estable en torno a 1 600 $. Tras una corrección sostenida a lo largo de junio, los bajistas a corto plazo siguen dominando el mercado cripto. Sin embargo, mientras los criptoactivos entran en una "época muerta", otro sector está experimentando un crecimiento explosivo sin precedentes: la memoria de semiconductores.

El informe de primavera de 2026 de la World Semiconductor Trade Statistics (WSTS) elevó drásticamente las expectativas de crecimiento del sector: el mercado mundial de semiconductores podría superar los 1,51 billones de dólares en 2026, un 90 % más que el año anterior. Se prevé que los chips de memoria crezcan un 250 %, hasta alcanzar los 800 000 millones de dólares. Por primera vez, la producción de memoria superará a la de fundición de obleas, convirtiéndose en el principal motor de crecimiento de los semiconductores.

En el centro de esta revolución de la memoria se encuentra la HBM (High Bandwidth Memory o memoria de alto ancho de banda). Se espera que el mercado de HBM crezca un 58 % en 2026, alcanzando los 54 600 millones de dólares y representando cerca del 40 % del mercado de DRAM. ¿Qué diferencia a la HBM de la DRAM? ¿Por qué los modelos de IA dependen tanto de la HBM?

HBM vs. DRAM: Mismo origen, caminos diferentes

La HBM y la DRAM comparten el mismo medio de almacenamiento fundamental: la memoria dinámica de acceso aleatorio. Sin embargo, sus enfoques tecnológicos, diseños arquitectónicos y escenarios de aplicación han divergido de forma radical.

La DRAM tradicional sigue una estrategia de "expansión horizontal". Representada por DDR4 y DDR5, la DRAM convencional utiliza una arquitectura planar. Las mejoras de rendimiento provienen de la actualización de procesos (por ejemplo, pasar de 20 nm a 2 nm) y de optimizaciones arquitectónicas (como el mayor ancho de prefetch en DDR5). La lógica central es reducir continuamente el tamaño de los transistores y aumentar la frecuencia en un plano bidimensional. Pero este enfoque está cerca de sus límites físicos: los procesos por debajo de 2 nm enfrentan desafíos como el efecto túnel cuántico, y la miniaturización por sí sola ya no puede satisfacer la demanda exponencial de ancho de banda de memoria de la IA.

La HBM adopta un enfoque de "apilamiento vertical" para superar estos límites. La HBM utiliza una estructura 3D, empleando la tecnología Through-Silicon Via (TSV) para apilar verticalmente varios chips DRAM, formando una estructura similar a un cubo. Se perforan miles de pequeños orificios en los chips DRAM, conectando las capas mediante electrodos verticales. En la base se encuentra la unidad de control lógico DRAM, que gestiona la temporización y el control de la pila. Este diseño en "torre" permite a la HBM alcanzar una densidad de ancho de banda extremadamente alta en un espacio físico compacto.

La brecha generacional entre ambas es evidente en los principales indicadores de rendimiento:

Ancho de banda: La DRAM tradicional (por ejemplo, DDR5) ofrece entre 50 y 100 GB/s, mientras que una sola pila de HBM3E puede alcanzar 1,2 TB/s. Se espera que la próxima generación, HBM4, supere los 2,0 TB/s. La HBM proporciona más de 10 veces el ancho de banda de la DRAM convencional.

Eficiencia energética: La HBM puede operar por debajo de 5 pJ/bit, frente a los 10–15 pJ/bit de la DRAM tradicional. En centros de datos que ejecutan miles de GPU simultáneamente, esta diferencia se traduce en decenas de millones de dólares en costes eléctricos anuales.

Latencia: La DRAM planar mantiene una latencia en torno a 10 ns, mientras que el aumento de capas en HBM eleva la latencia a aproximadamente 100 ns. Sin embargo, en el entrenamiento e inferencia de IA, el rendimiento global es mucho más relevante que la latencia de acceso individual: la capacidad de gestionar rápidamente enormes volúmenes de parámetros es más crítica que la velocidad de acceso puntual.

Coste: La producción de HBM es mucho más costosa que la de DRAM tradicional. Aunque el coste por Gb de HBM4 es un 30 % inferior al de HBM3, sigue siendo de 3 a 5 veces superior al de DDR5 de igual capacidad. La HBM consume de 4 a 5 veces el volumen de oblea de la DDR5, y la tecnología TSV reduce significativamente la densidad de bits frente a la DDR. Por ejemplo, la DDR4 D1z de SK Hynix tiene una densidad de bits de 0,296 Gb/mm², un 85 % más que su HBM3 (0,16 Gb/mm²). El área adicional requerida para los TSV y el apilado/encapsulado complejo es la principal razón del alto coste de la HBM.

En resumen: la DRAM tradicional busca la "suficiencia asequible", mientras que la HBM persigue el "ancho de banda extremo"; es una batalla entre el enfoque tecnológico basado en el coste y el basado en el ancho de banda.

La crisis del muro de memoria: por qué los modelos de IA necesitan HBM

La dependencia de la IA de la HBM surge de un cuello de botella fundamental conocido como el "Memory Wall" o muro de memoria.

En los últimos 20 años, la potencia de cálculo de las GPU ha aumentado 60 000 veces, mientras que el ancho de banda de la DRAM solo se ha multiplicado por 100. La velocidad de procesamiento ha superado con creces la velocidad de suministro de datos: es como un coche de carreras sobrealimentado con una línea de combustible que sigue en especificaciones de hace dos décadas. La GPU es el motor; la HBM es el sistema de inyección de combustible. Si el suministro de combustible no acompaña, incluso el motor más potente solo hará girar las ruedas en vacío.

Los grandes modelos de lenguaje amplifican esta contradicción. Los modelos de IA no se limitan a recuperar información estática: mantienen de forma continua un "estado de trabajo" que incluye ventanas de contexto, caché KV, activaciones intermedias y decisiones de enrutamiento. Todo esto debe accederse en tiempo real con latencia ultrabaja y estar siempre disponible. Durante el procesamiento completo de secuencias de tokens, el modelo accede y actualiza constantemente el contexto: incluso un leve aumento en la latencia de memoria puede reducir el rendimiento, retrasar respuestas o forzar a los operadores a añadir hardware.

Fase de entrenamiento: Los modelos con billones de parámetros iteran repetidamente sobre conjuntos de datos masivos, con cada pasada hacia adelante y hacia atrás implicando enormes lecturas y actualizaciones de parámetros. El ancho de banda de TB/s de la HBM es decisivo para acortar los tiempos de entrenamiento.

Fase de inferencia: A medida que proliferan los modelos multimodales y los agentes de IA, las llamadas a tokens se disparan. El cuello de botella en la inferencia no es "qué tan rápido calculas", sino "qué tan rápido alimentas los datos". Al final del camino del ancho de banda está la HBM.

A nivel de sistema, la IA se apoya en una arquitectura de memoria en capas: la HBM suministra datos a los aceleradores, la DRAM almacena el estado en tiempo real y la memoria de conversación, y los SSD basados en NAND proporcionan almacenamiento persistente para conjuntos de datos, embeddings, índices de recuperación, logs y checkpoints. La HBM está más cerca del núcleo de cómputo, gestionando las tareas de suministro de datos más urgentes y de mayor frecuencia, un papel que ningún otro medio de almacenamiento puede reemplazar.

Por eso todos los aceleradores líderes de IA para entrenamiento e inferencia generativa utilizan HBM. La HBM no es un "accesorio opcional" para la IA: es el "tanque de oxígeno" que determina la velocidad a la que puede avanzar la IA.

Desequilibrio entre oferta y demanda: años de escasez estructural

La demanda de HBM es rígida, pero la oferta está "bloqueada".

Lado de la demanda: El gasto global en infraestructura de IA alcanzará los 450 000 millones de dólares en 2026, con la potencia de computación para inferencia superando el 70 % por primera vez, lo que impulsa una fuerte demanda de GPU, HBM y chips de red de alta velocidad. El crecimiento de la demanda de HBM en 2026 se debe principalmente a las actualizaciones de capacidad de los ASIC de IA, con la capacidad de HBM por chip de IA pasando de 96 GB/192 GB a 216 GB/288 GB. La plataforma Rubin de NVIDIA mantiene la capacidad de HBM por GPU en niveles previos, pero el aumento de envíos eleva la demanda total. Se espera que los nueve mayores proveedores de nube del mundo gasten unos 830 000 millones de dólares en 2026, un 79 % más que el año anterior.

Lado de la oferta: A pesar de que Samsung, SK Hynix y Micron destinan el 70 % de la nueva capacidad (o capacidad ajustable) a HBM, la brecha de suministro de HBM sigue en el 50–60 %. Para el primer trimestre de 2026, toda la capacidad de HBM de los tres grandes ya está vendida. SemiAnalysis informa que la oferta de DRAM en 2026 será un 7 % inferior a la demanda, la de HBM un 6 % inferior, y la brecha se ampliará hasta el 9 % en 2027.

Lo crucial es que la oferta es rígida. Incluso si los tres principales fabricantes deciden expandirse ahora, las limitaciones físicas como los procesos TSV, los rendimientos de encapsulado avanzado y los plazos de entrega de equipos implican que la nueva capacidad no estará disponible antes de 2028–2029. Los bancos de inversión internacionales coinciden en que la escasez estructural de HBM durará al menos hasta 2028. Jensen Huang, CEO de NVIDIA, es aún más directo: la escasez global de HBM "no es una fluctuación coyuntural del mercado, sino un dilema estructural de la industria que persistirá durante años".

Precios: Samsung y SK Hynix han subido los precios de suministro de HBM3E para 2026 casi un 20 %. Se espera que los primeros contratos de HBM4 de 12 capas tengan una prima de más del 10 % respecto a los contratos de HBM3E de 12 capas de 2025.

Panorama de mercado: ¿quién lidera la revolución de la memoria?

El mercado de HBM está altamente concentrado. Los analistas prevén que SK Hynix tendrá en 2026 cerca del 52 % de la cuota de mercado por envíos, Samsung alrededor del 39 %, Micron cerca del 8 %, y los actores chinos continentales mantendrán una cuota mínima. En ventas, los ingresos de HBM de SK Hynix podrían alcanzar los 5 950 millones de dólares en 2026, consolidando su liderazgo mundial.

En el primer trimestre de 2026, la cuota de mercado global de HBM de SK Hynix ronda el 51,4 %. TrendForce prevé que su cuota anual de mercado de HBM se mantenga cerca del 50 %; Counterpoint predice que su cuota en HBM4 alcanzará el 54 %.

El margen bruto de los tres grandes fabricantes ha superado el 70 % e incluso el 80 %. La distribución de beneficios de la HBM forma una "pirámide": cuanto más cerca del núcleo técnico y del cuello de botella, mayor es la participación.

Mientras tanto, surge una tendencia interesante: la rentabilidad de la DRAM de propósito general está superando estructuralmente a la de la HBM. Para el primer trimestre de 2026, la diferencia en el margen operativo entre la DRAM general y la HBM supera los 15 puntos porcentuales. Las estimaciones de mercado muestran que destinar capacidad a DRAM general genera más del doble de ingresos por oblea que la HBM, con casi el triple de margen bruto. Por eso SK Hynix está considerando reasignar algunos recursos a la DRAM general, lo que irónicamente confirma que todo el mercado de memoria atraviesa un auge generalizado.

Perspectiva de inversión: oportunidades en el superciclo de la HBM

La escasez estructural de HBM y el aumento de precios ofrecen a los inversores una lógica sectorial clara.

Los fabricantes de memoria son los principales beneficiarios. SK Hynix (KRX), Samsung Electronics (KRX) y Micron (NASDAQ) aprovechan su dominio técnico y capacidad limitada para captar la mayor parte de los beneficios extraordinarios del sector. Morgan Stanley, que prevé un aumento del 62 % en el precio medio de la DRAM para 2026, ha elevado las previsiones de beneficios para los fabricantes de memoria en un 56–63 %.

Los actores de la cadena de suministro aguas arriba también se benefician. La expansión a gran escala de los líderes en memoria impulsa directamente la demanda de equipos de grabado, deposición de películas finas, test y otros equipos semiconductores, transmitiendo la bonanza desde el upstream al midstream. Las necesidades avanzadas de encapsulado de la HBM también están acelerando la industrialización de tecnologías de encapsulado 2,5D como CoWoS.

Los fabricantes de chips de IA son los impulsores finales de la demanda de HBM. Empresas líderes en chips de IA como NVIDIA (NASDAQ) y Broadcom (NASDAQ) están ampliando la adquisición de HBM. La GPU Rubin Ultra de NVIDIA contará con hasta 1 TB de HBM por chip.

Gate Stock Trading: acceso integral a la inversión global en memoria e IA

Para los inversores que buscan participar en este superciclo de la memoria, Gate Stock ofrece una vía de acceso conveniente.

Gate Stock dispone ahora de un sistema de trading 24/7 que cubre los mercados de EE. UU., Hong Kong y Corea, con soporte para más de 10 000 acciones y ETF estadounidenses, más de 1 500 acciones de Hong Kong y 1 000 acciones coreanas, abarcando un total de más de 12 500 activos entre acciones y ETF a nivel mundial. Entre los valores disponibles figuran líderes globales como Apple, NVIDIA, Microsoft, Tencent Holdings, Xiaomi Group, Samsung Electronics y SK Hynix.

Los usuarios pueden invertir en acciones globales a través de la cuenta unificada de Gate utilizando USDT, con trading de fracciones desde tan solo 0,01 acciones, y disfrutar del reparto de dividendos. La plataforma también admite acciones corporativas como splits y consolidaciones, con cobertura total tanto en la app como en la web.

Gate Stock ha superado el trading tradicional de preapertura, horario regular y after hours para ofrecer operaciones nocturnas y de fin de semana, rompiendo las restricciones horarias convencionales del mercado de valores. Pronto llegarán los servicios de transferencia entre brokers, ampliando aún más la flexibilidad y comodidad en la gestión de activos bursátiles.

Método de trading: Tras fondear una cuenta unificada en la plataforma Gate, los usuarios pueden seleccionar las acciones objetivo en el módulo de trading bursátil y comprarlas o venderlas denominadas en USDT. La plataforma ofrece cotizaciones en tiempo real, herramientas de análisis técnico y tipos de órdenes (mercado, límite, etc.), con una experiencia coherente con el trading de criptoactivos.

Conclusión

La diferencia fundamental entre HBM y DRAM radica en el enfoque tecnológico de "ancho de banda primero" frente a "coste primero". A medida que la potencia de cómputo de la IA sigue creciendo, la tecnología de apilamiento 3D y TSV de la HBM ha derribado el "muro de memoria", convirtiéndose en un componente central e insustituible para el entrenamiento e inferencia de grandes modelos.

En 2026, el mercado mundial de semiconductores superará los 1,51 billones de dólares, los chips de memoria crecerán un 250 % y el mercado de HBM aumentará un 58 % hasta los 54 600 millones de dólares. La brecha de suministro alcanza el 50–60 %, y toda la capacidad de los tres grandes fabricantes está vendida. No se trata de una fluctuación cíclica típica, sino de una transformación estructural impulsada por la inversión de capital a largo plazo en infraestructura de IA.

Para los inversores, fabricantes de memoria, proveedores de equipos/materiales y fabricantes de chips de IA, todos cuentan con una lógica sectorial clara que los respalda. El servicio de trading 24/7 de Gate Stock para EE. UU., Hong Kong y Corea ofrece a los inversores globales una herramienta flexible y eficiente para participar en este superciclo de la memoria. En el actual clima de miedo extremo en el mercado (Fear Index 14–16), la desconexión entre los fundamentales del sector y el sentimiento de mercado suele generar las oportunidades estructurales más atractivas.

Preguntas frecuentes

P1: ¿Cuál es la diferencia principal entre HBM y DRAM?

La principal diferencia es la arquitectura. La DRAM tradicional utiliza un diseño planar, mejorando el rendimiento mediante actualizaciones de proceso. La HBM emplea apilamiento 3D, usando TSV para apilar verticalmente varios chips DRAM y lograr rutas de datos ultraanchas. HBM3E ofrece hasta 1,2 TB/s de ancho de banda—más de 10 veces el de DDR5—pero cuesta de 3 a 5 veces más para la misma capacidad.

P2: ¿Por qué los modelos de IA necesitan HBM?

El entrenamiento e inferencia de grandes modelos requieren lecturas y escrituras de parámetros masivos a alta velocidad. El crecimiento del ancho de banda de la DRAM ha quedado muy rezagado respecto a la potencia de cálculo (60 000x frente a 100x en 20 años), creando un cuello de botella conocido como "muro de memoria". El ancho de banda de TB/s de la HBM alimenta continuamente las GPU con datos, evitando ciclos de cómputo inactivos. Todos los aceleradores líderes de IA utilizan HBM.

P3: ¿Quiénes son los principales actores del mercado de HBM?

El mercado de HBM está altamente concentrado. Se espera que SK Hynix tenga cerca del 52 % de la cuota de envíos en 2026, Samsung alrededor del 39 % y Micron cerca del 8 %. SK Hynix lidera en ventas, con ingresos por HBM proyectados en 5 950 millones de dólares en 2026. Toda la capacidad de HBM de los tres grandes está vendida, y algunos clientes aseguran suministro hasta 2028.

P4: ¿Cuánto tiempo durará la escasez de HBM?

Los bancos de inversión internacionales consideran que la escasez de HBM persistirá al menos hasta 2028. La demanda está impulsada por la inversión en infraestructura de IA, mientras que la oferta está limitada por los procesos TSV, rendimientos de encapsulado y plazos de entrega de equipos. Incluso si la expansión comienza ahora, la nueva capacidad no estará disponible hasta 2028–2029. Jensen Huang califica esto como un "dilema estructural de la industria a varios años".

P5: ¿Cómo puedo invertir en acciones relacionadas con HBM en Gate?

Gate Stock ofrece trading 24/7 para acciones de EE. UU., Hong Kong y Corea, cubriendo más de 12 500 acciones y ETF. Los usuarios pueden invertir globalmente a través de una cuenta unificada usando USDT, desde 0,01 acciones. Entre los valores relacionados con HBM figuran los fabricantes de memoria SK Hynix (KRX), Samsung Electronics (KRX), Micron (NASDAQ) y fabricantes de chips de IA como NVIDIA (NASDAQ).

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Dale "Me gusta" al contenido